QA Fest — конференция №1 по тестированию и автоматизации. Финальная программа уже на сайте >>
×Закрыть

Распознавание почерка врачей

Всем привет.

Хочу создать программу для offline-распознавания рукописного текста, заточенную под медицинские тексты. Сканируешь бумажку с рецептом — и видишь транскрипцию на экране.

Аналоги

В Google не смог найти существующий аналог. Может, плохо искал. Тогда подскажите, если знаете.
Есть программы, которые упоминают врачебный почерк. Но они работают с одним конкретным почерком, которому их сначало нужно обучить.

Как это возможно?

Я исхожу из того, что люди умеют распознавать такие тексты. Да, не все, но медработники и фармацевты могут. Значит, и машина сможет — нужно только понять, как её научить.

Как мы распознаём чужой почерк? Можно подумать, что мы разбиваем текст на слова, слова — на буквы, и распознаём каждую букву. Но это не работает. Например, часто нельзя отличить прописную букву «ш» от «т» или от сочетания «ли», пока не ясен контекст.

Представьте рукописный текст на незнакомом языке. Скорее всего, выглядит, как каракули. Даже зная алфавит, мы с трудом сможем распознать хотя бы половину букв. С печатным текстом не так: каждая буква чётко отделена от другой. Их можно легко распознать и собрать в слова.

Но в рукописном тексте гораздо большее значение имеет контекст и словарь. Узнавая всё больше слов какого-то языка, на определённом этапе мы сможем распознавать знакомые слова. Чем больше слов мы выучим, а также чем лучше будем понимать, какие слова лучше сочетаются по смыслу — тем проще будет распознать текст.

Взгляните на это слово: «б_л_н_ца».

С некоторыми усилиями можно распознать слово «больница», хотя часть букв вообще пропущена.

А если так? «Городская б_л_н_ца № 21»

Проще, не так ли? Естественные языки избыточны: можно убрать значительную часть букв, не потеряв смысла. А теперь представьте, что вы иностранец и не знаете русского языка. Вы не сможете прочесть это слово по буквам, ввести его в Google Translator и узнать значение. Для этого нужно сперва однозначно опознать каждую букву, что в условиях рукописного текста (или пропущенных букв) невозможно.

То же самое с почерком врачей. Для нас, простых смертных, это иностранный язык. Для медработников — вполне родной. Если мы посидим несколько недель за медицинскими справочниками и выучим достаточно терминов и названий медикаментов, мы тоже сможем распознавать этот язык в рукописном виде. А что может распознать человек, то может распознать и машина, иногда даже быстрее и точнее. Придётся использовать и распознавание отдельных символов, и контекстуальный анализ, и синтаксический, и много других техник — в общем, всё, что поможет уточнить информацию, запечатлённую в виде точек различной интенсивности на изображении.

Если это так просто — почему никто этого ещё не сделал?

Я не уверен. Может, всё-таки уже сделали (см. «Аналоги»)? А может, это никому не нужно. По крайней мере, не стоит таких усилий. Идеи, описанные мной выше, не новы. Их используют для распознавания печатных текстов. Но с рукописными всё сложнее.

Думаю, одна из причин в том, что нет достаточного количества тренировочных данных. Есть огромные базы данных изображений котиков, машин и проч., уже размеченных и готовых для обучения нейросетей. Есть куча изображений печатных текстов с транскрипциями. А вот рукописных текстов — мало. Я не нашёл базу данных с рукописными текстами и их транскрипциями — ни на английском, ни на русском, ни на украинском. Максимум, что удалось найти — маленькая база рукописных предложений на сайте elmiram.github.io. И уж тем более не найти нужного количества медицинских текстов.

А задача сложная: нужны тысячи и тысячи примеров для обучения. И если можно посадить кого-то распознавать обычные тексты, то для почерка врачей нужно нанять и посадить медицинских работников. В общем, сбор данных для такой программы будет сложнее, чем её проектирование. Можно даже создать большую открытую базу данных в помощь людям, специально для таких целей. Искать волонтёров, собирать изображения, переводить в печатный вид... Это тянет на большой отдельный проект, и если кого-то он интересует, можно отдельно обсудить и его.

Частично проблема данных решается с использованием трансферного обучения (en.wikipedia.org/wiki/Transfer_learning). Сначала обучаем сеть для полноценного распознавания обычных рукописных текстов, которых у нас всё-таки больше, чем врачебных. Затем сбрасываем веса последнего слоя, сохраняя все остальные, и обучаем её заново на меньшем количестве медицинских текстов. Идея в том, что на первом этапе сеть обучится общим принципам распознавания символов; научится определять границы и очертания; и на этой основе сможет «более осмысленно» воспринимать новые данные.

Можно пойти дальше и перед этапом рукописных текстов обучить сеть на огромном количестве обычных печатных текстов. Таким образом она получит достаточно информации о распознавании объектов и использует ограниченные рукописные примеры с максимальной пользой. Но я не уверен, что это сработает. Надо пробовать.

Ну и что?

Вот этот вопрос меня волнует больше всего. Звучит как прикольная идея, но будет ли это востребовано? Кому это нужно? Вы бы скачали такое приложение? А стали бы платить за него? А что насчёт более широкой задачи распознавания всяких рукописных текстов, не только медицинских?

Я хотел бы услышать ваше мнение о целесообразности всего этого, о способах реализации, об озвученных идеях. Может, не стоит и браться — тогда хорошо, что я ограничился текстом на форуме и не потратил на это месяцы жизни. Может, вы проникнетесь идеей и накидаете мне немного отсканированных медицинских рецептов или хотя бы пылящихся конспектов. А может, я найду людей, которые захотят вместе заняться разработкой. Было бы здорово!

UPD 25.09.2017

Вижу, мнений много. Только без реальных тренировочных данных это всё так и останется болтовнёй :)

Кто хочет поддержать, пожалуйста, присылайте сканы или фотографии в хорошем качестве медицинских текстов, которыми не жалко поделиться. Наверняка у каждого что-то завалялось. Над расшифровкой уже потом поработаем, может, наймём фармацевта из ближайшей аптеки.
Если же медицинских текстов нет, можно и обычные рукописные — какой-нибудь конспект из универа с минимумом рисунков/схем и максимумом текста. Тут фотография уже не пойдёт, нужен скан страницы или разворота тетради. Присылайте хоть что-нибудь — это лучше, чем ничего.

Пишите на email 3479900457@ukr.net

UPD 14.10.2017

Хочу подвести итоги по теме. Я услышал много разных мнений насчёт реализации и целесообразности: от «это невозможно ещё лет 100» и «никому это не надо, проще перейти на электронную систему» до «никого не слушай, я готов сотрудничать» и «интересно, я бы даже заплатил за такое приложение» (не все из них были озвучены именно здесь).

Чтобы не быть голословным, я провёл опрос в одной «заблокированной» социальной сети с простым вопросом: «Нужно ли вам приложение для распознавания почерка врачей?». Проголосовало 89 человек. Голоса разделились следующим образом:

— «Нет» — 16 чел. (18%)
— «Не знаю, можно попробовать» — 20 чел. (22,5%)
— «Да, если бесплатно» — 49 чел. (55%)
— «Да, и я готов(а) заплатить за него» — 4 чел. (4,5%)

Хотя голосов и мало, их разделение наметилось с самого начала опроса и почти не менялось всё время. Поскольку вопрос был не «считаете ли вы такое приложение полезным хоть кому-то», а «нужно ли оно вам» — выходит, идея полезная. Даже если бы только четверть была «за» — это уже приличная целевая аудитория. Здесь же более половины проголосовали «за» — а это весомый результат.

Интересно распределение голосов по странам. Из России проголосовало 25 человек, 13 из которых ответили «Нет» или «Не знаю», 10 — «Да, если бесплатно» (40%) и 2 — «Да, готов заплатить».
Из 49 украинцев 31 согласен за бесплатно (69%), 1 — готов заплатить и 17 — не знают или не хотят.
Это логично, ведь в России уже действует электронная система, а у нас — нет.

Хоть эта тема и называется «Распознавание почерка врачей» — меня также интересует тема распознавания рукописных текстов в целом, и её тоже хотелось бы обсудить. Просто тема про врачей привлекает гораздо больше внимания :)

В общем, не знаю насчёт готового продукта, а в качестве pet-проекта и магистерской работы — пойдёт. Сейчас я планирую реализовать простейший функционал:

1) создать маленький словарь из 150 слов (пусть это будут названия лекарств, просто для связи с темой); желательно побольше похожих слов, чтобы убедиться в точности распознавания;
2) собрать много образцов рукописного написания этого словаря; хотя бы человек 100 — получится 15000 примеров слов; найти бы врачей, которые согласятся помочь — было бы идеально;
3) как-то разделить все слова на отдельные маленькие изображения — можно создать сеть, которая будет сама это делать, но это не главная задача пока;
4) обучить нейронную сеть распознавать слова из словаря, не разбивая их искусственно на буквы (т.е. на входе — картинка, на выходе — 150 нейронов, каждый отвечает за слово из словаря, один из них активируется);
5) добиться, чтобы она научилась обобщать почерки; если в итоге она сможет распознать слова из данного словаря, написанные незнакомым ещё почерком — это уже успех;
6) хорошо бы обернуть это в мобильное приложение — это уже дело техники, а разрешения камеры должно хватить на определение отдельных слов.

Самое интересное, что несмотря на бурное обсуждение, ни один человек не скинул ни рецептика, ни странички любого другого рукописного текста мне на email. А без данных даже начать не получится. Поэтому ещё раз прошу всех неравнодушных: уделите минут 20 времени, напишите мне на листке 150 слов и отсканируйте. Поспособствуйте развитию отечественной науки! :)

Пишите сюда: 3479900457@ukr.net. Я дам подробности и вышлю список слов.

Всем спасибо за обсуждение!

LinkedIn

Лучшие комментарии пропустить

Над расшифровкой уже потом поработаем, может, наймём фармацевта из ближайшей аптеки.

напомнило один анекдот

Во время поездки по Междуречью провизор случайно прочитал шумерскую клинопись 3-4 тысячелетия до нашей эры...
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Вот на такое только что наткнулся
apteka911.com.ua/razobrat-retsept

Имхо не взлетит. Даже в Украине в любой частной клинике умеют напечатать назначения на принтере. Как только такое чудо техники появится в государственных больничках — распознавание иероглифов станет ненужным. Задача конечно интересная, но имхо стоит искать применение в каких-нить других сферах.

Хочу подвести итоги по теме. Я услышал много разных мнений насчёт реализации и целесообразности: от «это невозможно ещё лет 100» и «никому это не надо, проще перейти на электронную систему» до «никого не слушай, я готов сотрудничать» и «интересно, я бы даже заплатил за такое приложение» (не все из них были озвучены именно здесь).

Чтобы не быть голословным, я провёл опрос в одной «заблокированной» социальной сети с простым вопросом: «Нужно ли вам приложение для распознавания почерка врачей?». Проголосовало 89 человек. Голоса разделились следующим образом:

— «Нет» — 16 чел. (18%)
— «Не знаю, можно попробовать» — 20 чел. (22,5%)
— «Да, если бесплатно» — 49 чел. (55%)
— «Да, и я готов(а) заплатить за него» — 4 чел. (4,5%)

Хотя голосов и мало, их разделение наметилось с самого начала опроса и почти не менялось всё время. Поскольку вопрос был не «считаете ли вы такое приложение полезным хоть кому-то», а «нужно ли оно вам» — выходит, идея полезная. Более половины опрошенных воспользовались бы таким приложением, а это большая целевая аудитория.

Интересно распределение голосов по странам. Из России проголосовало 25 человек, 13 из которых ответили «Нет» или «Не знаю», 10 — «Да, если бесплатно» (40%) и 2 — «Да, готов заплатить».
Из 49 украинцев 31 согласен за бесплатно (69%), 1 — готов заплатить и 17 — не знают или не хотят.
Это логично, ведь в России уже действует электронная система, а у нас — нет.

Хоть эта тема и называется «Распознавание почерка врачей» — меня также интересует тема распознавания рукописных текстов в целом, и её тоже хотелось бы обсудить. Просто тема про врачей привлекает гораздо больше внимания :)

В общем, не знаю насчёт готового продукта, а в качестве pet-проекта и магистерской работы — пойдёт. Сейчас я планирую реализовать простейший функционал:

1) создать маленький словарь из 150 слов (пусть это будут названия лекарств, просто для связи с темой); желательно побольше похожих слов, чтобы убедиться в точности распознавания;
2) собрать много образцов рукописного написания этого словаря; хотя бы человек 100 — получится 15000 примеров слов; найти бы врачей, которые согласятся помочь — было бы идеально;
3) как-то разделить все слова на отдельные маленькие изображения — можно создать сеть, которая будет сама это делать, но это не главная задача пока;
4) обучить нейронную сеть распознавать слова из словаря, не разбивая их искусственно на буквы (т.е. на входе — картинка, на выходе — 150 нейронов, каждый отвечает за слово из словаря, один из них активируется);
5) добиться, чтобы она научилась обобщать почерки; если в итоге она сможет распознать слова из данного словаря, написанные незнакомым ещё почерком — это уже успех;
6) хорошо бы обернуть это в мобильное приложение — это уже дело техники, а разрешения камеры должно хватить на определение отдельных слов.

Самое интересное, что несмотря на бурное обсуждение, ни один человек не скинул ни рецептика, ни странички любого другого рукописного текста мне на email. А без данных даже начать не получится. Поэтому ещё раз прошу всех неравнодушных: уделите минут 20 времени, напишите мне на листке 150 слов и отсканируйте. Поспособствуйте развитию отечественной науки! :)

Пишите сюда: 3479900457@ukr.net. Я дам подробности и вышлю список слов.

Всем спасибо за обсуждение!

Не майся дурью, а возьми уже готовую базу для этой задачи. Вот ссылки
www.eff.org/...​/AI-progress-metrics.html
habrahabr.ru/...​010&utm_content=link2post

Тут и современные подходы найдешь и собственно корпуса.

Но, подобная работа тянет на кандидатскую, а не магистерскую. В одиночку на подобную работу у тебя уйдет лет 5 минимум. С приличным научником и в группе года за 2 может что получиться.

Где там готовая база? Только рукописные цифры есть.
Я-то использую transfer learning, научу сначала распознавать печатные слова — на них баз хватает. Но нужны и рукописные слова.

Почему вы считаете, что на обучение словарю из 150 слов уйдёт 5 лет? Это довольно простая задача: из небольшого набора слов выбрать одно, наиболее похожее на представленную картинку. Слова разные по длине, так что сразу разобьются на разные группы. Труднее всего будет с различением двух похожих слов, в этом и будет суть обучения.

Где там готовая база? Только рукописные цифры есть.

Для начала тебе этого выше крыши.
Не на обучение, на на изучение тобой темы, пробы, эксперименты и написание собственно алгоритмов и оценку их.
Пока же всё, что ты пишешь говорит о том, что ты и близко не в курсах этой темы.

Возьми подход, что показал там лучшие результаты и копай его. Тебе на долго этого хватит.

А с печатными, попробуй сделать распознавание при всего-лишь перспективном искажении картинки и не посредственном качестве картинки (снято телефоном в разных условиях освещения, но для человека читаемо). Если у тебя такое уже есть, я тебе могу хоть завтра заказчика подкинуть, кому такое нужно. Заказчик рассчитывает на 3 месяца максимум. Я ему смог предложить только от 8 месяцев и не идеальный результат. До идеального в его понимание полтора года мне нужно где-то.

Самое интересное, что несмотря на бурное обсуждение, ни один человек не скинул ни рецептика, ни странички любого другого рукописного текста мне на email. А без данных даже начать не получится.

А что если просто нагуглить несколько сотен, или даже тысяч «рукописных» шрифтов позабористей (раз, два, три и т.п....) и нагенерить себе столько сэмплов, сколько нужно?

Спасибо, это отличная мысль! Надо найти такие шрифты для кириллицы, и да, можно немало примеров сгенерировать.

Если разбор слова как картинки, то не должно быть разницы, какой язык.

А дальше для каждой картинки полушишь вероятность и вот уже подобрался к простейшему: н-граммам, а затем посложней понадобиться HMM и языковым моделям. И вот зависимость от языка в полный рост встала.

> Супрун: Минздрав Украины планирует ввести электронные рецепты с 2018 года
Уже с 2018 года Министерство здравоохранения планирует ввести электронные рецепты. Об этом сообщила исполняющая обязанности министра здравоохранения Ульяна Супрун. «Это значительно упростит маршрут пациента и позволит нам эффективно отслеживать статистку пациентов. Врачи будут выписывать электронные рецепты, которые нельзя будет ни потерять, ни подделать», — рассказала Ульяна Супрун.
Молодой программист бросается сразу делать, опытный — подождет двух митингов.

Интересно, в чем они будут выписывать эти рецепты(((

да гугл док расшарят между аптеками и поликлинниками и будут ипользовтаь его)

Гораздо проще банальная форма с автокомпитом для названия, этого достаточно в 99% чтобы с нескольких букв нужный препарат очутился в подсказках, как на tabletki ua, остальное типа дозировки и интервала приема вообще простые формы, единственное для редких случаев текстовое поле- примечания. Да и голосовой поиск по словарю на готовом движке куда реальнее. Гугл вообще отлично распознает. Вообщем, зачем выдумывать? Все ровно это нереально на коленках написать.

Резонно.
Тот же вопрос, что и всем: а о распознавании рукописных текстов в целом что думаете?

Лови www.eff.org/...​/AI-progress-metrics.html (в одном местном чатике подкинули).
Находишь один из лучших подходов, разбираешься и реализуешь, если осилишь. Не забывай, что люди, которые то реализовали от 15 лет этим занимались и командой спецов.
Но от результатов на стандартной базы до результатов в реальном мире очень большое расстояние. Например при идентификации по голосу на базе НИСТа достигнуты ошибки меньше одного процента, то в реальных условиях ошибка будет около 6%.

Добавлю, но не забывай, что пока разбираться будешь и пытаться повторить, там еще дальше уйдут. Именно поэтому монстры типа Гугла сами не разрабатывают, а просто покупают эти команды или продукты.
Например Нокия, когда еще жива была хотела купить ЦРТ питерское. Но контора то фсбэшная, посему не разрешили.

Посему тебе проще заюзать готовую опенсурсную либу. Правда новейшие подходы в опенсурсе за бесплатно появятся только лет через 5-10. Платные реализации чуть раньше. А с учетом местных недоязыков всё будет еще позже.
Вот приличный синтез английской речи появился на 7 лет раньше, чем русской, причем приличный русский сейчас только за очень хорошие бабки. Про украинский и не говорю. Это появиться еще лет через 10 только. Это к тому, что базы там английские и возможно испанские.

Врач, выписывая рецепт, все зачитывает и разъясняет, чего сколько и в какие места. Так что достаточно на этом моменте включить диктофон. Приложение, определяя Ваше местоположение и нахождение в больнице, либо приближение к ней, может, например, напомнить — запишите разговор с врачом о рецепте. А потом, развить до — разговор с чиновником, учителем, жек ... Либо с разрешения пользователя, на автомате по классификатору мест посещений.

Над расшифровкой уже потом поработаем, может, наймём фармацевта из ближайшей аптеки.

напомнило один анекдот

Во время поездки по Междуречью провизор случайно прочитал шумерскую клинопись 3-4 тысячелетия до нашей эры...

Сначала сделайте не распознаватель, а генератор. Когда поймете механику процесса (почему у врачей такой почерк) сможете и распознаватель сделать, а заодно и потребность в тестовых данных частично будет решена.

Вот и название нашли: Дегенератор врача

Ідея цікава і до речі активно юзається Royal Mail в Лондоні, коли система розпізнає адреси, які користувачі записують на конвертах. youtu.be/1BVHPmGIxBQ

Якщо розробляти додаток, що буде розпізнавати лікарські записи — то треба вибрати правильну цільову аудиторію для такого продукту. Молодь і середній вік — часто юзають приватні клініки, в яких вже давно є комп і принтер:). Якщо беремо людей похилого віку, то вони часто користуються державними клініками і кнопочними телефонами:). І для них працює така модель: лікар пише ( зашифровує) — фармацевт розшифровує.

Цю ідею можна застосувати, як варіант, для розпізнавання текстів в архівах, які зараз оцифровуються.

Во-первых, та система отрабатывает только на тех, где может распознать, остальные также передаются людям в распознавание. Но для почты и это выгодно, меньше людей нужно держать на сортировке.
Во-вторых, при сканировании нет траблов с освещением и другими искажениями. На смарфоне ты этих траблов отгребешь по полной и большую часть из них не решишь.
В-третьих, ты бы привел стоимость разработки той системы и время разработки.

В США уже доктор электронно отправляет рецепт в аптеку, поциенту на руки никаких бумажек не дают. just saying.

Далеко не везде. Если ты там, попробуй на марихуану рецепт получить. Разумеется в штатах где сие легально.

Симптомы выдумывать не надо, покажи профиль на DOU — тебе выпишут.

Зачем рецепт? Пошел в магазин и купил.

Кроме непосредственно распознавания нужно ещё и понимать что написано, дабы правильно передать смысл.

Компьютер, способный разобрать писульку нашего врача, будет изобретен практически сразу после колонизации Марса

Если он будет настолько умным — сразу эмигрирует на Марс, а вы тут ... со своими рецептами))

Не выйдет. Агроном, высланный для колонизации Марса, умрёт от неправильно распознанного рецепта.

«б_л_н_ца» — блудница же?

Вот блин же! Мне в 13 лет блудницу прописали, а эти сволочи совсем другое применили. У меня, можно сказать, острый недостаток блудниц был. Никогда не прощу!

Те же дела))

Імхо ідея варта уваги тільки в якості спорту, для тренування навичок. Автоматизувати розпізнавання рукописного тексту лікарів — це як організовувати окремий робочий процес цукрування їжі ресторану, в якому кухар пересолює усі страви. В нашій аналогії, звісно, на цього кухаря впливу немає, але з точки зору ідеології та перспектив використання це неспівставно складна задача задля подолання тимчасової проблеми. Мало того, що велика доля потенційних споживачів такої послуги лікуються не в районних поліклініках, а в приватних установах, де в найгіршому випадку пацієнту видається роздруківка, так ще й на державному рівні зараз, нарешті, ідуть роботи над e-health, що має прибрати корінь проблеми, замість компенсації наслідків.

Спасибо за мнение. А что думаете о распознавании рукописных текстов в целом, помимо медицинских? Нужно ли оно предприятиям или отдельным пользователям?

Был бы нужен — дали бы нагоняй тем кто эти тексты производит.

Вы решили побить все рекорды по количеству комментариев? 10515, вы уже добились этого — астанавитесь

По делу: www.google.com.ua/...​борщик рукописного текста

Как только обещанную аппликуху напишешь, как только она сможет сделать то что ты обещаешь — клянусь своей 300-летней бородой, сломаю клаву об колено.

Я зі свого досвіду не можу придумати якісь перспективні кейси. Але от вище дуже цікавий варіант з Royal Mail озвучили — пошта це ж дійсно один з останніх бастіонів рукописного тексту :)

Всегда думал, что врачебный рецепт — это шифровка фармацевту. Вы точно уверены, что обычным людям интересно, что там написано?

По-перше, є такий корисний підхід до лікування як отримання «другої думки». В такому випадку принципово нечитабельний рецепт може створити проблеми навіть для іншого лікаря :) А по-друге, особливо обізнані пацієнти можуть без проблем перевіряти виписані їм ліки і препарати по різних базах доказової медицини та ліків підтвердженої дії, і відсіювати «фуфломіцини».

Це буде прикладом намагання вирішити проблему з іншого кінця, для чого потрібна соціальна активність, суди, які повернуть гроші, закони про страхову медицину, та, власне, довіра до неї. Аплікація тут допоможе на міліметр. Та ще й навпаки зашкодить: хочете компенсацію від лікарні? А ви пили те, шо лікар прописав? Ні, мені третій пункт не сподобався. ?..

Це не рішення проблеми з іншого кінця, це вирішення іншої (гострої) частини проблеми: як під час лікування не знищити свій імунітет наприклад. Коли на вас нападають на вулиці, то ви не займаєтесь організацією мітингів чи подаєте в суд на авакова, ви тікаєте або намагаєтесь знешкодити нападника.

Ви висвітлили проблему недовіри лікареві, а не його поганого почерку. А я кажу про те, що в плані заробити пару сотень на аплікації — то може бути добрий привід, особливо, коли відповідно «пояснити» потенційному користувачеві, що він зможе з висоти фінансово-економічного технікуму оцінювати призначення лікаря. Але це аж ніяк не заспокоїть пацієнта. Ви його як переконаєте, що, якщо він самотужки викине з рецепту декілька позицій, то тоді вже то буде ідельний набір, який його вилікує?.. Це наче форматування коду, коли прцюєш з легасі системою, писаною 10 років тому.
Давайте одразу додаток — власний лікар, якщо офлайновим ніякої довіри. Снімок зробив, в мікрофон кашлянув — ретіна-рецепт на екрані. Без злодіїв в білих капелюшках.
Припускаю, що корисною може бути та сама доказова база. Навідь якщо рецепт піде прямо до аптеки без папірця з Вашим кодом, особливо «обізнані» зможуть зайти до бази і побачити «світлофор»: ліки, симтоматики, гомеопатія.
Без розпізнавання. Бо це не проблема.
Хоча з точки зору маркетолога, чим менше це буде вирішувати основну проблему, тим більш поширеним може бути продукт.
В ідеалі: усі лікарі — шарлатани, усі пацієнти одразу по врученню кидаються перевіряти рецепти та половинити їх. Продовжуватимуть хворіти та бігати по лікарях зі смартфонами.

Чесно кажучи, нічого не зрозумів, запотужна суміш сарказму, іронії та туманних для мене натяків. Ви: пацієнту байдуже, що в рецепті. Я: пацієнту потрібно розуміти зміст рецепту, бо він може перевірити якість та доцільність лікування. Ви: А як же боротьба за довіру до медицини? Я: під час хвороби хворий фокусується на здоров’ї, а не боротьбі за абстрактні цінності. Ви: треба слухати лікарів, і не перевіряти лікування? Правильно я зрозумів?

Пацієнт за визначенням не може перевірити якість та доцільність. Якщо потенційний пацієнт прочитав чланок на сайт.уа, це не робить з нього лікаря. І программа розпізнавання рукописного тексту, окрім академічної цінності, не вирішіть ніякої проблеми. Якщо программа не допомагає вирішіти проблему, її доля схожа з обчисленням фінансів чи пєрделкою.
Вийшло трохи більше, ніж 160, але, думаю, Ви зрозумієте

Пацієнт за визначенням не може перевірити якість та доцільність лікування. Постраждалий за визначенням не може оцінити якість та ефективність дій поліції в розслідуванні його справи. Батьки дитини за визначенням не можуть оцінити якість та рівень отриманих в школі знань своєї дитини. Громадяни за визначенням не можуть оцінити адекватність та прогресивність дій вибраного ними політика.

Не могу с этим согласиться. Если пациенту назначают гомеопатию, то он может оценить, что ему назначили ерунду. Так же может потратить время, прошерстить пабмеды/кохрейны и понять, что ему назначили что-то, что ему вообще не подходит. Но, понятно дело, что для этого нужно хоть чуть-чуть понимать, что с тобой, и не лениться. Второе встречается редко.

Ну с гомеопатией может сработать эффект плацебо. Если у чела придуманная им самим болячка, то гомеопатия ее вполне вылечить может. Главное, чтобы чел верил, что эта крутая фигня его лечит.

Королевская семья Англии 200 лет гомеопатией пользуется- они внушаемые? Во Франции, Германии, Австрии ,Голландии, Испании -гомеопатия входит в число , оплачиваемых страховкой услуг. Есть институты и в клиниках ее выписывают..
Если это все внушение, то пусть, гомеопатия -вежливость королей. :)

Начать что-ли с тобой спорить про гомеопатию? :)

лучше вживую за чашечкой чая

Вживую со мной про гомеопатию лучше не спорить :D

„One-fifth of every electorate can be hypnotized almost in the twinkling of an eye” — вот зачем мне с ним спорить, если он такой внушаемый? :D

Как зачем? Загипнотизируешь, может, и я выброшу все тюбики с гомеопатией в урну)

И даже ИРС 19 выбросишь?

ты бьешь ниже пояса))
а так все хорошо начиналось, сиськи считали))

Предлагаю продолжать считать сиськи и не переходить на разговоры про гомеопатию и оральный прививки, а то у меня глаз дёргаться начинает, а нервничать вредно

а что не так с ними?

С кем с ними? С сиськами?

прививками и глазом

Глаз дёргается от наших постоянных споров с Сергеем про доказательную медицину и про то, что ИРС 19 это ерунда. А вообще всё с глазом хорошо, он есть и он красивый. По крайней мере, правый.

Так вот и не спорю, а вы не даёте мне не спорить :D

Не надоело тебе еще оное?
Ну нравиться человеку верить с зеленых марсиан, пусть верит. Вера не требует логических доказательств.

В интернете кто-то неправ! ©

Про ИРС −19 договора не было. Потому что не понимаю, чем он отличается от оральной прививки, которую детям на сахарок от полиомелита дают..

тем, что прививка от полиомиелита — это живой (если будут приставать к определению жизни — активный) мутировавший вирус, который будет развиваться в кишечнике и тренировать имунную систему с собой бороться. центрифугированные бактерии если и дадут эффект, то, скорее всего, кратковременный.

значит бифидо и лактобактерии в капсулах, которые при дисбактериозе назначают- тоже бесполезны? :)

там живые бактерии, которые размножатся в желудке, если их не травить сильно. кстати, лучше всего помогает zakvaski.com/...​ilakt-vivo-lactulose.html (залить флакон водой и пить 2 раза в день неделю-две)

Кстати, не хочешь поговорить РКИ? :D Пробиотики это фу. Если уж на то пошло, то лучше пребиотики, хотя и то ещё непонятно, будем смотреть по исследованиям. Бифидо и лактобактерии это такой же маркетинговый ход, как жрать витамины каждую весну.

С удовольствием поговорю.
Смущает слово рандомные)
Какая у них выборка, какой вероятностный порог, в каких регионах мира, что у них было до и после исследований, точно ли исследования делались без нарушений?
Мне нужны данные)

А вообще Катерина, мне кажется ты себя просто оправдываешь. Чтобы оправдать свою нелюбовь йогурты пить, витамины , смузи, и таблетки.
Кофе с виски на завтрак, бехеровка на обед, вино на ужин?)
Фитотерапией занимаешься?)
З- зависть((

Не вино, а вермут, чтоб с лечебными травами же! Всякие там рига со смородиной, гранд маринье, чтоб витаминчик Ц в организм поступал. Не забывай про джин! А на десерт к обычному егермейстеру можно спайсд голд, чтоб максимизировать пользу

— Смотрит на ИРС-19, на твое сообщение с вкусняшками, на ИРС-19 -на твое сообщение...
-вздыхает..))

Ты вообще ешь твердую пищу, или только пьешь из тюбиков, как космонавт? :)

Мне интересно, почему у тебя вообще такие предположения про меня :-/ Стою жарю курогрудь и фрактальную капусту, а мне тут задвигают, что алконавт

Вот у людей привычка додумывать.
Если я написал космонавт, то и имел ввиду космонавт, когда уже отправил — самому смешно стало).
Ты так смачно написала про вермуты, джин, ром, и егермайстеры с лечебными травами, когда говорили про витамины, а про твердую еду ни слова.
Мало ли, вдруг тебе нельзя твердую; или не гурман, я же не знал, может фаст-фуд любишь на скорую руку)
Вот пища космонавтов:
s00.yaplakal.com/...​original/3/3/6/317633.jpg

Ладно шучу, не надо мне данных.)
Лучше про эти самые...)

может и фу, но работают)))))

Если их антибиотиками прибили, то и такие пойдут, пока собственные не восстановиться. Тоже и с витамина — помогают только тем, у кого недостаток, у остальных с мочой выводятся (разве что лишняя нагрузка на печень и почки).

In vivo все эти пробиотики до одного места.
А про витамины — не забываем про жирорастворимые, которые так просто не выводятся. Так что либо ты жрёшь какой-то мел и нафиг за него платить деньги, либо рискуешь нанести вред организму не понимая, что ты в него пихаешь :) Поливитамины — зло. Имхо, лучше уж печень алкоголем нагрузить, но знать, что ты выпил 50 коньяка, чем жрать поливитамины :D

Ну при цинге витаминчик С сильно поможет.
А пробиотики те ты получаешь с обычным свежим кефиром и подобным.
Но в современном мире получить недостаток какого-то витамина ну очень сложно.
Хотя когда в армии сломали мне челюсть и в больничке она не хотела срастаться ударными дозами уколов с витаминчиками мне этот процесс сильно ускорили.

In vivo мне помогают от язвы и еще минимум одному человеку от изжоги. И ему их тоже кто-то советовал, то есть граф идет глубже.
Проверены закваски с Левобережки, а не капсулы из аптеки.

коньяк можно виноградом закусить и сыром -получатся поливитамины:)
вообще коньяк- три «С» закусывают -шоколад, кофе, сигара..

Наш с тобой спор про гомеопатию стар как мир. Мне уже лениво.

Я хотел бы услышать ваше мнение о целесообразности всего этого

Отримав у львові, декілька місяців тому, перший роздрукований рецепт від лікаря, який при мені двома пальцями його натайпав. The future is now XD
Я думаю нам краще в цю сторону рухатись ( медична історія в цифровому форматіі) і схоже процес стартував. Надіюсь не зупиниться силами зрадофілів.

Пиши в ЛС — мой подчерк не хуже любого медецинского xD

О боже, я только сейчас заметила хД) мне стыдно, очень стыдно =)

Вопрос решается в другую сторону. Созданием системы «Прозрело» )) Хай врач надиктовывает, система распознает и выписывает «читабельным почерком» (онлайн было бы еще круче, но пинсеонерам нужна бумажка, что бы подавать ее в окошко).

кто и как быстро будет заносить новые наименования лек средств? меняющиеся диагнозы — да, они меняются, медицина не стоит на месте.

Средства проходят сертификацию, их и так «заносят в базу», произвести интеграцию и вуаля. (это в идеале, а можно и студентов нанять (параллельный ввод данных с последующим сравнением вариантов — 90% будет внесено с первой попытки без ошибок, остальные можно и на второй круг пускать, технически это «не задача века»)

Оооо учитывайте особенности нашей медицины. зачем интегрировать, когда можно брать деньги с представительств за внесение в базу?! а еще можно за деньги варианты врачу подсказывать, кто больше заплатил — тот в первой строчке подсказки.

Ооооо, учитывая особенности нашей страны, зачем задавать вопросы «типа серьезно», если ответ не нужен? «Страна — говно» — я так тоже умею. Но желания так развлекаться нет.

А вот подумать над возможными реализациями тех или иных идей, я люблю, это мне нравится.

В том числе подумать и о том, как "обойти«/нивелировать эти самые «особенности».

идеи реализуются не в вакууме, а в определенных условиях. Страна реализации — одно из них. Мое предложение я озвучила. Интерфейс взаимодействия с пользователями, команда консультантов. Гораздо дешевле и эффективно

О чем вы вообще............?

Похоже совершенно не о том, о чем я. Ок. Учитывая, что дальнейший разговор не имеет смысла, то мне не интересно.

Уверены, что это проще реализовать? :)
А пенсионеры — не наша целевая аудитория, вот и всё.

Пенсионеры — это целевая аудитория фармацевтической промышленности (и системы здравоохранения). А для сферической аудитории в вакууме — можете ваять все что душе угодно.

Вот как раз ввод с голоса — уже не проблема для нейронной сетки, «Ok, google...» — тому доказательство.

Так что, твоя идея (как бизнес-идея) — уг. Но если есть желание позаколачивать гвозди микроскопом, то вперед, ничего не имею против. )))))))))

1. Актуальность проблемы: низкая, от руки врачи писать будут не долго и скоро перейдут на использование техники. Да, есть ситуации, когда врач все равно будет писать от руки. Я так понимаю, это русскоязычные доктора в россии, Беларуси, Украине.
2. Есть альтернативное и очень выгодное решение. Сканы рецептов, заключений эт.сет. распознает фармацевт или интерн за небольшую копеечку. Осталось только приложение/сайт для взаимодействия с пользователями сделать.
3. Важно! Вы правильно заметили — большую роль играет контекст. Пользователю необходимо указать специальность врача, предполагаемый диагноз, возраст пациента.
Готова посотрудничать!

Хочу создать программу для offline-распознавания рукописного текста, заточенную под медицинские тексты. Сканируешь бумажку с рецептом — и видишь транскрипцию на экране.

Что??? Пока еще с калиграфическим почерком задача не решена а тут про тайнопись.

Поэтому я и создал это обсуждение. Чтоб не бросить всё и начать пилить, а определить возможность и целесообразность этого. Если можно, прокомментируйте чуть более конструктивно, в чём именно вы видите основные проблемы.
Я их вижу в малом количестве данных. Будь у нас 10 миллионов страниц рукописных текстов, решилась бы задача? Если так, то стоит начать с создания общей базы для сбора таких данных.
Если что-то ещё технически нереализуемо — скажите.

Всё здесь не реализуемо в ближайшие 50-100 лет. Почитай книжки для начала по этой области.
Тут даже не распишешь сразу — насколько бредова твоя идея.
Если уж так торкнуло, лучше повтори хотя бы уровень ABBYY, лет на 20 развлечения тебе одному хватит.

Есть сети, умеющие предсказывать наиболее вероятые слова по соседним нескольким (ronan.collobert.com/...​b/matos/2008_nlp_icml.pdf). Есть сети, распознающие рукописные цифры и одиночные буквы. Есть такие, которые хорошо распознают печатный текст. Почему бы не объединить эти принципы для задачи рукописного распознавания?
Может, это не реализуемо одним человеком, который ничего подобного не делал. Это да))
Но технически это вполне возможно, имхо. Про 50-100 лет вы точно загнули.
А насчёт ABBYY, по-моему, они не используют контекстуальный анализ, а распознают каждую букву отдельно — потому и получается не очень. Могу ошибаться.

Ты фантаст. Для начала попробуй сделать что-то простое. Просто возьми уеб-страничку и распознай там текст и найди блоки текста. Уже это у тебя не получится. А ты уже фантазируешь про рукописный, да еще и абсолютно неразборчивый.

Угу, пример к распознаванию из аптечной практики знакомого фармацевта: «кето (к/н) а (л/м)». Контекст: боли в суставе, посетитель даже помнит, что слышал аббревиатуру НПВС и говорит, что это не пить — это колоть. Мужчина, без язвы, не беременный, похож на Хауса. Дозировка 60 мг в день.

Внезапно, одно — обезболивающее без каких-то особых свойств, второе — по эффективности сравнимо с морфином. По контексту подходят оба. Не забывайте, что лекарства обмену и возврату без скандала не подлежат, а в ампулах — тем более.

Дадим первое вместо второго — оно не поможет (в лучшем случае) и будет скандал.
Дадим второе вместо первого — пациент охренеет (в лучшем случае) и будет скандал.

Случай из моей практики: «ограничение физических нагрузок» в списке назначений было распознано с третьей аптеки.

Если и фармацевт распознать не может, то грех на приложение жаловаться будет. Максимум, что можно будет сделать — предложить оба варианта с вероятность «50/50» — пусть у врача уточняют.

Кстати, чем история закончилась? Какой препарат дали? Интересно же :)
Как вариант, дать третье обезболивающее — среднее по действию между этими двумя — и минимизировать ошибку для обоих случаев, по принципу линейной регрессии :D

И жаловаться грех, и скандалить грех, и брать наугад нельзя, но клиент будет делать и то, и другое, и возможно даже третье. Странность посетителей иногда достигает таких величин, что у провизиров появляются правила вроде «никогда не спрашивать, какая сыпь, до того, как спросишь где она». Т.к. клиент может и показать, какая. Даже если она ТАМ, даже стоя в очереди и нет, смелость клиента не зависит от пола.

Средних там не бывает, т.к. механизмы действия и совместимость очень многогранны. Живой аптекарь долго медитирует, потом в зависимости от количества набитых шишек или рискует набить новую, назначая то, что безопасней, или отмазывается от греха подальше: «извините, у нас нет ни того, ни другого».

Поэтому я и говорю: дешевле нанять фармацевтов/врачей

Дешевле уволить тех кто писать не умеет.

Ключ в дозировке

Мужчина, без язвы, не беременный, похож на Хауса. Дозировка 60 мг в день.

Викодин. Инфа 100%.

проблема цікава, але без картинки пост неповноцінний
www.memecenter.com/...​fun/946376/we-are-doctors

Хочу создать программу для offline-распознавания рукописного текста, заточенную под медицинские тексты.

ну и главный вопрос: «какой фреймверк/йезыг/стэк посоветуете?» ;)

Я хотел бы услышать ваше мнение о целесообразности всего этого, о способах реализации, об озвученных идеях.

забей, имхо )

ну, или если таки действительно интересна предметная область, лучше займитесь анализом капчей.

Так то в США рецепты в бумажном виде пациент на руки обычно не получает , а доктор просто отсылает его в удобную для пациента аптеку.

Сильно зависит от величины проблемы. Если это обычная клиника, то выписывают аж бегом.

эм, может просто врачам пора забыть про бумажки, и вспомнить что 21 век на дворе? Вообще непонятно, почему еще никто бюджетные бабки не по пилил на компьютеризации документооборота госклиник... тут такое поле для деятельности , видно на черный день заначка:)

Вообще непонятно, почему еще никто бюджетные бабки не по пилил на компьютеризации документооборота госклиник... тут такое поле для деятельности , видно на черный день заначка:)

В киевской областной, что на Багговутовской, уже компьютиризовали. Рецепт был печатанный.

Ну и это уже не плохо- Европа же все таки ;)
Хотя в моих скромных мечтах никакого печатного рецепта быть не должно (ну разве что для дублирования старшему поколению, да с QR), должна быть единая база, к которой подключены все больницы и аптеки, и чтоб не носиться с макулатурой, которую постоянно поднимаешь с пола и не тратить время в очередях и записях...

ну надо пробовать, сначала обучить нейросеть, распознавать буквы/слова отдельно, допустим хотя бы начать с алгоритма Кохонена, потом юзать что то типа расстояния Левенштейна для определения свопадений в базе данных, потом строить связи между словами и тд. долго, дорого, геморно. Реально проще научить врачей сразу вносить все в электронном в виде, лучше создать систему которая позволит врачам вносить все данные в базу данных очень быстро и выписывать рецепты + лечение на основе предложенных теми же нейросетями с небольшой корректировкой

Систему голосового ввода в базу данных для врачей с коррекцией правописания)

долго, дорого, геморно

И не получится ничего. Но если ТС отвалит бабла, то я готов поучаствовать в распиле.

Ребята, предлагаю зафейлить стартап: дайте скан (не из инета) любой медицинской карточки пару страниц. Пущай распознаёт — ЛЮБЫМ СПОСОБОМ.

Думаю, симптомы всемогущества как рукой снимет.

Он сам зафейлится после того, как ТС хоть пару книжек почитает.

Это слишком долго, вероятно никогда. А так — одна-две странички, и попустило.

На самом деле «врачи и фармацевты» тоже зачастую не могут разобрать «врачебный» почерк. Именно разобрать — не могут. Выделяют в непонятном слове различимые буквы и, исходя из их положения и контекста (описан симптом, диагноз, препарат и т.д.) подбирают, по-сути угадывают, неразборчивое слово.

Это я и написал, не так ли?

для различия некоторых рукописных букв/слогов надо реально иметь примеры почти всех почерков. но если взяться за те, которые хорошо различимы даже в разных почерках (в, р, к, б) то количество материала для первичного обучения системы можно сильно уменьшить. а дальше — угадывать. а то и, ш, м, т можно изучать долго, но так и не начать надежно распознавать.
и в словаре использовать контекст — симптом/диагноз/препарат/рекомендация.

Мало того, ни за что не отвечают. Вся ответственность на покупателе.

А вот рукописных текстов — мало. Я не нашёл базу данных с рукописными текстами и их транскрипциями — ни на английском, ни на русском, ни на украинском.

Напрмер www.fki.inf.unibe.ch/...​/iam-handwriting-database правда на английском

Посмотрите в сторону recurrent neural networks и connectionist temporal classification.

Также последние исследования в сфере думаю можно найти здесь: u-pat.org/...​/program_competitions.php

В Google не смог найти существующий аналог. Может, плохо искал.

скорее — не искал
www.abbyy.com/...​hej/#sthash.xVuI5paR.dpbs

таблица с примерами букв — просто супер

Там же дата 1 апреля.

для PenReader заявлено распознавание медицинского почерка
при чем, не только 1 апреля :-)

PenReader — online-распознавание, ввод производится через девайс, а не с бумажки.

не нужно путать саму технологию и конечный продукт, использующий ее
ru.wikipedia.org/wiki/PenReader

Алгоритм предназначался для расшифровки древнего тибетского текста для его оцифровки и дальнейшего изучения

Противоречивые комментарии получаются, не находите?)

Одни говорят

Что??? Пока еще с калиграфическим почерком задача не решена а тут про тайнопись.
Всё здесь не реализуемо в ближайшие 50-100 лет.

А другие, что это ещё в 1997 году реализовано? Что-то здесь не так, речь о каком-то другом алгоритме.

не нужно путать саму технологию и конечный продукт, использующий ее
ru.wikipedia.org/wiki/PenReader

Мне это напоминает прессрелиз от Филипса в конце 90-х, где они распознавали речь для словаря 1.5 миллионов слов. Правда собственно этого продукта никто и никогда не видел.

А с годами. Темами распознавания текста, речи и т.п. начали интересоваться сразу, как компы изобрели. И есть статьи датируемые 40-ми и 50-ми годами прошлого века. А многие применяемые сейчас методы изобрели еще 150 и более лет назад.

Я же тебе написал, начни с простого — распознавание отсканированных страниц книги, затем распознавание отсканированной книги. Для начала заюзай tesseract, чтобы понимать что и к чему. Затем прочитай учебники, затем начинай читать статьи по этой теме и разбирайся в них.
Затем пробуй распознавать с фото при разных искажениях. Затем уже можешь начинать подбираться к рукописному тексту. Этого тебе хватит на лет 30 развлечений.

Задача розпізнавання рукописного тексту дуже цікава, але і дуже складна. Це вам не розпізнати друкований текст, з яким запросто справляється нейромережа, так як варіантів кожної букви не так то й багато. А от, на мою думку, з рукописним — набагато буде складніше. Ні, навчити нейромережу розпізнавати каракулі конкретної людини ви зможете. Та проблема в тому, що у кожної людини, є свої якісь особливі «значки» чи стилі письма, от як навчити машину робити це для всіх людей, при умові, що ми не можемо навчити її робити це заздалегідь для конкретного стилю письма.

Но ведь люди могут понять незнакомый почерк. Потому что есть какие-то общие принципы письма, объединяющие все почерки. Нужно, конечно, гораздо больше данных, чтобы сеть смогла обобщить и абстрагироваться от особенных «значков» и стилей. Мне кажется, основную роль здесь играет контекст и словарь, как я и писал выше.

ми не можемо навчити її робити це заздалегідь для конкретного стилю письма

Почему? Для конкретного стиля это как раз уже существует. ABBYY Fine Reader, например, распознаёт рукописный текст, если его перед этим обучить конкретному почерку.

Ви ж самі сказали, якщо перед цим її навчити конкретному почерку.
А де і як ви заставити, того ж лікаря і не одного і не тільки лікаря «здати» зразки «свого стилю»,
А от друкованому письму нікого не треба вчити...
І я не впевнений, що АББІ вміє розпізнавати рукописне творіння а не курсив — це різні речі.

Нет, я сказал, что перед этим её можно обучить рукописным текстам в общем, а потом — конкретно медицинским. Или я что-то путаю? А ещё перед этим — можно и печатным текстам, для максимальной отдачи от имеющихся данных. Смотрите «transfer learning».

І я не впевнений, що АББІ вміє розпізнавати рукописне творіння а не курсив

Хм, а вы правы. Мне казалось, может и рукописный — но теперь не могу такого найти.
Тем интереснее задача :)

Типичная ошибка ИИшника, поделить задачу на две части. Та что решается просто, ну там юайчик кнопули порастягивать. Для разгона. И там где заныкан сам ИИ. Обычно максимум что будет во второй части пространные тексты гуманитарного характера в очень длинных очерках о том «как мыслит человек». К сожалению эту часть не напишут, есть слабо алгоритмизируемые задачи, но зато останутся кнопули с очерками и в какойто мере раскаченное мышление. Ну тоже неплохо

а можете предложить мокап вашего приложения, им больше заинтересуются и будет виден прототип как минимум, гадалки с темы отсеются.

Пока нет, к сожалению. В первую очередь нужно разработать и обучить модель сети. А уже потом, если она сработает, вставлять её в какое-то мобильное приложение. А там всё просто: фотографируешь (в достаточном качестве) рецептик и видишь расшифровку на экране. Можно и рекомендации писать, и ссылки для покупки медикаментов, и описания — есть простор для творчества, в общем.

Сделайте диз, народ потом сам подтянется обучать ваши сети ))))

Отличная идея для приложения, я бы его скачал и даже заплатил бы за него.

Если повезёт, даже более одного раза воспользуешься.

Я думаю, в Москве стоит стартануть. Тебе ж надо найти людей на которых протестировать, ну там умер/не умер.

Намекаете на возможность летального исхода в случае ошибки? :)
Таки-да, нужно выдавать результат, только если система уверена в нём, а иначе — показывать возможные варианты. И везде написать, что мы не несём ответственности за последствия использования приложения))

Тот факт, что система в чем-то уверена, вовсе не означает, что она действительно правильно что-то распознала. Гуглите «adversarial examples».

Взгляните на это слово: "б_л_н_ца".

Это ты хорошее слово взял для примера.
А возьми десяток наименований лекарств, особенно труднопроизносимых, попробуй поигратся с ними. А еще надо взять во внимание, что постоянно появляются новые лекарства с новыми наименованиями.

Чем длиннее слово, тем проще, на самом деле. Половины символов хватит, чтобы однозначно сопоставить его со словом из словаря, даже не анализируя контекст. Труднее как раз с простыми короткими словами, типа «д_ть» — дать, дуть, деть — не поймёшь, пока не прикинешь вероятностные значения второго символа и не учтёшь контекст.
С новыми наименованиями — согласен, нужно постоянно поддерживать актуальность словаря за счёт добавления неопознанных слов пользователями.

Зверніть увагу на www.ehealth-ukraine.org Якщо його запустять, то в перспективі лишаться лише електронні рецепти

Не взлетит. Реализация слишком сложная. Если напишите и ниша будет с врачами пустая, продадите для распознования капчи и решите сразу парочку фундаментальных проблем ИИ.

в чем смысл этого распознавания капчи, если антийгейт дает 1000 капч(хоть рекапча) за 1 бакс?

В каком смысле сложная? Вопрос «нужно ли это» не связан с реализацией. Если это работает идеально (распознаёт не хуже фармацевта) — нужно ли это? Вот лично я скачал бы такое приложение на телефон, иногда может пригодиться — но платить бы не стал.
А получится реализовать или нет — другой вопрос, тоже открытый.

О продаже не думал, это скорее бесплатный открытый проект. Но спасибо за поддержку)
О каких именно фундаментальных проблемах ИИ вы говорите, не уточните?

Вы мне одного сотрудника напомнили. Который предложил написать программку по напеву отискать нужную композицию в интернете, между прочим на полном серьёзе в коммерческой организации. Я бы тоже такое приложение скачал. Просвистел и нейросеть трек нашла

Где скачать куда посвистеть ?

Так это уже вроде давно запилено не?

Всякие musicXwatch или Shazan умеют определять только идентичное исполнение. Когда некая вещь исполнена иначе, пусть теми же авторами — уже не ловит. (Проверял на «Ночных снайперах», есть студийные и концертные записи одного и того же.) Поэтому «насвистетое» они не осиливают.

Предлагаю более простой вариант. Завести единую базу и заставить туда впечатывать все вместо бумажных карточек.

Люди с этой работой справляются ощутимо лучше. А поскольку их овер дохера, то и приложение не нужно. Вот если бы было приложение, штрафующее врачей за сам факт рукописного рецепта — вот это была бы тема. Нет принтера — пишем печатными буквами.

Потому что как в кабинет входить — так в бахилах. А как рецепты писать — так кракулями? Все медицинские документы должны оформляться в читаемом виде.

Есть мысль, что это (помимо факта порчи почерка в процессе обучения из-за колоссального объема записываемых данных) заговор врачей и фармацевтов, преследующий минимум три цели:
1. Чтобы больной не мог читать рецепт и влезать со своими «дельными комментариями»;
2. Чтобы сам не нагуглил препарат намного дешевле выписанного элитного, просто посмотрев действующее вещество в выписанном (процент врачу от компании дистрибьютора);
3. Чтобы больной не мог заблаговременно распознать в выданном списке гомеопатию и исключить её из оплаты, оставив без доп заработка цепочку «прикормленный врач-прикормленный фармацепт-заинтересованная компания».

Ага, с «дельными комментариями» типа желания выжить и остаться здоровым, а не перейти на хроническое обслуживание к врачу.

Я так и сказал — штрафовать. Хотя за некоторые особо мотивированные действия стоило бы сажать на кол.

Так вот вам и решение. Скачал приложение, распознал препараты и пошёл гуглить. Заговор раскрыт, порочный круг разорван. Profit :)

Это в случае если копыта не откинул.

На самом деле врач ставит диагноз и назначает лечение. Рецептов врачи (подавляющее большинство) не выписывают уже несколько десятилетий. Я даже не знаю ни одной аптеки поблизости, где можно сделать рецептурный препарат. Но если вдруг так выйдет, что врач посчитает нужным выписать рецепт — то его он выписывает не больному, а фармацевту. Поэтому пожелания самого больного, как этот рецепт оформлять, могут и должны быть истолкованы только одним способом — «иди лечись на форумах!».
Что касается назначений и рекомендаций — то врач всегда озвучивает их пациенту. И отвечает на вопросы. Если при этом у тебя проблемы с распознаванием написанного — без проблем можешь внести свои правки или вообще на отдельном листике себе хоть печатными буквами написать, хоть на карманном принтере распечатать.

Ровно до тех пор, пока сам не окажешься пациентом, желательно в Украине.

Лично я готов послать нахер 9 из 10 «врачей», просто ради глупого желания остаться здоровым вопреки плану продаж. Как они это истолкуют — я на хуу вертел. Нормальный врач никогда не станет вставать в позу при любом вопрос пациента о своём здоровье, о назначенных процедурах или химии. Мало того, сам расскажет природу противопоказаний, и что с чем нельзя совмещать.

Те же, кто является шарлатаном — разумеется пробуют эксплуатировать свой статус, ведь не даром они «корочку» купили и должность. Вот их как раз необходимо заставить разборчиво писать себе приговор. Если конечно не согласятся добровольно прекратить мошенничество (ой, не согласятся).
________
Заметь, в «нетрадиционной» [читай ненаказуемой] медицине проблемы корявого почерка нет как таковой! Всё расскажут, распишут, львиную долю препаратов сами же приготовят и продадут. Я не агитирую за нетрадиционку, просто ставлю факт: где коррупции нет — там и проблемы нет. Совпадение?

твои умозаключения основаны на фантазиях, анекдотах, непонимании и полном незнании предметной области. поэтому оставь их при себе.
ЗЫ. да, плохих врачей много, и это проблема. и я, как врач, намного лучше вижу эту проблему... но проблема — именно в глупых и плохо-образованных людях, а не в абстрактных «коррупциях» и «откатах» (на самом деле заинтересованность врача в продаже препаратов намного меньше, чем вам кажется. эта волна поднялась на рубеже веков и уже лет 10 как идет на спад).

твои умозаключения основаны на фантазиях, анекдотах, непонимании и полном незнании предметной области.

Конечно-конечно! То что ты практикующим врачом не являешься, тоже «из анекдотов»? Что-то мне подсказывает, ты сам к шарлатанам не обращаешься, и не потому что их мало.

Подписаться на комментарии