Hot Positions, Cool Company! NeoGames
×Закрыть
Senior Web & Mobile Developer в Whiz.ai
  • Кресло для программиста

    Если не секрет, какое именно OKAMURA CONTESSA? С подголовником? У них там много разных на сайте

  • Фішки для мотивації та винагорода за активність. Як IT-компанії гейміфікують процеси

    Если люди подобраны правильно, они не нуждаются в мотивации. Все, что нужно, — это обеспечить отсутствие демотивирующих факторов. © Джим Коллинз

  • Распознавание почерка врачей

    Спасибо, это отличная мысль! Надо найти такие шрифты для кириллицы, и да, можно немало примеров сгенерировать.

  • Распознавание почерка врачей

    Где там готовая база? Только рукописные цифры есть.
    Я-то использую transfer learning, научу сначала распознавать печатные слова — на них баз хватает. Но нужны и рукописные слова.

    Почему вы считаете, что на обучение словарю из 150 слов уйдёт 5 лет? Это довольно простая задача: из небольшого набора слов выбрать одно, наиболее похожее на представленную картинку. Слова разные по длине, так что сразу разобьются на разные группы. Труднее всего будет с различением двух похожих слов, в этом и будет суть обучения.

  • Распознавание почерка врачей

    Хочу подвести итоги по теме. Я услышал много разных мнений насчёт реализации и целесообразности: от «это невозможно ещё лет 100» и «никому это не надо, проще перейти на электронную систему» до «никого не слушай, я готов сотрудничать» и «интересно, я бы даже заплатил за такое приложение» (не все из них были озвучены именно здесь).

    Чтобы не быть голословным, я провёл опрос в одной «заблокированной» социальной сети с простым вопросом: «Нужно ли вам приложение для распознавания почерка врачей?». Проголосовало 89 человек. Голоса разделились следующим образом:

    — «Нет» — 16 чел. (18%)
    — «Не знаю, можно попробовать» — 20 чел. (22,5%)
    — «Да, если бесплатно» — 49 чел. (55%)
    — «Да, и я готов(а) заплатить за него» — 4 чел. (4,5%)

    Хотя голосов и мало, их разделение наметилось с самого начала опроса и почти не менялось всё время. Поскольку вопрос был не «считаете ли вы такое приложение полезным хоть кому-то», а «нужно ли оно вам» — выходит, идея полезная. Более половины опрошенных воспользовались бы таким приложением, а это большая целевая аудитория.

    Интересно распределение голосов по странам. Из России проголосовало 25 человек, 13 из которых ответили «Нет» или «Не знаю», 10 — «Да, если бесплатно» (40%) и 2 — «Да, готов заплатить».
    Из 49 украинцев 31 согласен за бесплатно (69%), 1 — готов заплатить и 17 — не знают или не хотят.
    Это логично, ведь в России уже действует электронная система, а у нас — нет.

    Хоть эта тема и называется «Распознавание почерка врачей» — меня также интересует тема распознавания рукописных текстов в целом, и её тоже хотелось бы обсудить. Просто тема про врачей привлекает гораздо больше внимания :)

    В общем, не знаю насчёт готового продукта, а в качестве pet-проекта и магистерской работы — пойдёт. Сейчас я планирую реализовать простейший функционал:

    1) создать маленький словарь из 150 слов (пусть это будут названия лекарств, просто для связи с темой); желательно побольше похожих слов, чтобы убедиться в точности распознавания;
    2) собрать много образцов рукописного написания этого словаря; хотя бы человек 100 — получится 15000 примеров слов; найти бы врачей, которые согласятся помочь — было бы идеально;
    3) как-то разделить все слова на отдельные маленькие изображения — можно создать сеть, которая будет сама это делать, но это не главная задача пока;
    4) обучить нейронную сеть распознавать слова из словаря, не разбивая их искусственно на буквы (т.е. на входе — картинка, на выходе — 150 нейронов, каждый отвечает за слово из словаря, один из них активируется);
    5) добиться, чтобы она научилась обобщать почерки; если в итоге она сможет распознать слова из данного словаря, написанные незнакомым ещё почерком — это уже успех;
    6) хорошо бы обернуть это в мобильное приложение — это уже дело техники, а разрешения камеры должно хватить на определение отдельных слов.

    Самое интересное, что несмотря на бурное обсуждение, ни один человек не скинул ни рецептика, ни странички любого другого рукописного текста мне на email. А без данных даже начать не получится. Поэтому ещё раз прошу всех неравнодушных: уделите минут 20 времени, напишите мне на листке 150 слов и отсканируйте. Поспособствуйте развитию отечественной науки! :)

    Пишите сюда: 3479900457@ukr.net. Я дам подробности и вышлю список слов.

    Всем спасибо за обсуждение!

    Поддержал: Denys Poltorak
  • Распознавание почерка врачей

    Резонно.
    Тот же вопрос, что и всем: а о распознавании рукописных текстов в целом что думаете?

  • Кандидати, не треба так: відповідь рекрутера

    «Рекрутеры, не надо так», «Кандидаты, не надо так»... Интересно, что происходит, когда рекрутер собеседуется у рекрутера на должность рекрутера в новую компанию?

  • Распознавание почерка врачей

    Противоречивые комментарии получаются, не находите?)

    Одни говорят

    Что??? Пока еще с калиграфическим почерком задача не решена а тут про тайнопись.
    Всё здесь не реализуемо в ближайшие 50-100 лет.

    А другие, что это ещё в 1997 году реализовано? Что-то здесь не так, речь о каком-то другом алгоритме.

  • Распознавание почерка врачей

    PenReader — online-распознавание, ввод производится через девайс, а не с бумажки.

  • Распознавание почерка врачей

    Вы решили побить все рекорды по количеству комментариев? 10515, вы уже добились этого — астанавитесь

    По делу: www.google.com.ua/...​борщик рукописного текста

  • Распознавание почерка врачей

    Спасибо за мнение. А что думаете о распознавании рукописных текстов в целом, помимо медицинских? Нужно ли оно предприятиям или отдельным пользователям?

  • Распознавание почерка врачей

    Если и фармацевт распознать не может, то грех на приложение жаловаться будет. Максимум, что можно будет сделать — предложить оба варианта с вероятность «50/50» — пусть у врача уточняют.

    Кстати, чем история закончилась? Какой препарат дали? Интересно же :)
    Как вариант, дать третье обезболивающее — среднее по действию между этими двумя — и минимизировать ошибку для обоих случаев, по принципу линейной регрессии :D

    Поддержал: Denys Poltorak
  • Распознавание почерка врачей

    Уверены, что это проще реализовать? :)
    А пенсионеры — не наша целевая аудитория, вот и всё.

  • Распознавание почерка врачей

    Есть сети, умеющие предсказывать наиболее вероятые слова по соседним нескольким (ronan.collobert.com/...​b/matos/2008_nlp_icml.pdf). Есть сети, распознающие рукописные цифры и одиночные буквы. Есть такие, которые хорошо распознают печатный текст. Почему бы не объединить эти принципы для задачи рукописного распознавания?
    Может, это не реализуемо одним человеком, который ничего подобного не делал. Это да))
    Но технически это вполне возможно, имхо. Про 50-100 лет вы точно загнули.
    А насчёт ABBYY, по-моему, они не используют контекстуальный анализ, а распознают каждую букву отдельно — потому и получается не очень. Могу ошибаться.

  • Распознавание почерка врачей

    Поэтому я и создал это обсуждение. Чтоб не бросить всё и начать пилить, а определить возможность и целесообразность этого. Если можно, прокомментируйте чуть более конструктивно, в чём именно вы видите основные проблемы.
    Я их вижу в малом количестве данных. Будь у нас 10 миллионов страниц рукописных текстов, решилась бы задача? Если так, то стоит начать с создания общей базы для сбора таких данных.
    Если что-то ещё технически нереализуемо — скажите.

  • Распознавание почерка врачей

    Это я и написал, не так ли?

  • Распознавание почерка врачей

    Нет, я сказал, что перед этим её можно обучить рукописным текстам в общем, а потом — конкретно медицинским. Или я что-то путаю? А ещё перед этим — можно и печатным текстам, для максимальной отдачи от имеющихся данных. Смотрите «transfer learning».

    І я не впевнений, що АББІ вміє розпізнавати рукописне творіння а не курсив

    Хм, а вы правы. Мне казалось, может и рукописный — но теперь не могу такого найти.
    Тем интереснее задача :)

  • Распознавание почерка врачей

    Но ведь люди могут понять незнакомый почерк. Потому что есть какие-то общие принципы письма, объединяющие все почерки. Нужно, конечно, гораздо больше данных, чтобы сеть смогла обобщить и абстрагироваться от особенных «значков» и стилей. Мне кажется, основную роль здесь играет контекст и словарь, как я и писал выше.

    ми не можемо навчити її робити це заздалегідь для конкретного стилю письма

    Почему? Для конкретного стиля это как раз уже существует. ABBYY Fine Reader, например, распознаёт рукописный текст, если его перед этим обучить конкретному почерку.

  • Распознавание почерка врачей

    Пока нет, к сожалению. В первую очередь нужно разработать и обучить модель сети. А уже потом, если она сработает, вставлять её в какое-то мобильное приложение. А там всё просто: фотографируешь (в достаточном качестве) рецептик и видишь расшифровку на экране. Можно и рекомендации писать, и ссылки для покупки медикаментов, и описания — есть простор для творчества, в общем.

    Поддержал: Николай Ник
  • Распознавание почерка врачей

    Намекаете на возможность летального исхода в случае ошибки? :)
    Таки-да, нужно выдавать результат, только если система уверена в нём, а иначе — показывать возможные варианты. И везде написать, что мы не несём ответственности за последствия использования приложения))

← Сtrl 12 Ctrl →