Нечеткий поиск
Підписуйтеся на Telegram-канал «DOU #tech», щоб не пропустити нові технічні статті.
День добрый.
Возникла задача реализовать нечеткий поиск слов русского языка — при этом учитывать
1. Похожесть букв (т.е., например, расстояние между «д» — «т» меньше, чем между «д» и «у» )
2. Возможные пропуски \ лишние буквы
3. Перестановки букв ( «НИШПУК» — «ПУШКИН» )
Иными словами, на входе имеем два слова, на выходе — расстояние между ними с учетом вышеперечисленного.
Может, кто-нибудь с подобным сталкивался? Посоветуйте литературу (желательно — в форме статей)
Спасибо.
90 коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів