Speech recognition в Україні, ідеї

Які на вашу думку ідеї використання розпізнавання мовлення мали б комерційний успіх в Україні?

Бо, наприклад, якщо взяти використання в кол-центрах, то платня операторів у нас досить невелика і наврядчи є сенс возитися з розпізнаванням, простіше ще людей найняти, на відміну від США.

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
1) Говорити про винайдення велосипеду або ізольованість української науки в даному випадку не доводиться. Є певний мейнстрім в розпізнаванні мовлення, ми теж рухаємося у ньому, в тому числі за допомогою опен сурсних пакетів програм західних науковців. Ніяких принципово різних технологій у нас та їх немає.
2) З покійним Кириченком я був трохи знайомим, але його аспірантом не був.

3) За ідею дякую. У нас реалізований протилежний варіант. Коли людина пише SMS, a синтезатор озвучує її для станціонарних телефонів.

2baskius — не только вы и не только флудлите, но и придаете популярности этому форуму

junior_dev, я поняла, я «к вопросу о»
вот очень жаль, что не хотят рассказывать!
не надрывать глотку, не доказывать, а просто рассказать
это так интересно! тем более, примеры...
столько бесполезной информации, и такие крупицы разумных вещей...
которыми делиться не хотят, полагая, что это «меряния» ,
а это не «меряния» (на мой взгляд) — наоборот! это примеры, информация и вообще, на этих примерах есть смысл учиться! ,
а то что же получается
столько флуда в комментах, столько желающих флудеть, и никакого толку...

наверно, я сейчас тоже флужу, да?...

это был ответ на ваш вопрос о

Оффтоп. Простите.
Вот что обидно, кстати!
Люди, которым есть что сказать и рассказать, туда идти не хотят. Стесняются?... А как раз на них и рассчитано. И как раз они и нужны.
Зато остальных, желающих получить «инвайтик», чтобы просто там флудеть в комментах — хоть отбавляй...

большинству людей которые чего-то добились или могут что-то рассказать не будут надрывать свою глотку что-то доказывая в коментах блогов или на форумах:)

junior_dev, я в мужском коллективе не первый год работаю:) в течении практически всего последнего года — единственная девушка в офисе:)
страшно после болезни возвращаться, такое... очень забавное недоумение на небритых лицах: «А ты что тут делаешь?!...», и слова поначалу проскакивают
зато на следующий день все аккуратны, и в течении пары-тройки дней и слова уходят
иногда просят наушники надеть
или «не хочу ли я в магазин за булочками сходить»

мне приятно на самом деле:)

2baskius — ну в большинстве случев меряються как раз не те у кого большой, а ноборот:) простите за возможно грубое выражение в присудствии девушки, но эти темы очень часто на форуме проскакивают

junior_dev, да, это была я, я промахнулась, простите:)
мне неудобно, конечно,

но уж так получилось, ошибаются все

это кстати не первый раз:) еще было в теме про фотик итд... мне кажеться Сереге нужно подебажить мне много форум

Оффтоп. Простите.
Вот что обидно, кстати!
Люди, которым есть что сказать и рассказать, туда идти не хотят. Стесняются?... А как раз на них и рассчитано. И как раз они и нужны.

Зато остальных, желающих получить «инвайтик», чтобы просто там флудеть в комментах — хоть отбавляй...

О! клева из под моего ника уже пишут:)

2junior_dev, я, конечно, Вас не то чтобы зову... («... Нет, Алиса. Ты именно напрашиваешься.» © Тайна третьей планеты)
Но Вам есть что сказать. Это главное. На форумах ведь пишете;)
А мысли из своей головы, тем более на интересные темы, тем более зная, о том, о чем говорите... Это всегда в почете. И как раз то, что нужно.
Вы подумайте все таки:)

это был не мой текст

Ээээээээээ...
Я не троль:)

Ну, т.е., я не зарегистрирована. Но это была я:)

2junior_dev, я, конечно, Вас не то чтобы зову... («... Нет, Алиса. Ты именно напрашиваешься.» © Тайна третьей планеты)
Но Вам есть что сказать. Это главное. На форумах ведь пишете;)
А мысли из своей головы, тем более на интересные темы, тем более зная, о том, о чем говорите... Это всегда в почете. И как раз то, что нужно.

Вы подумайте все таки:)

2baskius — большое спасибо за столь заманчивое предложение, но я не сильно подхожу на роль блого-писателя:)

junior_dev, если Вы, конечно, там еще не зарегистрированы...:)

Я бы выслала Вам инвайт, чтобы Вы рассказали. Но у меня его, к сожалению, нет: (
Зато я могу разместить статью с Вашим авторством и мылом, или, если хотите, можно сразу через «Беседку». Тема отличная!

Главное, чтобы понятно, легко и интересно было написано.

Именно! Именно общие концепты, можно без деталей.
Просто рассказать людям, что это такое концептуально, и как концептуально делается.
Это правда очень интересно!

В рамках разрешенных Вам «действий», конечно.

Мне NDA запрещает распространяться в деталях, поэтому я могу рассказывать только общие концепты и то только потому что ML не есть основной областью моей работы


но мне просто неприятно видеть отношение к продуктам собственного производства как к заведомому «г».

никто этого не говорил, просто был вопрос о преимуществах и сравнениями с аналогами, автор ни привел ни одного сравнительного эксперимента своей системы, а только говорил что другие не умеют работать с Украинским языком

junior_dev, я вот Ваши посты читаю, и так аж прямо... ИМХО, отличная тема для статьи на Хабре. И на счет того, как устроено, и что делается. Вы статью написать не хотите? Вот таким же языком? Чтобы было _понятно_? Это интересно очень.

вообще-то обычно в общем виде когда готовят ML Систему готовят большой репрезентативный набор данных, а потом его делят на 2 части training & validation, на первой части систему тренируют на 2й смотрят тренды, потому что можно за оверфитить систему так что бы она на первом дала 100%, а на втором 0%... так вот когда есть validation set то на нем так же можно и програть любую другую систему, если она на тренированая и мы хотим проверить качество в целом, и мы можем ее натренировать на наших данных что бы оценить качество модели и тренировочного алгоритма, тренировка это задача оптимизации в многоэкстримальном прострастве (NP complex) и она не имеет прямого решения и тут тоже есть куда различных алгоритмов и подходов.

Кстати что бы вы не думали что я напал на автора, я кажеться его знаю и может даже лично, если у него преподаватель Кириченко, так как как-то он нам показывал своих аспирантов которые занимаються проблемой распознавания голоса.

junior_dev, так скажите, где есть те люди, на которых можно прогнать эту систему:)

идеи просят

junior_dev

вы выберете качественый продукт, тогда странно почему вам тоже не интересно узнать о качественом сравнении решения автора и существующих аналогов?
вы выберете свой продукт не важно какого качетсва, только потому что он свой, тогда расскажите как много в вашей жизни/работе представлено Украинских продуктов при наличии более подродвинутых конкурентных аналогов?
я выберу качественный продукт, а еще вернее — я выберу свой качественный продукт (который сама делала, и за который несу ответственность), если таковой есть
мне интересно узнать про продвинутые конкурентные аналоги в любом случае, но мне просто неприятно видеть отношение к продуктам собственного производства как к заведомому «г».

Я за свою работу отвечаю, правда, я больше по биометрии, но мы пишем для наших ребят. Например, проект был для крупной конторы в Парусе (большой бизнес-центр в Киеве), люди каждый день им _вынуждены_ пользоваться чтобы элементарно прийти на работу, или прийти/уйти с работы. Конечно, мы не все делали, у нас там кусок. Но я за свою работу несу ответственность, и мне за неё не стыдно.

я стараюсь например поступать прагматично и выбирать за качество, может это и плохо, но так есть, и поэтому я этим поинтересовался, если вы готовы платить за АвтоВАЗ к примеру стоимость Тойоты это тоже ваше право и похвально, но енсли человек говорит что нужно покупать Украинское, а при этом ездит на продукте страны с которой его электорат воевал или его родители воевали, то это выглядит не сильно...

это нормальный здравый подход
продукт стоит столько, сколько за него готовы заплатить
я не буду платить за АвтоВАЗ стоимость Тойоты, это просто неразумно
она не стоит этих денег
кстати! вспомнилось
на счет качества и китайцев
все помнят стулья китайские пластмассовые?
у нас их еще не было, в Европе они произвели фурор, Европа была довольна, и закупала из по 12 баксов за штуку.
Наши тоже решили закупать, но правдами/неправдами договорились с китайцами закупать их по 4 бакса за штуку (ну, в стиле — «а мы не хотим платить 12, давайте меньше» — «а сколько хотите? » — «ну... 4! »...)
в результате — Европа так и осталась довольна стульями

у нас же они были странно тонкими и странно ломались по любому «апчхи»

Эта проверка делаеться не на людях, когда мы выпускаем Таврию и смотрим кто ее купит, а оцениваем аналог по характеристикам и пытаемся найти преимущества
и это как раз сделать очень легко достаточно определить репрезентативную выборку и на ней програть чужую систему и потом нашу и показать что вот смотрите мы на 3% лучше,

а вот как раз в большинстве Украинская наука стимулирует работать в замкнутом пространсве и разрабатывать свой велосипед, никто не говорит что он будет хуже, но нужно уметь обьяснять достоинсва своей системы и почему выбран этот путь

no, мне просто больно видеть, что делают с нашей наукой в принципе,
а еще больнее видеть следствие — мнение о ней окружающих...
на самом деле вопрос не человеко-ресурсов как таковых, и не разработок, вопрос денег
которые на науку никто не выделяет
в результате — и проекты «под сукно» уходят, и ребята уходят с интересной работы элементарно получать «нормальную ЗП» в аутсорс — конторы, и прочее
разрабатывают-то эти все штуки ребята, которые зачастую потом уходят в аутсорс...
т.е., работают над проектом именно они
что именно из биометрии Вас интересует? концепт или примеры проектов?
junior_dev, насколько я поняла, вопрос как раз в том, где можно провести такую «проверку», и посмотреть,
а заодно попробовать внедрить систему
«домашние» или «камерные» тесты продукта в отделе разработки, и тесты в промышленных масштабах дают порой кардинально противоположный результат

hellip,... и язык был бы по дефолту — кириллица:)

И хорошо, что пытаемся разобраться и сделать своё. Автору топика — так держать! Отличное дело. Я за Вас.

тут может быть 2 варианта и скажите какой про вас:
вы выберете качественый продукт, тогда странно почему вам тоже не интересно узнать о качественом сравнении решения автора и существующих аналогов?
вы выберете свой продукт не важно какого качетсва, только потому что он свой, тогда расскажите как много в вашей жизни/работе представлено Украинских продуктов при наличии более подродвинутых конкурентных аналогов?

я стараюсь например поступать прагматично и выбирать за качество, может это и плохо, но так есть, и поэтому я этим поинтересовался, если вы готовы платить за АвтоВАЗ к примеру стоимость Тойоты это тоже ваше право и похвально, но енсли человек говорит что нужно покупать Украинское, а при этом ездит на продукте страны с которой его электорат воевал или его родители воевали, то это выглядит не сильно...

сорри, имелась в виду AI Winter


яркий пример — бабаян. его проекты всегда впереди американских, но для их реализиции надо 100 млрд

и 10 лет работы.

А вот это точно, конвейерную архитектуру Эльбруса удалось реализовать в железе с опозданием лет на двадцать. Просто советская элементная база 1970-х не позволила этого сделать. А так, был бы у нас проект компьютера пятого поколения, а не у японцев:), и IT Winter пришла бы из Сибири.

2baskius — как раз можно, самый простой дизайн системы разпознавания это:
фичи или как иногда их называют в СССР вектор признаков: это данные которые вы вынимиаете из окружающей среды, для распознования голова это может быть частота, длительность, пару точек кривой, дисперсия и многое другое — тут прямая зависимость от предметной области и знаний и опыта человека в ней, чем лучше ьы специалист и чем качественее система тем правильнее набор фич
модель: Conditional Random Fields, Decision Tree, Linnear, SVM, Neuro-net итд... под каждую задачу, количество и природу фич подбираеться своя модель
и все:), а далее формируеться репрезентативный training-set и мы запускаем функцию взвешивания модели и поиска минимальной ошибки на training-set’е
так вот если взять у Американцев или Инопланетяен не важно у кого, более качественую модель с более точными фичами, мы в итоге можем получить более качественое распознаванием

это как к примеру есть алгоритм RSA он запатентованый итд... есть куча реализаций и любой желающий может взять реализацию, под себя сгекнерить ключи и криптовать, и не нужно заново ее имплементировать или придумывать новую задачу факторизации, но если ты уже придумал, то в первую очередь нужно показать превосходство или выгодность твоей новинки по сравнению с аналогом что бы люди выбрали

: 2baskius
вы все смешали в кучу. в конце каждого вашего поста, если быть последовательной, вам надо вставать и петь «ще не вмерла украина».
>> Вы, например, знаете про разработки наших ребят, которые занимаются робототехникой? Или биометрией? А я бы могла Вам рассказать
вы расскажите, тема способствует.
по поводу «под сукно». есть понятие фундаментальной науки и в нем надо заниматься всем, что б иметь определенный уровень.
другое дело реализация. яркий пример — бабаян. его проекты всегда впереди американских, но для их реализиции надо 100 млрд

и 10 лет работы.

junior_dev, а на счет БД — так Вы взяли некоррекную аналогию. Концепт БД разрабатывают американцы, архитектуру наши ребята, а сематнически её наполняют пользователи.
Так вот американские аналоги разработок с распознаванием речи, насколько я поняла, нельзя наполнить СВОЕЙ архитектурой. Понимаете? Данные СВОИ нельзя внести. Архитектуру СВОЮ нельзя там создать.

Разница в этом.

junior_dev, на счет Таврии. А Вы знаете, что Таврия — это не новый проект? Это проект, который был в Советском Союзе отправлен «под сукно». Видимо, тоже решили «не изобретать велосипед». А для своего времени была весьма прогрессивная разработка.
То, что её продержали там столько лет, и вытащили только сейчас — так то же самое будет и с продуктами, которые разрабатываются у нас. Вы, например, знаете про разработки наших ребят, которые занимаются робототехникой? Или биометрией? А я бы могла Вам рассказать. У нас пока с радужкой, по-моему, сложности. Но уже есть потенциальные возможности вести эти разработки. А по отпечаткам пальцев — так давным давно. Другое дело, что часть прогрессивных разработок с той же биометрией так же находится грубо говоря «под сукном». Видимо, не хотят изобретать велосипеды. А потом поздно будет.

Как с Таврией.

2baskius — дело не в производстве, а в производстве конкурентного решения, вот какими высокотехнологичными или индустриальными плодами Украинской науки вы пользуетесь?
у вас машина — Таврия, радио — Маяк, плита — Мрия итд? у нас есть много чего своего.
я у автора продукта спросил просто про сравнительный анализ с аналогами

насчет Оракла и если вы имеете ввиду БД, то я имел ввиду аналогию что они разрабатывают концепт БД, структур хранения данных которые поддерживают мультиязычность и они ничего специально для Украины не делают, все остальное делают DBA уже на украинской стороне, и делают это не американцы, а Украинские ребята которые тусят на этом форуме.

Всегда в Африке найдется один негр, который будет учить эскимоса на лыжах кататься.

junior_dev

Американцы про это не знают

ой ли? Не знают, что ставят где-то Оракл?:) Ой ли. Ну, бесплатный Оракл ХЕ (по-моему), конечно, досутпен всем. А вот за остальные нужно платить. Т.е., компании — разработчики становятся партнерами, и получают его бесплатно. Пользуйся — не хочу. Но всем, кому они предлагают свои продукты на Оракле они

обязаны

ппедоставлять его платно.
На счет темы топика. У меня складывается такое впечатление, что Вы не разбираясь в предмете разговора пытаетесь доказать, что разработки у нас априори — г-редскостное, и лучше взять чужое, а там переделать. «Не будем изобретать велосипед». Во-первых, свои технологии (алгоритмы, например) разработчики бережно хранят «коммерческими тайнами». Технологии еще и патентами защищены. За патенты нужно платить. Если бы они были открыты — тогда, возможно (!) имело бы смысл. Но даже закрытые технологии берут китайцы, при чем даже не воруют, а вполне официально. Они у них все есть. Там подход — производство у нас? сдай нам технологию в наш департамент какой-то, а мы будем молчать.
Если ничего не пытаться сделать лучше чем есть, и не пытаться разобраться в том, что есть — прогресс будет стоять на месте.
Почему у нас нет производства своего? Вот потому что некоторые юниоры не хотят ничего делать своими руками, а просто пытаются взять чужое. При чем, не разбираясь конкретно, ЧТО берут.

Наши разработки имеет место быть. Робототехника, биометрия, распознавание речи — все (на мой взгляд) только в плюс. И хорошо, что пытаемся разобраться и сделать своё. Автору топика — так держать! Отличное дело. Я за Вас.

2hellip -, а причем тут Манин к machine learning? я что-то не нашел ни одной публикации его в этой области

это, во-первых, не мои слова, а Манина

его слова привели вы, и наверное с каким-то смыслом:) что ж тогда вы наверное и готовы обьяснить этот смысл
Если даже принимать в сравнение взрослого человека то вы опять сравниваете апельсины с яблоками: взрослый человек имеет training set куда больший чем любая система и более того training-set строиться на базе features человека, потому что человек придумывает звуки которые он различает и произносит лучше всего, ведь у нас же нету буквы на звук «царапания языка зубами» потому что другой человек не разберет его?
то есть с одной стороны человек который все сделал под себя и обладает большой БД, а по другую машина?:) конечно в большинстве случаев она проиграет, так же как програет к примеру Австралиец живущий 2 года в Москве и коренной росиянин в распознавании русской речи.
если вас сильно интересует ML посмотрите чего творят ребята из стенфорда для своих работ: www.youtube.com/watch v=UzxYlbK2c7E& feature=PlayList& p=A89DCFA6ADACE599& index=0

2SpeechRec кстати насчет идей где это может понадобиться, у нас на работе стоят умные телефоны, и если кто-то не дозвонился то можно оставить сообщение, оно потом распознаеться как текст (очень кстати даже не плохо) и отправляеться письмом... возможно подобную идею можно предложить Украинским мобильныи операторам как фичу если человеку звонят, а он вне сети, то ему СМСкой высылаеться сообщение, и как только он случайно в сеть забредет он сможет сразу прочитать.

даже если взять родной язык, то не ужели вы как только родились сразу понимаете о чем идет речь?

Нет. Но Манин и не о детях говорит.

то есть натренироваться да и сравнивать машины с языком человека это заведомо biased эксперимент, потому что этот язык и звуки придумал человек и они подстроены под его рецепторы и ретрансляторы дабы удобнее было пользоваться

Согласен, но такие эксперименты предпринимались и будут предприниматься просто в силу человеческой лени, ну еще по маркетинговым соображениям. И давайте не будем забывать о людях с дефектами зрения. Им голосовой ввод информации жизненно важен.

как-то даже обсуждался звук Ш в японском

ага, в слове sushi 8)

куда было коректнее сравнить качество распознавания машиной человека, против качества распознования человеком машиных звуков

Слабый вариант теста Тьюринга, нет? Милости просим. Копий сломано немерено за семьдесят лет после опубликования его первых работ.

А не простіше створити який-небудь “кібер есперанто” або “лінгво хумано-макіна” для вербального спілкування людей і машин, лаконічиний і зрозумілий обом сторонам, замість того щоб адаптувати існуючі мови, в яких куча виключень, різних нашарувань, неоднозначностей і т.д. і т.п.?

Ну, попытка создать язык без исключений, наслоений и неоднородностей, иллюстрирующих эволюцию и индивидуальные различия говорящих, в литературе описана: en.wikipedia.org/wiki/Newspeak

Питання таке,
А не простіше створити який-небудь «кібер есперанто» або «лінгво хумано-макіна» для вербального спілкування людей і машин, лаконічиний і зрозумілий обом сторонам, замість того щоб адаптувати існуючі мови, в яких куча виключень, різних нашарувань, неоднозначностей і т.д. і т.п.?
Чи все ж достатньо для системи розпізнавання фраз а-ля:

«чукча хотетєть кушать»

2hellip — даже если взять родной язык, то не ужели вы как только родились сразу понимаете о чем идет речь?:) человек несколько первых лет своей жизни как раз учиться говорить и понимать:), а не сразу рождаеться ученым:) или вы родившись сразу же моги разобрать «монохлорангидрид cерной кислоты»? я например не могу похвастать даже распознаванием текста в песнях на родном языке:) да и иногда последлительного общения в иностранной среде, слова родного языка почему-то слышаться как непонятный набор иностранного:)...

мозгу тоже нужно время что выстроить асоциативные связи:) то есть натренироваться да и сравнивать машины с языком человека это заведомо biased эксперимент, потому что этот язык и звуки придумал человек и они подстроены под его рецепторы и ретрансляторы дабы удобнее было пользоваться... вы это легко прослидите по разнице в звуках для разных народностей (как-то даже обсуждался звук Ш в японском)... куда было коректнее сравнить качество распознавания машиной человека, против качества распознования человеком машиных звуков:), но это пока что фантастика

junior_dev, уважаемый, это, во-первых, не мои слова, а Манина, вот о нем подробнее здесь: www.mpim-bonn.mpg.de/...ers/Manin, Yu

Во-вторых, я так думаю, что приведенная цитата относится к восприятию прежде всего родного языка, а не иностранного.

2hellip

«Другая менее впечатляющая, но ничуть не менее ресурсоемкая задача — распознавание и генерация речи, которая пока не под силу современным компьютерам, использующим классические алгоритмы, но без труда выполняется головным мозгом любого из миллиарда людей»

это все сказки... когда вы приежаете в страну с другим языком и если вы уже не имеете большого опыта с ним (читай ваши рецепторы не на тренированы) то вы не сможете различать в должной мере что люди говорят вокруг и только через время ваши уши, мозг привыкнут (на тренируються) и тогда вы сможете понимать о чем идет речь

2no

У Радянському Союзі мало хто займався розпізнаванням на серйозному рівні. Усього кілька відомих у світі прізвищ. Даний джентельмен явно до них не належав.

многие попробовали себя на этом поприще и закрыли проекты. можно вспомнить dragon dictate от ibm. посему, тема явно не имеет перспективы.

Якщо розпізнавання вже затребуване на Заході, то і у нас має перспективи. Це питання часу. Я про дикторонезалежне телефонне розпізнавання.

еще в 80 годах, в дгу, некий джентельмен... фамилии которого я не помню, занимался распознованием речи на EC.
по его утверждениям, задача распознования речи практически нерешаемая из-за наличия схожих гласных и взрывных согласных.
’о’ и ’а’, ’п’ и ’т’., а уж если голос выбился из базового — капут., а занимался он чисто академически.
однако его мучения были на порядок лучше, чем приведенный вверху ролик на трубе.

многие попробовали себя на этом поприще и закрыли проекты. можно вспомнить dragon dictate от ibm. посему, тема явно не имеет перспективы.

Ну розпізнавання в Windows це більша іграшка. Чи є воно чи його немає 99.999% користувачів байдуже

И то правда

"Другая менее впечатляющая, но ничуть не менее ресурсоемкая задача — распознавание и генерация речи, которая пока не под силу современным компьютерам, использующим классические алгоритмы, но без труда выполняется головным мозгом любого из миллиарда людей“© Юрий Манин “Классическое вычисление, квантовое вычисление и алгоритм факторизации Шора”


не воспринимайте это как оскорбление, скорее ремарка:

так оно и вышло судя по вашим аргументам:) как и с Таврией мы круты только потому что кроме нас тут никто не делает (до поры до времени пока СССР не закончился)

Так само як і 90% країн Європи

скажіть, а є якась різниця в мовленнєвому сигналі з гарнітури і телефонному сигналі для кол-центру?

тогда в чем смысл этой темы? само-пиар?

І це також)) Але головним чином усе-таки виявлення дійсно потрібних застосувань розпізнавання.

Насколько мне известно, сейчас в достаточно большом числе мест отказываются от автоматических систем обработки звонков из-за интуинивной непонятности и низким user satisfaction.

не воспринимайте это как оскорбление, скорее ремарка:
так оно и вышло судя по вашим аргументам:) как и с Таврией мы круты только потому что кроме нас тут никто не делает (до поры до времени пока СССР не закончился)

что ж тогда будем надеяться что никто другой не покуситься на это во благо развития Украинской науки

Multi-lingual Support: Talkback can create applications in different languages. This is subject to your provider making available support for different languages.

www.inferencecommunications.com/...erenceguide.pdf

Спасибі, посмішили))

пожалуйста, наверное вы никогда не видели как можно через COM управлять приложением офиса:), а если оно может принимать и распозновать речь и хотя бы вводить в текстовую область Word то задача распознавания решена, дальше проблема интеграции этой системы с БД таксопарка для выявления свободных машин, модуль логистики для выбора оптимальной и понеслась:)...

я рад что так просто принести радость в ваш дом

Регулярно кілька разів на рік звертаються.

тогда в чем смысл этой темы? само-пиар?

а вы не думали что это приложение можно разработать на раз-два испоьзуя API или на базе того же Офиса?

Спасибі, посмішили))

тогда у вас не дожно быть проблем с инвесторами

Регулярно кілька разів на рік звертаються. Потім ознайомлюються з тим, що таке розпізнавання і на 90% відсіюються.

Ось, наприклад, реально діюча програма www.inferencecommunications.com/Home перевести її з англійської на іншу ніяк не можна, без того, щоб самі розробники програми цим не займалися.

:), а вы не думали что это приложение можно разработать на раз-два используя API или на базе того же Офиса?
поймите это не моя работа и не моя задача придумать зачем и почему нужен ваш продукт и почему именно ваш — это ваша работа:)
я вот сейчас вам показал как кто-то мог бы решать эту проблему если бы call-center нанял для реализации этого проекта

если вы считаете только вы и только вы способны это сделать:) тогда у вас не дожно быть проблем с инвесторами

Ну розпізнавання в Windows це більша іграшка. Чи є воно чи його немає 99.999% користувачів байдуже. Так само як і в мобілках.

Я мав на увазі серйозний продукт, який би реально працював і приносив гроші. Наприклад, у кол-центрах.

support.microsoft.com/kb/306901

They can also use different voices allowing for regional accents such as British English, or use a different language altogether such as German, French, or Russian.

The Microsoft speech recognition engine enables you to insert text into a document using specific programs. You can dictate text in any Office XP program, in Internet Explorer, and in Microsoft Outlook Express (versions 5.0 or later). Other software programs may eventually support the Microsoft speech recognition engine.

и это только Win XP вполне возможно что поддержка Украинского есть в Win7.

если вы о коробочном продукте под ключ, то я часто встречал что с такими продуктами за доп плату, а иногда и без нее, шло SDK дабы можно было воспользоваться прелестями уже разработаных технологий.

У мене склалось враження, що ви не зовсім розумієте специфіку завдання:)
Конкурентів у нас немає)) Одна фірма захотіла мати у своїй програмі вбудоване розпізнавання на укр\рос мові. Незважаючи на те, що поїздили по світу на конференції по розпізнаванню довелося звернутися до нас для співпраці. Співпрацюємо. Хоча спочатку думали теж, що можна купити готове рішення і щось там змінити.
Коли став потрібним український синтез вже іншій компанії знову звернулися до нас.

Тому що ви не можете нічого змінити в готових комерційних рішеннях, які є на Заході, у плані мови. Ви ніяк не можете перейти на іншу мову. Ви не можете дати інший набір даних, щоб система натренувалася. Хіба що розібрати програму на асемблерний код і переписати заново або просто викупити його.)) Розвернути ERP систему у порівнянні з переходом на іншу мову це завдання для дитсадка.:)


Так і не зрозумів це серйозно чи гумор)).

Да ладно, согласен, пусть будет шутка. Действительно, априори флективные языки считаются в общем сложнее аналитических.

и как это затрудняет распознование?

ЯТП, вы имели в виду частный случай перевода устной речи с русского на английский, нет?

Хто цим буде займатися? Американців на даному етапі наш ринок не цікавить і вони нікого наймати для переробки системи не будуть.

наши же ребята и будут заниматься:) или вы думаете что бы развернуть ERP системы на наших предприятих Oracle & Microsoft приежают разворачивать?:), а там для внедрения тоже кучу всего нужно сделать.
просто как вы сказали в одном из первых постов — у вас система не готова, и тут нужно понять захочет ли кто-то ее доводить до ума или возьмет готовое, а дальше будет как с ERP, OS итд... их пишут там, а народ внедряет тут и Американцы про это не знают, но это не мешает их внедрению тут

ладно, дабы не сводить этот разговор к 10 му кругу:) как я понял вы не сравнивали вашу систему с аналогами и не пробывали их тренировать даже на ваших же данных для сравнения качества, а ведь это так просто померять P/R и после этого говорить что американская система на Украинских данных обучаеться на 10% хуже нашей... вот тогда потребовалась

наймати для переробки системи

ну, а если бы получилось бы в обратную сторону то был бы повод задуматься и подтянуть качество

желаю удачи в ваших начинаниях:), но в рыночной экономике рекомендую задумываться о конкурентах

в большинстве случаев потребители не являються внедренцами системы, то есть если вы прийдете в автопарк для установки системы (если это не банальный откатинг) то им нужно будет предоставить характеристики вашей системы и сумму сколько это будет стоить под ключ... и скорее всего они спросят в чем преимущества по сравнению с конкурентами
вот например вы проводили исследование в преимуществах вашей системы по сравнению с аналогами?

вы же наверняка разработали свою модель, выбрали свой feature-set, написали свой алгоритм тренировки, и вот вопрос в чем они лучше конкурентов? ведь для обучения вашей же системы вы тоже создавали training & validation sets итд... и вот вопрос стоило ли изобретать свою модель и прочую инфраструктуру, а не использовать уже готовые решения? вот вы же например используете STL, но не реализуете структуры данных по своему, если только нет конкретного случая когда стандартных не хватает, тоже и с моделями и алгоритмами

просто мне видеться куда более простой задачей подобрать репрезентативный training-set нежели писать заново все системы

Хто цим буде займатися? Американців на даному етапі наш ринок не цікавить і вони нікого наймати для переробки системи не будуть. А споживачі нічого зробити не зможуть з системою.

2SpeechRec

А як можна “просто натренувати американську систему”?

ну вот вы и сами ответили на свой вопрос:)

потрібно хоча б 100 годин реальних телефонних записів, які потрібно обробити і на їх пронавчатися.

просто мне видеться куда более простой задачей подобрать репрезентативный training-set нежели писать заново все системы, в принципе я не хочу сказать что ваша работа не нужна:), но вы сами сказали что она не готова к применению, и наверняка же проводили качественое сравнение с аналогами? вы же понимаете что-бы локализовать к примеру Винду нужно тоже перевести десятки тысяч ресурсов на целевой язык, но с комерческой точки зрения это выгоднее чем писать Windows.RU.
Хотя есть другой удачный пример 1С, но там скорее разница в подходе ведения учета, да и серьезные ребята себе все же зарубежные ERP-системы ставили, насколько я знаю.

2hellip

Зато есть полиморфность языковых объектов; например, глагольный конструкт часто образуется путем прибавления частицы to к существительному.

и как это затрудняет распознование?

Да, к тому же в английском расхождение между написанием и произношением значительно больше. То есть, распознавание русской/украинской речи представляется менее сложной задачей:)

Так і не зрозумів це серйозно чи гумор)).

Слов’янські мови важчі для розпізнавання ніж англійська для зв’язного мовлення через закінчення та змінний порядок слів у реченні.

в английском нет игры окончаний, суфиксов, упускаемых граматических обьектов в предложении

Зато есть полиморфность языковых объектов; например, глагольный конструкт часто образуется путем прибавления частицы to к существительному.

доморощеный Аналитик:

tinyurl.com, однако, придуман для такого.

Кстати, это только я один такой, что после того, как запостил, проверяю кликаются ли в моем сообщении ссылки?!


например нашлся кол центр, например заказа такси:

так вот собственно вопрос в том:) чи не будет ефективнее, взять американскую систему и просто натренировать ее на украинскую и русскую речь?, а не доводить до ума вашу?

А як можна «просто натренувати американську систему»?

Для створення дикторонезалежного розпізнавання потрібно хоча б 100 годин реальних телефонних записів, які потрібно обробити і на їх пронавчатися.

2hellip

Да, к тому же в английском расхождение между написанием и произношением значительно больше. То есть, распознавание русской/украинской речи представляется менее сложной задачей:)

возможно если у вас был такой экспириенс в этом то да, но насколько я сталкивался с формами языка, то русский был сложнее, так как в английском нет игры окончаний, суфиксов, упускаемых граматических обьектов в предложении, как: «холодно.» или «it’s cold» хотя опять же если у вас тут был большой опыт то вам виднее

я веду к тому что американцы могут быть не заинтересованы двигать Java например на просторах родины, но сами програмисты и ИТ отделы выберут его, а не к примеру доморощеный Аналитик:)
ru.wikipedia.org/wiki/Аналитик (%D1%8F%D0%B7%D1%8B%D0%BA_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F)

все зависит от гибкости, простоты и самое главное применимости на просторах бизнеса решения

например нашлся кол центр, например заказа такси:
так вот собственно вопрос в том:) чи не будет ефективнее, взять американскую систему и просто натренировать ее на украинскую и русскую речь?, а не доводить до ума вашу?

ведь наверняка там модели точнее, алгоритмы минимизации ошибки и защиты от overfitting лучше разработаны чем у вас? если нет...:) тогда берете test-set и показываете амерам что их система хуже вашей и тогда они сами у вас купят, а если это не так, то скорее всего с точки зрения качества результата будет выгоднее использовать их вариант

Звичайно, якщо б наш ринок серйозно зацікавив американців, то це була б інша розмова. Але на даний момент він їх не цікавить. Та й якщо б цікавив, то найбільш імовірно, що вони б для локалізації найняли нас. В усякому разі так уже вчинили з синтезом мовлення для SMS.

Ну і у споживача вибору немає. Або нашу доводити, або чекати невідомо скільки на американців. Бо сам він ніяк не зможе локалізувати систему.

но вы же превосходно понимаете что концепты одни и теже, различие лишь в базе обучения и лексико-графическом словаре

Да, к тому же в английском расхождение между написанием и произношением значительно больше. То есть, распознавание русской/украинской речи представляется менее сложной задачей:)

но вы же превосходно понимаете что концепты одни и теже, различие лишь в базе обучения и лексико-графическом словаре,
то есть если у американцев есть хорошая система распознавания голова, то какая разница какие звуки и на каком языке они звучат?
хороший пример с Yandex и Google, Ya ориентирован только на российский рынок потрачено много сил и нервов, а потом G! просто локализовал свои алгоритмы и все...:)

таже ситуация и тут, как вы сказали парой постов выше, система не готова к комерческому применению AS IS и тогда вопрос не будет ли выгоднее, дешевле локализовать уже зарекомендовавшую себя и готовую систему чем доводить до ума вашу?

а в чем конкурентное преимущество по сравнению с готовыми американскими решениями?

Мова. Я не зустрічав в Україні і для російської рішень, а для української тим більше.

просто в украинской науке часто встречал повторно изобретеный велосипед не дотягивающий до аналогов, единственое преимущество которого это то что он свой:) ,

но вот на примере Таврии можно хорошо увидеть что для бизнеса это не аргумент

а в чем конкурентное преимущество по сравнению с готовыми американскими решениями?

Поки що є тільки розпізнавання. Готового рішення для кол-центрів немає. А для того, щоб вбудувати розпізнавання в кол-центр потрібні і час, і праця, і фінанси.

якщо взяти використання в кол-центрах, то платня операторів у нас досить невелика і наврядчи є сенс возитися з розпізнаванням, простіше ще людей найняти, на відміну від США.

це означає що ваш комплекс із розпізнавання дуже дорогий?

Щодо субтитрів. При новинах диктори читають тексти, тобто субтитри вже є, а для фільмів і людина може їх написати.

Розпізнавання мовлення на відміну від розпізнавання зображень (облич) локалізоване, тобто ми працюємо з українською та російською мовами. До англійської ще не прийшов час.

Можливо ще є шанс якимось чином повторити успіхи української компанії www.viewdle.com тільки не для відео, а для аудіо.

Мені здається що такі системи можна застосувати на телебаченні для субтитрів (не знаю як це робиться зараз).

Якщо під Інститутом кібернетики розуміти МННЦІТС, то це наша (в тому числі і моя) система.: -)

Бачив демонстрацію системи розпізнавання голосу в Інституті кібернетики, правда не знаю чи десь впровадили.

Теоретично розпізнавання має бути затребуваним там де накопичено багато записаних БД, наприклад в кол-центрах, для пошуку слів. Але це теоретично.

Вспомнился ролик:

www.youtube.com/watch v=KyLqUf4cdwc

Гадаю, голосове введення інформації до комп’ютера, навіть при безкоштовності програми, для пересічного користувача ніякої користі не несе. Руками ввести текст простіше.

Недавно сон видел на эту тему.
Я и зазывала. Сидим в небольшом фургончике в районе студенческого городка (КПИ).
В громкоговоритель орем всякие рекламные речевки. Основной смысл «Харе студент барабанить по клавиатуре, мы предлагаем голосовой ввод!!! ». Возле фургончика скапливаются студенты, мы в качестве рекламного хода настраиваем прогу для нескольких длинноногих красавиц,

бесплатно. Дальше продаем как пирожки довольным студикам. Основная мысля — что программа настравается индивидуально под пользователя.

успіх на українському ринку будуть мати ті системи, розробники яких дають більші відкати.

+1 Знакомые внедряли разработанную ими — же систему по автоматизации раскроя. Когда товарищи узнали, что отката не будет стали придираться к каждой букве, пытались найти огрехи — не вышло

Я думаю, успіх на українському ринку будуть мати ті системи, розробники яких дають більші відкати.

Підписатись на коментарі