Как американцы слышат русский

Кто знает английский на высоком уровне — сталкивался с их «особенными» звуками, которые не воспринимаются на слух без подготовки. Но оказывается, русский для них точно так же билеберда.

Вот пример: распознаватель речи Гугла (далеко не самый худший) натравили на распознавание русской речи. Притом все слова он знает, это мультфильм для самых маленьких. И проговаривается чётко.

Если начнётся третья мировая — я уже знаю почему. А вы — постелите помягче под столом. При просмотре включите русские субтитры. И пятничного вам настроения!

www.youtube.com/watch?v=bBa2iLtk2CI

👍НравитсяПонравилось0
В избранноеВ избранном1
LinkedIn
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

А как драконыч слышит? Вроде ж был лучший модуль распознавания русского.
www.nuance.com/...ragon/index.htm

занудное — думаю тут полфорума знают почему это произошло — скорректированные «синтетические» голоса потеряли много инфы, нужной для распознавания ну и дальше понятно — система (нейросетка) тренированная на реальных голосах лажает как может

Возможно по той же причине нет нормальных синтетик русского. Это не столько частотная модель, сколько тайминги физической. Для смены тональности нужен переходной процесс, а согласные — и вовсе являются только переходом. В английском в принципе нет столь резких переходов, даже звук «ц» скорее гласный. Представляю что слышат китайцы, у которых этих звуков «ц» полтора десятка оттенков.

На самом деле с русским они облажались, поскольку статистическому словарю скормили информационную свалку, на 99,99% состоящую из спама. Хотя у этих клоунов под руками есть мыло, и натиспам этого самого мыла. В прямом смысле имеющий готовую статистику и фильтры.

Гугл на этом конкретно попалился, показав что на самом деле он индексирует. И насколько его информационная модель мира является «вершиной айсберга».

Плохая новость в том, что Гугл фактически за нас определяет, что нам будет интересно. Стимуляруя одни ресурсы, и понижая другие. Это говорит что Гугл на всех парах устремил поиск по линии наименьшего сопротивления, оказывая предпочтения пустой болтовне. И соотвественно его рекламаная модель устремлена туда же.
С одной стороны, это плохо, формируется экономический пузырь. С другой — это свободная рыночная ниша. Которую можно занять, сформировав компанию даже на 8-10 человек.

Как можно обосновать интуицию? :)
Особенно после

Для смены тональности нужен переходной процесс
В английском в принципе нет столь резких переходов,
Попробуйте пообщаться с носителями языка,си их резкими изменениями в интонации и проглатывании звуков через нос.
И напоследок — создайте компанию из 10 человек и захватите весь мир.

Я и не говорил о захвате мира. Но продукт мирового уровня создать можно. Проблема видишь ли в том, что при всей его успешности, в корне лежит весьма простая и примитивная идея, которая копируется за секунды. Хватит кому-то сболтнуть или догадаться — и всё, продукт в газенвагене.
Естественно я ещё не скажу, тем более что её можно выразить 1 словом. Но я уже первый пользователь, и собираюсь использовать выгоду в другой проекте. Заодно и идею откатаю, проверю есть ли сходные. 100% что есть, и лучше иметь весь комплект.

простая и примитивная идея, которая копируется за секунды
И они все, сцуки , идеи сразу же и патентуют, особенно в американских стартапах. И если захочешь идею перенять — суд обеспечен, знаю не по наслышке.

Там и патентовать нефиг. К тому же социальную инженерию особо и не запатентуешь, тем более когда это не идея, а открытие, и сделанное психологами уже почитай полторы сотни лет назад.

Я тут как раз на один патент наткнулся — офигел просто. Или я ёж африканский, или патентовать вообще можно что угодно, пофиг что изобретению сотни лет.

Кстати, не подкинешь какое-нить короткое чтиво касательно патентной системы Пиндостана? Многабукав ниасилю, а так, ключевые вопросы, типа «что если запатентовать мяч». Что-то мне подсказывает, что можно левый ботинок запатентовать, под названием «устройство горизонтально-высотной компенсации правого ботинка».

Также интересно «частичное» нарушение патента. Предположим, есть кирпич, на 2см длиннее обычного — изобретение давно известно и продаётся. Есть жёлтый кирпич — изобретение данво известно и продаётся миллионами. Стартап УЖЕ запатентовал жёлтый кирпич на 2 см длиннее обычного, при этом применение идентично как той области где традиционно применяется жёлтый, так и той области где традиционно применяется длинный. Как запатентовал — не спрашивай, не знаю. Внимание, вопрос: могу ли я теперь выпускать обычный жёлтый кирпич, но применять его в той области где применялся ранее длинный — будет ли это нарушением патента? При этом если кирпич явно будет заявлен для длинных применений.

Вопрос реальный, словом «кирпич» я заменил другой предмет. Но суть та же — форма и цвет.

Отдельный вопрос по оплате патентов — есть ли какие ограничения по стоимости пользования, либо так называемый «автор» может заломить любую цену?

Кстати, не подкинешь какое-нить короткое чтиво касательно патентной системы Пиндостана?
На этом юристы зарабатывают, все вопросы к ним. Разве что в Америке все патенты выложены в открытом виде — гуглится легко.
будет ли это нарушением патента?
А это уже, милчеловек, зависит от того, у кого юристы зубастее, кто сможет убедить присяжных в том, что было нарушение, или не было. Никто тебе гарантий никаких не даст.
«автор» может заломить любую цену?
Патент ведь нужен для того, чтобы не делиться доходом от реализации идеи с другими, а не чтобы никому не дать из принципа. И все завист от цены вопроса: если патент принесет миллион долларов, а ты предлагаешь два — может и продадут. А может и не продадут, в надежде, что ты предложишь больше. А может, пока будут надеяться — ты и спрыгнешь с темы. Так что заламывать цену тоже невыгодно, т.к. все делают ради того, чтобы просто выгодно продать. А не повесить на стенку в рамочке.

Да и патент ведь выдается не вообще, а в определенной стране. Так что, можешь что-то запатентовать успеть, например, в Монголии :)

Отличная идея. А в каких странах ещё есть патенты на в открытом виде?

А еще контекстные грамматики, так как тот же гугл не использует контекстную грамматику. Правда это 100500 к сложности вычислений.

скорректированные «синтетические» голоса потеряли
Какие синтетические? Это обычные люди озвучивали :)))
Какие синтетические?

Насколько я слышал, все озвучки Клары Румяновой имеют ускоренный звук.

Именно на этом мультике, если замедлить воспроизведение на 20% (в mplayer — двумя нажатиями ’[’), получатся нормальные взрослые голоса в нормальном темпе.

Насколько я слышал, все озвучки Клары Румяновой имеют ускоренный звук.
www.youtube.com/...h?v=WHDeh_sn1sc

www.youtube.com/...h?v=a9xzwLqFxgo

Хм... уговорил, речистый:)

даже если так — «уникальность» голоса решает

Как будто обычный человек никогда не кривляется.

там английские сабы прописаны грамотно кем-то. А русские — автоматические

Так с автоматики ж и улыбаюсь. Насколько годами натасканный на инглиш автомат, напичканный передовыми технологиями статистического распознавания от Гугля, облажался на детском мультике.

Шутки шутками, но доля правды в том что Гугл, имеющий доступ ко всей текстовой информации, за последние годы всё меньше понимает о чём мы говорим. Что на самом деле, имея мегатонны Навального в новостях, реальным людям он глубоко похрен. Что от роста количества грязевых потоков, люди не изменились — они как и прежде думают о себе.

Я считаю, что этой идеей можно поднимать новый поисковик. Который в отличие от Гугла, нацеленного на познание мира, и Yahoo-подобных, рассчитанных на светское общество, будет эгоцентристским. Конечно не хотелось бы поднимать с нуля, а вот копнуть тему стоит — на предмет хорошо забытого старого.

PS. У меня получилось. Hello, world! Here I go!

не, это уже не прикол, а реальная торговая марка, с рекламы которой по ТВ угарали всем двором

Результаты распознавания приблизительно соответствуют объему работы, проделанной для конкретного языка корпусными лингвистами за два последних десятилетия, как минимум. К примеру, сравните объем и качество ресурсов для English и Russian, приведенных здесь.

Мой пост — страшный оффтоп, но эта тема — реально самый короткий пост от Алексея Пение и даже понятно что написано! :D

Порадували кошерні англійські саби
Oh, clouds, silver-maned horses,
Oh, clouds, why are you running so fast ?
:)

Да ну, английские сабы вполне адекватные :-D

Там надо русские (которые автоматические)

Да я понял, там такая ересь, что даже не смешно :-)

Добавляй к сказанному как комент :)
Вот когда американец, изучающий русский, попробует понять его в серьёзном деле — будет столь же не смешно.

Подписаться на комментарии