Сучасна диджитал-освіта для дітей — безоплатне заняття в GoITeens ×
Mazda CX 5
×

Акустична модель для української мови

Добрий день, шановні колеги! Зараз я розробляю один додаток, в якому використовується розпізнавання мови, але цей додаток повинен працювати оффлайн. Тож було вирішено використати CMUSphinx. Але тут ми зіткнулися з іншою проблемою — відсутність акустичної моделі для української мови (а саме її треба розпізнавати). Є можливість побудувати українську модель, але для цього потрібна немала кількість матеріалу і, бажано, різних голосів.

Для збирання матеріалу створено спеціальний сайт. Тож я прошу вас про допомогу, а саме перейти на сайт та прочитати кілька рядків українською мовою. Ось посилання:
www.voxforge.org/uk/read

Зі свого боку обіцяю викласти готову модель у вільний доступ на тому ж сайті. Заздалегідь дякую за вашу допомогу.

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Желательно только носителям языка надиктовывать, или можно попробовать тем, у кого родной язык русский?
Кстати, нет ли тут ошибки (текст с сайта): Коли буде можливіть записувати? — ??

не бачу кнопки запису. Хоч і поновив Java :(

Треба використовувати браузер Mozilla Firefox.

Ви не розглядали можливість автоматизувати побудову моделі за допомогою вже начитаних аудіо матеріалів, наприклад аудіокнижок?

Це ми зараз теж робимо. Але для тренування моделі потрібні wav файли 8кГц 16 біт, довжина повинна бути 5-30 секунд, з однією секундою тиші на початку та в кінці, без інтонаційних пауз. Щє потрібно певним чином розбити текст. Тож одна година роботи з книгою дає п’ять хвилин матеріалу. А його треба 10 — 50 годин, надиктованого 200 голосами. Тому будемо вдячні за будь яку допомогу.

Намагався зробити тестовий запис, але отримав ось таку помилку: take.ms/Gz2cl
Хтось знає, як пофіксити?

Спробуйте змінити тип мікрофона.

Коментар порушує правила спільноти і видалений модераторами.

Підписатись на коментарі