Демо розпізнавання української мови за допомогою проекту DeepSpeech

Всім привіт! Минулого року я писав заклик до наповнення набору даних із записами фраз українською мовою dou.ua/forums/topic/30192

На основі зібраних даних за період січень-червень 2020 я натренував нейромережу за допомогою transfer learning, подивитись на демо можна тут voice-recognition-ua.herokuapp.com

Розпізнає неточно через брак даних, тому долучайтесь до наповнення датасету на сайті проекту Common Voice: commonvoice.mozilla.org

Інструкція як натренувати самому і сам код є тут: github.com/...​nhad/voice-recognition-ua

👍НравитсяПонравилось7
В избранноеВ избранном2
LinkedIn
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

І як в порівнянні з Speechnotes app?

Когда наполните датасет, разделите его на обучающий и тестовый, тогда и сможете оценить.

Тогда им не понравится оценка :)

вже розділений, Character Error Rate 36%
в основному через брак даних

Character Error Rate 36%

Кто???
Вообще-то WER юзают. Более приличные еще прикладывают характеристики датасета, от частот слов в нем, до описания качества звука там и стилистики и словаря.

Ребята, если беретесь за тему и пусть даже тупо по туториалам, то хотя бы немного почитайте по теме, хоть популяризованного.

Сразу скажу, современные движки позволяют достигать WER меньше 5% на больших словарях в условиях качества старых телефонов (тех, где еще колесико крутили).

гляньте самі в репозиторії, посилання є в пості
перед тим як коментувати, хоча б прочитайте

И не собираюсь, максимум прочитаю то, что ты тут напишешь.

Подписаться на комментарии