Опублікував також велику ONNX модель (1 млрд параметрів) — 1.1 GB і квантизовану (300 млн параметрів) — 300 mb — github.com/...smkv/ukrainian-onnx-model
Розпізнавання з цією мовною моделлю дає 88.58% якості на Common Voice 6.1
Також я опублікував проєкт для автоматичного створення наголосів в тексті. Посилання — github.com/...orsmkv/ukrainian-accentor
Юра Панів опублікував модель яка підтримує простановку наголосів. Посилання на модель — github.com/.../releases/tag/v2.0.0-beta Демонстрація моделі — huggingface.co/...es/robinhad/ukrainian-tts
Всем кому интересно как обстоят дела с TTS в open source для украинского языка — dou.ua/forums/topic/36223
Опубликовал модель с большой новостной языковой моделью — huggingface.co/...-xls-r-1b-uk-with-news-lm
На фотографии ( t.me/nlp_uk/1376 ) отличие от основной модели — huggingface.co/...2vec2-xls-r-1b-uk-with-lm
Справа распознавание улучшенной моделью, слева основной
Новая модель на основе wav2vec2 с 1 млрд параметров и распознаванием 88% — huggingface.co/...2vec2-xls-r-1b-uk-with-lm
Отмечу, что у Нюанса в демо 22 kHz аудио получаются, у Микити — 48 kHz можно делать.
Что касается правильного озвучивания
«мʼяко»
, то нормализация текста тоже не делается. Преобразование
«мʼяко»
=>
«мйако»
нужно отдельным модулем.
Тоже призываю сообщество разработать такой инструмент для общего пользования.
А что обычно подразумевается под синтезом речи в украинском?
В первой модели есть возможность проставить ударение самостоятельно, используя символ «+».
Что касается автоматической расстановки ударений — модели их не ставят автоматически, слишком нетривиальная задача.
Призываю всех создать акцентор и опубликовать тоже его для общего пользования. Тогда можно будет его совместить с первой моделью.
Nuance насколько мне известно платный
Появилась новая модель на основе wav2vec2: huggingface.co/...ad/wav2vec2-xls-r-300m-uk
Привет!
Пожалуйста :-)
Нужно сказать, что датасет у нас обновился и теперь в нём уже ~1200 часов.
Ссылка на него: academictorrents.com/...583df003d54ed61776650beb8
Я не работал ранее с платформой Kaggle и не могу сказать, сможет ли эта платформа поместить датасет объёмом в ~188 GB.
Может быть, кто-нибудь из знающих подскажет?
Тестировали?
Також з’явилася нова модель на основі data2vec — huggingface.co/...obinhad/data2vec-large-uk яку розробив Юрій Панів