Український синтезатор голосу (прототипи)

Доброго дня усім!

Впродовж деякого часу займаюсь цікавою для себе темою: Синтезатор голосу. І бачу відсутність рішень на мобільних платформах для української мови. Отож спробував зробити декілька прототипів програм, які можуть щось таке робити.

На java (desktop)

Прототип для android

Отож цікавить думка шановних доу’мців :)
— чи варто поділитись ними і відкрити для публічного доступу (постає питання зробити публічний сервіс та збирати гроші на його підтримку)
— як ви думаєте, хто та чи будуть взагалі користуватися цим «продуктом» (йде мова саме про android версію)
— можливо вже є таке і я пишу «велосипед», радий буду почути про альтернативи?

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Зробіть такий синтезатор на iOS і продавайте його за 2$

Можна тестувати і допомогти грошима на подарунок для програміста. www.trosti.com.ua/ua/anatol.html

Змушений попередити. Цей синтезатор ніякого відношення до мене немає!

Вибачте, Олеже! Дійсно, розробник — Ольга Яковлева.

похоже на голос птицы-говорун, мне нравится :)

До уваги усім, так розумію є доволі багато зацікавлених, тому продовжу розробку. Якщо вам цікаво пропоную підписатися eepurl.com/cgxAk5, щоб тримати вас в курсі розробки (Листи будуть лише про дійсно важливі зміни, тому не очікуйте їх частіше ніж раз тиждень чи місяць)

Можна для порівняння спробувати отакий варіант реалізації goo.gl/CH0AbA (гугл транслейт)

Він не так давно появився. Цікаво, що доступний тільки жіночий голос.

Є ще один варіант на андроїд
www.dropbox.com/...​AAC2Ek3ghqhZgwxylmjomDeTa
Але попередньо в додатку додайте мову як українську так і російську
Жалко що немає для ПК

Ця програма є досить необхідною, оскільки я маю поганий зір, часто користуюся подібними програмами для навчання (озвучування конспектів та книжок), але на жаль українського синтезатору голосу ще нема, з нетерпінням чекатиму виходу вашої розробки для android.

Давно шукаю, дуже хочу і не тільки на Android

так , будуть користувачі — давно шукаю .

Це прототипи, тому працюють тільки в у мене в «лабораторії».

Раджу вам зв’язатись з авторкою системи RHVoice, Ольгою Яковлевою github.com/...kovleva/RHVoice
Вона вже доволі довгий час працює над російськомовним голосовим рушієм на основі системи з відкритим кодом Flite. На даний момент актуальна версія 0.3, котра вийшла вже, здається, роки два назад, якщо не більше. Але, судячи з комітів, авторка вже реалізувала читання англійської, грузинської та есперанто. Також вона працює над портування системи на мобільні платформи.
Думаю добавити в цю систему читання українською, діло техніки.

Домовились з Ольгою про створення синтезатору для нас. Є стаття на www.trosti.com.ua/...r-ukrainian-language.html і є сторінка на www.facebook.com/syntezator. Будемо вдячні за приєднання до проекту, допомогу грошима та порадами.

Технических подробностей я не знаю, так как представляю пользователей, а не разработчиков. Ольга создала 7 или 8 синтезаторов на 4 различных языках, можно подробнее узнать погуглив о RHVoice. Словарь ударений украинского языка под издательством НАН Украины. Ольга говорит, что словоформ там вполне достаточно.

Pomizh Anglij’skohu, Gruzyns’kohu i Esperento lyshe dylenattiv brakuje, i, dilo tehniky — vsununy tudy sche Ukrajins’sku.. Mozhe ne varto tak pospishaty, dlja pochatku?

цим «продуктом» (йде мова саме про android версію)
спробуй винести як сервіс для різних платформ, було б доволі цікаво...

розумію, от тільки питання чи воно потрібне комусь більше ніж просто побавитись і забути

це може бути основою інших твоїх проектів,
чи навіть просто придбають в Google ;)

Мені дуже треба, вже давно шукаю.

Вопрос не в «полноценном» владеющим серёзным запасом — а именно в читалке. То есть способный на базовом уровне взять базовый набор слов. Дальше уже можно расширять. А сейчас проблема именно в генераторе.

Пойми, если на эмоциональном уровне человеку голос не нравится — значит как продукт говно. В смысле, представляет чисто научный интерес, а как коммерческий никуда не годится.

На самом деле уже нет — сейчас подход полностью изменился — нейросеть обучается правильно произношению на базе слов и их положению в предложении. В таком случае сетка сама является результатом — ибо именно она и прозносит. Много людей на такой проект не надо — нужно 1 человек который разбирается в обучении нейросетей. Готовых движков нейросетей уйма — с глубоким обучением и без.

да есть и много уже. Обыкновенно это предложения и звук. Сетка должна самостоятельно выделать слова из фона. Если обучать ее по базе из слова/их произношение теряется интонации и тому подобное что нужно при прочтении предложений.

You have selected Microsoft Sam as your computer’s default voice

так, ви вгадали. Для android клієнта я використовую Microsoft Speech API на сервері :)

Молодець, досить непогано. Переконаний, що проект буде затребуваним.
Наприклад, дуже не вистачає українсього голосу для Asterisk PBX Sounds..
Тому я б для себе охоче скористався б синтезатором і змінив би поточний російський варіант на український.

Але важливо мати API або хоча б веб-версію утилітки, якою можна було б скористатися онлайн.
Приклад мінімального API: translate.google.com/...ез голоса&tl=ru

Приклад мінімальної веб-версії: asteriskforum.ru/prompts

Бажаю успіхів у створенні веб-ресурсу та не забудь про кнопку Donate :)

P. S: Можливо, комусь стане в пригоді лінк: github.com/...miron/ru4sphinx

А что мешает тебе сфабриковать нативные звуки и дифтонги? Не хочешь заняться именно фундаменталкой — это даст явно более крутой результат.

Рекомендую озадачиться историей Hatsune Miku — её авторы не писали с нуля, а взяли какой-то готовый синтезатор. Посмотри в эту сторону, может тебе тоже сгодится.

В текущем результате — подави гармоники и низкочастотное эхо от высокочастотных сигналов. Лучше придай шумового эффекта на взрывных звуках (особенно на р). Лучше всего попробуй воспроизвести шёпот на микрофон, увидеть частотную картинку распределения — а потом наложишь его на тональную составляющую резонатора.

А что мешает тебе сфабриковать нативные звуки и дифтонги?

Звичайно це цікаво, але не вистачає ні знань, ні часу. Тому шукаю прості варіанти вирішення задачі. Використовувати записані дифони простіше в реалізації і голос не є роботизованим. Але за пораду вдячний.

А что мешает тебе сфабриковать нативные звуки и дифтонги?

Зачем? Текущему не хватает аккуратных межфонемных переходов, а так — уже по крайней мере работает.

Дело не в переходах. Ему не хватает близких гормоник в самой генерации. В результате спектр частоты выходит «полосатым», а не нормальным. Это не позволяет варьировать частотой — при регулировке эта полосатость генерит низкочастотную составляющую.

Другими словами, надо пошуметь. А плавность достигается обычным затуханием.

Для примера — оцени какую роль в попсе играют ударные. Вот и здесь — просто не хватает ударных.

"kruti znavci spektru movlennja"— vam sche vchytys’, chytaty i movyty..)

Підписатись на коментарі