Новини по проекту будемо публікувати ще тут:
доброго вечора, я лідер проекту Лапа
1) це складний проект у якого багато результатів, тому потрібен деякий час аби повністю релізнути першу версію
У нас на меті не було вводити нікого в оману, у пріоритеті релізу було випустити модель і зібрати перший фідбек. Внутрішньо у нас близько 70 проміжних датасетів (на різних кроках обробки) та стільки ж чекпоінтів.
Для підтвердження довіри, тут додали перші 5 датасетів з 25, 3 з інструкціями і 2 з претрейну:
huggingface.co/...apa-llm/lapa-v012-release
Додав у репозиторій попередній training code: github.com/lapa-llm/lapa-llm
Відполіровану версію конфігурації тренування та решту датасетів плануємо додавати поступово протягом тижня, те саме стосується коду для оцінки на бенчмарках і логів цих бенчмарків.
2)
(І відкриті чи ні — це не так важливо
ні, це важливо, це основна мета проекту — максимально відкрита українська велика мовна модель, яка буде топовою для обробки української мови
а) відкриті датасети стимулюють розвиток коммюніті і дають довіру звідки зʼявився перформанс моделі на тій чи іншій задачі
б) впевнений у коммюніті на думці є неочевидні для мене юз кейси використання цих самих датасетів
в) дозволяє натюнити інші моделі на власні задачі
кому цікаво вступ у тему Text-to-Speech у відеоформаті, тут розказую як почати розбиратись у темі:
що ви маєте на увазі?
в чому суть цього повідомлення?
цього не треба було робити чи у вас є машина часу?
маєте посилання на проект чи датасет?
акцент може вам бути помітним бо типово люди так чітко у житті не спілкуються
«телевізійний» акцент тому і телевізійний, бо нейтральний для всіх регіонів
U+0027
Взагалі з поточним бардаком треба всі три основні розуміти (U+0027, U+02BC, U+2019)
якщо вам цікава комерційна підтримка, пишіть сюди: twitter.com/robinhad
Спробуйте інший апостроф, додав у додатку який саме це має бути.
це автор
Спробуйте це речення:
Спробуйте слово «м’яко» через такий апостроф.
підтримується отакий <’> апостроф)
EDIT: має бути вертикальний апостроф, зараз додам у додаток який, ДОУ нормалізовує на інший
доброго вечора!
це автор моделі
скажіть, будь ласка, з якими саме проблемами ви зіткнулися з якістю?
можете навести приклад речень?
гляньте самі в репозиторії, посилання є в пості
перед тим як коментувати, хоча б прочитайте
вже розділений, Character Error Rate 36%
в основному через брак даних
можете глянути онлайн демо voice-recognition-ua.herokuapp.com
я вам скидував у іншому коментарі посилання, є результат на тверду 11
У найбіднішій країні Європи дохід ринку кіно за 2019 рік становив $106 млн
www.boxofficemojo.com/year/?area=UA
перспективи є, ринки є
відсутність звукопоглинання і дорогих мікрофонів ніяк не заважає наборам даним для інших мов
тут спокійно на «брудних» даних натренований вокодер:
github.com/mozilla/TTS
тут можна почути приклад згенерованого голосу, натренованого на англійському варіанті:
soundcloud.com/...cle-wavernn-and-tacotron2
Записи виходять достатньо якісні і зі звичайного мікрофона, можете прослухати на сайті проекту, їх там вдосталь.
дякую, подивимось
можете напряму використати модель за посиланням?