Привіт, радий, що було цікаво, звісно trainer.fine_tune робити оптимальніше, але хотів показати процес from scratch. Стосовно мінімальної кількості маркованих даних, з мого досвіду
Цікавий досвід :) В чомусь я тебе розумію.
Якщо робити все з нуля, не використовуючи строніх фрейморків, то ASR, і NLG будуть найбільшим челленджем.
Дякую, за коментар. Гарна порада обовязково буду її виконувати в майбутньому.
Дякую за запитання. Оскільки GPT досить просунута мовна модель, вона зокрема буде досить ефетивною для генерації тексту. Також можна використати BERT. В майбутньому планую детальніше написати про кожний з модулів, які описані в архітектурній схемі.
Дякую за коментар, головною метою був якраз вступ, в майбутньому є плани детально описати кожний з модулей, так погоджусь тема дуже обширна.
Привіт, на JS/PHP напевно нема, але спробуй github.com/brown-uk/dict_uk, звичайно якщо підходить для твоїх задач.
так на клас, це в ідеальному світі, але так роботи з анотації дуже багато, зі свого боку можу порадити: prodi.gy або labelstud.io