К распознаванию речи
Підписуйтеся на Telegram-канал «DOU #tech», щоб не пропустити нові технічні статті.
На опеннете появилась интересная ссылка: www.opennet.ru/...nnews/art.shtml?num=49837 про Wav2letter++.
И самое главное там есть ссылка на открытую базу LibriSpeech ASR corpus (www.openslr.org/12).
А там есть ссылка на статью, как заюзать аудиокнижки для подготовки базы.
В итоге сейчас есть Wav2letter++, Kaldi и некоторых других.
Так что, для тех кто хочет получить распознавание на языках отличных от Английского уже всё есть, и работы нынче для заюзания движка, подготовки базы для тренировки сильно меньше, чем было еще 3 года назад. По сути при желании новый язык можно сделать на опенсурсных движках где-то за полгода.
Сам я от речевых задач ушел (она меня немного раздражает, к этим задачам вернусь только при очень хорошей оплате — за большие деньги почти любой каприз) и уже не буду этим заниматься.
Но если у кого из молодых желание есть, то инструменты сейчас уже все под рукой (а не так, как еще 5 лет назад — несколько лет работы требовалось).
23 коментарі
Додати коментар Підписатись на коментаріВідписатись від коментарів