WaveNet ніхто не використвує для TTS. Він надто повільний для більшості ситуацій.
А чем еще решать их?
На вхід беруть слова. Кожному слову відповідає вектор. Є два класичні способи вчити — передбачати слово по оточуючим словам, чи оточуючі слова по слову.
Не можна до кінця сказати, як буде формуватись вектор для якогось певного слова. Всі вектори вчаться таким чином, щоб слова, що зустрічаються у схожих контекстах, мали близькі представлення. Відповідно, яким саме буде вектор для слова Trump залежить від того, якими будуть вектори для всіх інших слів, ну і навпаки.
Цифри в векторі нічого конкретного не означають — сенс слова кодується близкістю його вектора до векторів всіх інших слів.
А какую цель вы преследуете? Нужен сам диплом, или рассчитываете получить знания?
Що таке “Data Science Engineer”?
Ви описуєте ідеальну ситуацію. Звичайно, якщо в людини є можливість отримати хорошо вищу освіту по цікавому профілю, треба цим користатись. Але радити 20 повноцінних курсів людині, яка хоче змінити сферу і почати розвиватись як спеціаліст — це або троллінг, або снобізм.
Може людина попрацює півроку і зрозуміє, що ця сфера взагалі не для неї. У випадку, якщо сфера сподобається, то довчити теорію і розібратись в тому «що під капотом», можливість буде, але тепер це будуть не якісь абстракні формули чи алгоритми, а вже щось що напряму зв’язано з тим, з чим людина встигла попрацювати, і, відповідно, інформація буде засвоюватись набагато більш ефективно.
Ви завжди спершу ретельно розбираєтесь в принципі роботі алгоритму/моделі, а лише потім починаєте його застосовувати? Якщо так, то ви щаслива людина. Більшість фахівців з індустрії не мають такої можливості, адже на першому місці у більшості випадків стоїть практичний результат, а не спроможність розробника пояснити фундаментальні принципи.
Не варто слухати людей, які говорять, що без дискретки/матану/алгоритмів ви не зможете стати спеціалістом — це не так, принаймні для українського ринку. Добре, якщо ця база є, це відкриває певні двері, але для більшості компаній куди важливіше вміння вирішувати задачі, а не знання, яку матричну факторизацію використовує той чи інший алгоритм або вміння написати руками backpropagation.
Хорошим джерелом практичних скілів може бути Kaggle. От, наприклад, поточне змагання по NLP: www.kaggle.com/...lassification/leaderboard.
Інший варіант — зробити пет проект. Це може бути імплементація статті, демка вже якоїсь готової моделі (можна щось звідси: github.com/huggingface/transformers) або просто аналіз якоїсь задачі різними методами.
Умеем, практикуем. Некоторый код без пива читать нельзя от слова совсем.
В STT все еще достаточно популярен ручной отбор фичей, DL начинает его превосходить начиная только с очень больших размеров корпусов.
Много людей с хорошими публикациями, но без PhD?
В google brain, open-ai, deepmind, facebook research очень сложно попасть на research позиции без хорошего PhD.
А для чего же?
У Snap-а например только во кзоту в Украине, насколько знаю
А как же:
добавить новые признаки, чтобы облегчить задачу алгоритму (например, к длине и ширине объекта, добавить «площадь»);
?
Очень хорошая статья, спасибо!
Тут є декілька моментів.
Той факт, що певна компанія використовує deep learning (а хто його зараз не використовує?) не говорить ні слова про те, наскільки застарілі (або не застарілі) є ті чи інші підходи.
Так, це правда, що якщо ми говоримо про такі мейнстрім задачі як classification, object detection чи segmentation — тут на сьогодні використовувати щось окрім нейронок особливо сенсу немає, вони просто працюють суттєво краще.
Але, по-перше, треба враховувати, що дуже часто deep learning підходи використовуються разом з класичними CV алгоритмами (тут можна гуглити watershed, selective search, non-maximum supression, object tracking), без яких нейронки просто не будуть мати сенсу. А по-друге, є ціла низка задач, де класичні підходи до сих пір набато більше популярні за deep learning.
Нейромережі це круто, але це далеко не весь CV. Навіть сьогодні.
Спасибо большое, Виктор. Обязательно почитаю.