Очень желательна, чтобы мы понимали количество людей. Но если придёте без регистрации — вас без проблем пустят :)
Спасибо за ответ. По второму пункту хочу уточнить, какие именно «классические»? Cloudera, Hortonworks, MapR, что-то еще?
Спасибо, буду следить за дайджестом. Полагаю, у вас или ваших команд есть опыт создания Big Data решений, есть несколько вопросов:
1) Насколько часто в Big Data проектах используется Machine Learning, а не просто ETL?
2) Какие «реализации» Хадупа вы чаще используете? В чем их преимущества?
3) На каком языке пишете программы под Хадуп? Используете ли что-нибудь помимо Java?
4) Сложно ли поднять кластер под Хадуп? Какие нужны вложения и какие есть сложности и подводные камни?
Посмотри Apache Hadoop, Mahout, Lucene. Плюс у них там еще куча всего есть.
У Java сейчас один из самых продвинутых стеков в плаге ML и обработки больших данных. Это можно считать косвенным доказательством того, что её производительности достаточно для решения многих задач.
Периодически появляются. Там пока не нанимают людей пачками, как на Java или PHP. В
Не знаю, как в РБ, а в Украине это направление потихоньку развивается.
Сложно сказать по описанию вакансии, сколько времени человек будет уделять условному ML, и сколько — программированию на Java — надо спрашивать на собеседовании. Важно понимать, что если вы не занимаетесь только exploratory analysis, то вам все равно придется реализовывать ваши алгоритмы на конечной платформе. В данном случае это Java. Это как раз тот самый случай, когда требуется программист со знанием ML.
У нас этого пока мало, потому что еще не все увидели тренд, который уже есть на западе, и настроились на него. Если не считать украинские продуктовые компании, то я знаю как минимум 4 аутсорсинговых компании, которые развивают свои отделы. Возможно, их больше. Еще 2 года назад их было 0. С таким спросом как есть на западе, это лишь вопрос врнмени.
Виктор, наверно, вы плохо прочитали топик. В нем рассказывается и про Data Science/Machine Learning как field of study, и про позиции Data Scientist/Machine Learning Engineer.
Что касается вакансии, то она про Big Data и Natural Language Processing. NLP — это тоже машинное обучение, поэтому писать дополнительно Machine Learning не нужно. Хотя в целом название вакансии действительно более крутое, чем то, что внутри.
По поводу применений в разных отраслях есть свои стандартные задачи. Например, в банках это и скоринг, и сегментация клиентов, и риск анализ. В маркетинге это опять-таки сегментация, анализ соцсетей, предсказание продаж и спроса. Очень много применений в мобильных девайсах, там можно работать с картинками, звуком, видео, данными от сенсоров. И т.д.
Процесс работы мало чем отличается от обычного программирования :) Тоже разбираешься с чем-то, думаешь, пишешь код. Что именно вас интересует?
Работы сейчас всё больше, а специалистов мало. Почти все, кого я знаю в этой области — самоучки, в прошлом программеры или аналитики. Реже — аспиранты или преподаватели вузов.
Я не организатор киевского клуба. Лучше обратитесь напрямую к Всеволоду Дёмкину из Grammarly ( контакты есть здесь: dou.ua/...users/vseloved ). Насколько я знаю, они обычно публикуют анонсы в Событиях на DOU.
В Киеве есть встречи Grammarly AI Club. Возможно, есть и какие-то конференции, но я о таких не слышал. А вообще Харьков всего в 4.5 часах езды на экспрессе :)
Кажется, нашел презентацию на wikileaks: wikileaks.org/...on-several.html
Прослушка и шпиёны? 0_о
Меня заинтересовало, чем занимается Speech Technology Center, а не вы лично :)
Компания производит свои продукты/сервисы, или работает на заказ? Какие алгоритмы/подходы используются? Какие технологии (платформа, язык программирования, инструменты и т.д.)?
Если можно, расскажите подробнее.
Виктор, а вы работаете в Speech Technology Center? Гуглится тяжело.
Расскажите, чем занимаетесь.
Да, был у нас Интеллектуальный анализ данных, вела Шатовская, по-моему. Честно говоря, даже не помню, что было в курсе. Черепахин вел графический предмет, но не припомню, чтобы там требовались какие-то знания геометрии/тригонометрии. Изучали форматы сжатия, вейвлеты, что-то еще.
На ИСПР давали больше предметов по Machine Learning, но уровень наших преподавателей — не Andrew Ng, а программа обучения отстает на много лет :)
Справедливости ради, для промышленного программирования такого уровня «вышки» и матстата хватает за гланды :) А вот серьезный базовый Computer Science, конечно, нужен. На ПОАС его тоже дают. На ПМ, насколько мне известно, нет.
Возможно, когда-то и была. Но у меня супруга закончила ПМ, а я — ПОАС, мы сравнивали, кто что учил. У нее — 3 года вышки разного направления, суммарно 2 года теорвера и матстата, численные методы и много чего другого, зато программирования было мало. У меня — полтора года вышки, семестр теорвера, семестр мастата и все. Зато по языкам программирования за 5 лет охват был почти полный, начиная от Асма и С++ и заканчивая PHP, Java и .NET.
В то же время я сейчас как раз прохожу онлайн-курсы по Data Analysis, Machine/Statistical Learning и т.д. и могу сказать только одно — я бы сейчас сильно хотел, чтобы у меня математики и матстатистики было существенно больше :)
Думаю, с увеличением количества Data Analyst/Scientist вакансий в IT компаниях студенты специальности ПМ снова станут востребованными :)
У нас есть отдел, мы периодически берём людей :)
Из того, что я знаю по другим компаниям вакансии периодически появляются, но спрос еще не так велик, как хотелось бы. На других специалистов он значительно выше.