Ландшафт искусственного интеллекта в Украине

Нельзя же сказать человеку: «Ты можешь творить. Так давай, твори». Гораздо вернее подождать, пока он сам не скажет: «Я могу творить, и я буду творить, хотите вы этого или нет».
Профессия. Айзек Азимов

Пару дней назад мне на глаза попалась статья в Forbes Why Is Machine Learning (CS 229) The Most Popular Course At Stanford, где рассказывается о том, что этой осенью самым популярным курсом в Стэнфорде стал Machine Learning от небезызвестного Andrew Ng (одного из фаундеров Coursera), который закончили более 760 человек, и о том, почему различные направления Artificial Intelligence вдруг стали so sexy.

Эта статья иллюстрирует очень важный тренд, который происходит в IT сфере: всевозможные алгоритмы и подходы, разработанные за несколько десятилетий в области искусственного интеллекта, не просто находят применение в нашей жизни, но и потихоньку переходят из исключительно академично-исследовательской среды в массовое производство, что влечет за собой появление новых интеллектуальных продуктов и сервисов, а также интересных вакансий в компаниях.

Например, чем многие из нас пользуются уже сейчас:

  • голосовые команды в смартфонах
  • интеллектуальные помощники (Siri, Google Now)
  • распознавание и автотегирование человеческих лиц и других объектов на фотографиях и видео
  • переводчики и проверка грамматики
  • домашние роботы, например, те же пылесосы
  • как ни странно, даже игровые боты

А ведь еще и более серьезные разработки, например, Watson от IBM, потрясающие роботы Boston Dynamics и других производителей, автопилоты от Google и Volvo, коптеры-доставщики от Amazon, не говоря уже про такие бурно развивающиеся области, как BigData, биоинформатика и робототехника.

На фоне всего этого украинская IT отрасль и наше образование кажутся сильно отстающими. С одной стороны, приходится констатировать, что так оно и есть, а с другой — на нашем пасмурном небе уже видны просветления, просто их не так легко разглядеть.

Когда мы начинали первые встречи Kharkiv AI Club в 2012-м, мы очень сильно переживали по поводу докладчиков. Казалось, что в Украине (а тем более в Харькове) очень мало специалистов, которые могут что-то рассказать по теме. Поначалу так оно и было. Украинским IT правит аутсорсинг, специалистов по тем или иным технологиям очень много, чего не скажешь про такие наукоемкие области.

Однако в 2013-м произошел определенный сдвиг: мы познакомились с большим количеством заинтересованных людей, разными активными сообществами, преподавателями и аспирантами, занимающимися наукой, компаниями, применяющими алгоритмы и подходы ИИ в своих продуктах и сервисах, стали появляться интересные вакансии в аутсорсинге (к нам даже начали обращаться рекрутеры в поиске специалистов по Machine Learning и Data Analysis), а искать докладчиков стало намного легче. В общем, когда мы копнули глубже, то увидели, что не все так плохо в нашей стране.

Поэтому этот пост не будет постом брюзжания, это будет пост добра и надежды. Все-таки новогодние праздники на дворе, хочется думать о хорошем :)

Итак, что же мы имеем в Украине на данный момент, стоит ли заниматься ИИ в нашей стране и где можно применить свои навыки и силы уже сегодня.

Disclaimer. Ни одна из компаний и организаций, упомянутых в статье ниже, никаким образом не задабривала автора. Даже печеньками. Все они попали в обзор исключительно благодаря своему месту в ИИ-ландшафте Украины.

Продуктовые компании

Во-первых, в Украине есть несколько продуктовых компаний, создающих свои продукты или сервисы на базе тех или иных технологий ИИ.

Наверняка все знают компанию Grammarly, которые создали известный сервис для проверки орфографии и грамматики, а также поиска плагиата. Кроме того, что они разрабатывают популярный сервис, они еще и наши коллеги, т.к. организовывают Kyiv AI Club. В сервисе Grammarly используются технологии Natural Language Processing, но подробности мне не известны. Возможно, они сами захотят рассказать в комментариях.

Еще один пример — харьковская компания Scorto, которая создает продукты для управления решениями и рисками, а также скоринговые системы для банков, страховых и телекоммуникационных компаний. Внутри продуктов Scorto заложено много Machine Learning алгоритмов, немного подробнее о них можно узнать из презентации Дмитрия Вороненко.

В Samsung R&D Institute то и дело появляются вакансии Research Engineer, причем как в Украине, так и в Южной Корее. Конечно, это не украинская компания, да и рейтинг на DOU у нее не очень высокий, но это не отменяет возможности работать в области анализа данных и получать опыт. К сожалению, я не знаю, чем конкретно занимаются подобные специалисты в компании, возможно, кто-то в комментариях сможет рассказать подробнее.

Стартапы

Одна из самых нашумевших сделок 2013 года — покупка стартапа Viewdle компанией Google. Viewdle разработали и запатентовали мощную технологию распознавания лиц и объектов на фотографиях, которую Google теперь активно использует в поиске и других сервисах.

После такого успеха уверен, что в Украине уже сейчас разрабатываются и другие интересные стартапы, и я был бы благодарен, если бы вы написали о них в комментариях к этой статье.

Например, команда одного из членов клуба Николая Павлова разрабатывает iPhone и Pebble приложения для трекинга различных активностей человека. Под капотом приложения цифровая обработка сигналов и нейросети.

Робототехника и игры

По сравнению с США и Японией робототехника в Украине пока находится на начальном уровне. Но тем не менее уже проводятся фестивали, хакатоны и соревнования по робототехнике. Есть несколько активных сообществ, например, Boteon в Харькове, Ассоциация робототехники, можете посмотреть у них на сайтах, чем они занимаются.

Школьники также изучают робототехнику (в основном Lego, например), и даже ездят на мировые соревнования, что опять-таки очень здорово. Ну, и напоследок, есть немало ребят, которые делают роботов самостоятельно для собственного удовольствия, или покупают готовых роботов и пробуют свои силы в их программировании.

Если говорить об играх, то их в Украине разрабатывается много, но далеко не во всех находит свое применение ИИ. Один из отличных примеров — всем известный S.T.A.L.K.E.R., в котором у ботов-соперников был очень хороший игровой интеллект. Про ИИ в S.T.A.L.K.E.R. и новой игры студии Vostok Games, Survarium, можно послушать в докладе Дмитрия Ясенева, одного из ведущих разработчиков этих двух игр.

Что касается других игр, производимых в Украине — было бы очень интересно услышать примеры от вас.

Аутсорсинг и фриланс

А что же аутсорсеры? Бытует мнение, что на аутсорсинг или фриланс наукоемкие проекты не отдают. И тем не менее в последнее время в разных компаниях то и дело появляются вакансии с интересными названиями: Machine Learning Engineer, NLP Engineer, Data Scientist. Да и на обычных проектах то и дело возникает необходимость реализации рекомендательных систем, текстового анализа, интеллектуального поиска. У нас в харьковском клубе есть несколько человек, работающих на подобных проектах.

Есть еще один интересный пример. В SoftServe недавно открылась вакансия R&D Program Manager for Artificial Intelligence. Еще там существует Data Science group, в которую тоже набирают людей. Возможно, ребята из SoftServe смогут рассказать, чем они там занимаются (очень интересно), а другие аутсорсинговые компании тоже поделяться своими достижениями в этой области.

Все это свидетельствует о том, что клиенты уже стали аутсорсить наукоемкую разработку, а наши аутсорсеры вышли на определенный уровень продаж и технической компетенции, чтобы не бояться браться за подобные проекты. Более того, некоторые крупные сервисные компании видят в этой области перспективу, раз целенаправленно расширяют свою компетенцию.

Во фрилансе ситуация даже лучше. Различные небольшие стартапы целенаправленно ищут людей для реализации нетривиальных задач по всему миру. Подобные специалисты ценятся высоко даже по меркам разработчиков. Если вы основатель стартапа, который не хочет или не может найти подобного специалиста onsite, то фрилансовые биржи — одно из немногих мест, где можно найти специалиста за приемлемые деньги.

Вместо заключения

Как видите, спрос на AI специалистов и спектр работы для них в мире растет, начиная от анализа больших объемов данных и поиска закономерностей, и заканчивая роботами и беспилотниками. И хотя мы все еще отстаем в этом направлении от ведущих мировых IT-держав, работу в области искусственного интеллекта в Украине можно найти уже сейчас, не говоря уже о различных вариантах трудоустройства за рубежом или открытия собственного наукоемкого бизнеса.

В этом посте собраны далеко не все примеры. Было бы очень интересно узнать в комментариях про ваш опыт или опыт компании, и тем более продукты или стартапы, связанные с различными направлениями ИИ. Давайте попробуем осветить эту область все вместе :)

Для тех, кто заинтересовался подобной работой, но не знает, в какую сторону копать, в следующий раз мы поговорим об образовании и самообразовании в сфере искусственного интеллекта.

72 комментария

Подписаться на комментарииОтписаться от комментариев Комментарии могут оставлять только пользователи с подтвержденными аккаунтами.

Вот занимаются распознаванием и синтезом украинской речи: cybermova.com/...ology/mova.html

speech.com.ua — інформація по розпізнаванню та синтезу мовлення в Україні.

Мда. Заглянул что по одной ссылке, что по другой — это Жуть (именно с большой буквы). А школы Винцюка уже не осталось?

Так це вона і є.
Ну і Мінськ теж наче не помічений на інтерспічі, щоб про «Жуть» писати.

В общем честнее сказать, что толком уже и нет ничего. В общем все как обычно. Из всего пост СССР-овского осталось только одно место, где этой областью еще занимаются относительно серьезно (не хочу упоминать его, работающие в области речи это место знают).
Просто была маленькая надежда (почему и влез в этот топик), что в Украине на западные деньги что приличное делают в оной области не на уровне дипломных работ. Надежда умерла.

Західних грошей на жаль нема, але здається по дикторонезалежному розпізнаванню, наприклад телепередач, на пост-совку у нас найкращі результати.

Сам себя не похвалишь... Ну да ладно не ради «ср...» я тут ввязался в треп.

Виктор, а вы работаете в Speech Technology Center? Гуглится тяжело.
Расскажите, чем занимаетесь.

Уже нет. Обсуждать cебя здесь не хочу. Если есть вопросы, пиши.

Меня заинтересовало, чем занимается Speech Technology Center, а не вы лично :)
Компания производит свои продукты/сервисы, или работает на заказ? Какие алгоритмы/подходы используются? Какие технологии (платформа, язык программирования, инструменты и т.д.)?
Если можно, расскажите подробнее.

Кажется, нашел презентацию на wikileaks: wikileaks.org/...on-several.html
Прослушка и шпиёны? 0_о

Почему шпиёны? Продукты для спецслужб.

Вот здесь же все есть www.speechpro.ru и в инете об этой конторе инфы море (что за контора и чем занимаются). Нужны детали? Пиши им, спрашивай. Я там уже не работаю и не уполномочен о них что-либо писать. У них есть пресс-центр.
Если есть конкретные вопросы и я на них смогу ответить, отвечу (только на те, что можно ;) ).
З.Ы. И свои продукты и на заказ. Алгоритмы и подходы классические в этой области. Технологии и платформы — разные.

Еще один украинский стартап по BigData: ain.ua/...14/01/22/508642

Мы делаем аналитику для ритейла datawiz.io. В блоге есть несколько кейсов но пока только с использованием статистических алгоритмов.

Крестим Prolog и hadoop в одном флаконе — строим экспертную систему.

Что именно хотите получить в результате? Это стартап или заказной проект?

В результате мы хотим получить платформу в которой можно будет управлять тасками hadoop-а при помощи языка пролог (менеджерами мэпперов, редьюсерами — это отдельная тема). Должна быть возможность задавать запросы на прологе в online (сейчас вот для Online использую Hbase) так и делать offline задания. Пролог написали свой, разработка ведется на Erlang-e.

Это скорее Стартап внутри компании (недостартап) .

Пролог покрывает не все области ИИ, есть идея интегрировать некоторые алгоритмы машинного обучения как отдельные предикаты — аля расширение стандарта. Как-то так.

Для меня стал вопрос ухода от Hbase

К сожалению, я не совсем в этой теме. В чем преимущество использования пролога как языка, на котором писать запросы управления?

Управление — это второстепенное, идея создать платформу на прологе, у которого «бесконечная» виртульная память, сотни правил, фактов и в конце концов автоправил( голубая мечта)...

А зачем на Erlang реализовывать Prolog ради экспертной Системы? На Erlang можно сразу строить экспертную систему, вот, например, вариант реализации Eresye (sourceforge.net/...rojects/eresye).

Реализовать пролог(прототип в каком-то виде ) оказалось не такой уж сложной задачей, за ссылку спасибо, посмотрел.... соглашусь можно было взять и это решение и доработать его, если бы мы знали о нем....
Сейчас мы разрабатываем правила уже на этом прологе, но пока без явного использования алгоритмов машинного обучения — мы разрабатываем эту тему.

не сотни, * миллионы правил, миллирды фактов

<troll-mode> и экспотенциальный перебор </troll-mode>

правильное замечание, согласен полностью, проблемы на то и проблемы, что бы за их решение получать профит....
А алгоритмы машинного обучения никто не отменял, пролог же не золотая пуля... Опять же сделать «вычислительное облачко», которое будет способно проверить в онлайне все эти правила — та еще проблемка...

ну или умереть молодым

Было бы очень интересно узнать в комментариях про ваш опыт или опыт компании, и тем более продукты или стартапы, связанные с различными направлениями ИИ.

Опыт, эксперимент... по обсуждаемому профилю в Донецке roboclub.dn.ua/...roboclub-start

Очень здорово, что работаете со школьниками. Вы большие молодцы, удачи вам в работе!

Александр, спасибо, что упомянули Boteon.com . Если кратко о нас — то занимаемся только лишь созданием условий для развития айти и робототехники в частности. В основном работаем со студентами ВУЗов 1-4 уровня аккредитации. (ХНУРЭ, ХПИ, ХАИ)
Например, инициатором нижеупомянутого конкурса intellectronics.com.ua/...rkiv-it-winners — являлся я, сейчас мы создаем инфраструктуру на базе Научного парка ХНУРЭ для развития результатов (работ) этого конкурса.
Точно так же двигаемся и в робототехнике — помогли создать экспериментальную лабораторию на базе компьтерно технологического колледжа (КТК, НТУ ХПИ): — проводим совместные семинары (программирование, кам/кад, автоматические системы); завезли/запустили необходимое оборудование для разработки мехатроники (паяльная станция, БП-я, осциллограф, точильные, сверлильные, токарные станки, инструменты, в феврале 3д принтер и фрезерный станок), постоянно пополняем ассортимент комплектующих и радиоэлементов;
Стараемся запускать интересные конкурсы, проекты, хакатоны и по робототехнике — тяжело, не хватает ресурса, но все еще впереди.
По стечению обстоятельств именно с этого года будет больше возможностей и больше интересных проектов.
Приглашаем всех желающих занять свое место на маленьком опытном заводике в лабсевен (Labseven) — КТК, лаб. № 7.

Алексей, спасибо за информацию. Здорово, что вузы в Харькове сотрудничают в области робототехники и не только :) У меня к Вам есть несколько вопросов:
1) Boteon — это инициатива вуза(ов) или вы существуете автономно и просто хоститесь в вузе?
2) Какие цели и задачи вы ставите перед собой?
3) Какие перспективы видят вузы в создании подобной инфраструктуры? Какими способами они помогают?
4) Какими направлениями робототехники вы занимаетесь, какие типы роботов создаете?
5) Каких результатов вы уже успели добиться за время существования лаборатории?

1. — Ботион существует автономно.
Насчет сотрудничества ВУЗов — как раз через Ботион это возможно, хотя тоже очень сложно (как ходить по лезвию бритвы ;)), потому что ВУЗы конкурируют.

2. Цели и задачи
В ближайшее время — создать мощную инфраструктуру для развития реальных проектов (стартапов) в сфере робототехники:
— собрать комьюнити (физически и на сайте);
— запустить несколько масштабных открытых проектов;
— запустить обучающие программы (от детей до взрослых) в области робототехники + высокотехн. предпринимательства

3. ВУЗы очень инертны — «зайдите завтра», часто разговор строится как в анекдоте: Жора! Жарьте рыбу. — Так рыбы нет! — Жора, вы жарьте! Рыба будет. :) В итоге мы сами находим рыбу... и вот тогда появляется интерес к нам.
В случае с Компьтерно технологическим техникумом и лаб. 7 очень благодарен мудрым руководителям Рубину Эдуарду и Заремба Александру — с ними работать очень приятно, быстро, есть взаимопонимание. Они видят в нас развитие, они развивают КТК, хотят сделать его лучшим в Украине — мы внесли свой вклад (отремотировали и запустили лабораторию, оживили ее, проводим семинары, по КТК ездят роботы). Здесь можно долго писать... это возможно отдельный пост.

4. направления робототехники зависят от ребят, они сами выбирают. В свою очередь, чтобы запустить проекты, я стараюсь найти финансирование, докупить необходимое оборудование, сделать необходимый семинар и т.п.
Проблемы — проекты на сегодня в основном слабые, люди разрознены (сплотить их в команду и коллективную работу очень не легко), именно в области робототехники инвесторов не так уж и много.
Начатых проектов полно: и гуманоиды, и роботы футболисты, пауки, коптеры, манипуляторы, СТЗ... Реальных проектов нет!

5. В рамках лаборатории мы запустили
— курсы робототехники;
— есть коворкинг;
— систематически работаем по тренингам и семинарам;
— обладая хоть такой структурой мне легче привлекать спонсоров, инвесторов и т.п.
— запускаем проекты — boteon.com/...vozmozhnostjami
Все у нас будет хорошо, еще 3 месяца назад это было хобби и для меня, сейчас я не занимаюсь ничем кроме этого.

Приходите к нам на Kharkiv AI Club с докладом. У нас есть ребята, которые давно интересуются роботами и, надеюсь, захотят поработать с вами над какими-нибудь проектами :) Коптерами так вообще люди интересуются знатно.

У меня есть даже пара знакомых, которые купили себе программируемых роботов, думаю, они тоже заинтересуются прийти к вам на семинары.

Я правильно понимаю, что вы все-таки больше по железу выступаете? То есть на данный момент цель только создать работающую механику или еще и наделить ее какими-то «мозгами»?

безусловно! нужны мозги и есть куда АI применить... Программную часть будем развивать обязательно.

Александр, а возможно ли поднять народ на создание действительно первого укр открытого проекта по созданию робота гуманоида (как и раньше — догнать и перегнать Америку ;) ). У нас есть несколько заказов на большого робота с зачатками интеллекта (один от конечного клиента, второй от компании желающей производить роботов серийно), вместе мы могли бы сделать это.
Мы привлекли бы деньги и старт не с 0 — у нас есть кое-какие наработки, есть открытые проекты под (Linux + Xenomai) — можно подсмотреть pal-robotics.com/...u/robots/reem-c .
тут только вместе, и я думаю многим было бы интересно.

Я могу связать Вас с ребятами, которые интересуются роботами в Киеве. В Харькове заинтересованные люди тоже есть, но насколько серьезно — мне сложно сказать, надо общаться. Здесь надо отметить, что в харьковском клубе все-таки больше людей, которым софт ближе, чем хард :) Но, во-первых, уверен, что есть люди, не боящиеся паяльника, а во-вторых, специалисты по софту вам тоже не помешают на определенном этапе, я думаю.

Я бы предложил действовать следующим образом — проводим встречу клуба, посвященную робототехнике в Харькове, прорекламируем ее хорошо, чтобы она привлекла внимание энтузиастов, и там Вы сможете предложить подобную инициативу. Те, кто захотят участвовать — дальше уже будут работать с вашей командой :)

Одна из задач клуба — давать людям возможность собирать команды единомышленников по тем или иным направлениям. Кому-то интересно участвовать в соревнованиях Kaggle, есть идея проекта и нужна команда, хочется совместно пройти какой-то курс на Coursera, или заняться любым другим коллективным проектом — рассказывайте на встречах (у нас для этого предусмотрены питчи, где может выступить любой желающий). Клуб в данном случае служит платформой, которая привлекает заинтересованных людей в сообщество, знакомит их между собой и, надеемся, будет выступать определенным катализатором создания новых интересных проектов.

А вот еще такую интересную ссылку подкинули: intellectronics.com.ua/...rkiv-it-winners. В победителях и призерах есть проекты по нашей теме. Попробую найти информацию у людей, которые участвовали.

Продолжая тему Data Science/AI в сервисных компаниях, у нас на Элексе тоже недавно запустилась программа развития этого направления. Исторически так сложилось, что мы пришли к этой теме со стороны high performance computing и параллельного программирования на CUDA и это наложило определенную специфику на наш опыт. За последние 5 лет у нас было несколько крупных проектов, которые обьединяет то, что все они в том или ином виде платформы для Predictive Analytics (в основном для разного рода риск менеджмента в финансах — много работы с данными, компиляторы для моделей на DSL с последующим моделированием методом Монте-Карло, вообще много статистики и тервера). Было также несколько проектов, связанных с работой с изображениями (ближе всего к теме AI был крупный проект по feature-based image search, также были blur remove, обработка сырых данных с МРТ, compressed sensing).
Сейчас работаем над систематизацией нашего опыта в этой области и развитием компетенции Data Scientist на основе нашей команды математиков. Если все пойдет по плану, то еще в этом году сможем показать что-то интересное на конференциях в Украине.

Виктор, а вы не планируете рассказывать что-то на зарубежных конференциях? Разве у нас в Украине есть что-то тематическое?

Вы правы, тематических конференций в Украине нет, но это же не означает, что с этим ничего нельзя сделать. Перед крупными компаниями, которые всерьез хотят выходить на рынок с продуктами или сервисами, связанными с высокотехнологичными и наукоемкими вещами типа AI или Data Science стоит вполне насущная задача — найти людей, которые смогут работать над такими проектами. Единственный способ обеспечить стабильный рост этого направления через пару лет — это вложится в формирование community уже сейчас. Например, в мае во Львове будет проходить крупная IT конференция, на которой мы скорее всего будем спонсорировать и помогать с организацией трэка по Data Science. Мы сейчас на этапе формирования концепции этого трэка, как только определимся с деталями — будем искать докладчиков и свяжемся в том числе с вами. Кроме того, у меня есть пока не подтвержденная информация о том, что в августе-сентябре в Киеве будет проходить другая конференция, где скорее всего тоже будет трэк по Data Science.
Что касается зарубежных конференций, то вы должны понимать, что для сервисных компаний такие конференции чаще всего представляют больший интерес с точки зрения продаж, поэтому презентации, которые готовят на такие конференции, могут быть не настолько интересны техническим специалистам, которые глубоко «в теме».

Согласен по всем пунктам. Если чего-то нет, то нужно создавать самим.

Надеемся, что у вас все получится с треком по Data Science на конференции, будем очень стараться приехать к вам :) У нас есть ребята, которые могут рассказать что-то интересное, в Kyiv AI Club наверняка тоже, да и по университетам можно найти будет кого-то, поэтому насчет докладчиков не переживайте. Удачи вам с организацией и держите нас в курсе событий :)

Есть еще довольно много компаний, которые тем или иным боком имеют отношение к ML/AI/NLP/...

Например, секретная компания Zoral Labs много таких проектов делала и продолжает делать. Выходцы из Viewdlа организовались в Video Gorillas, YouScan пытаются что-то делать, Jooble вот ищет себе спеца по анализу данных. Materialise, CyberVision, Cupid Plc, Kodisoft, Codeminders, Polyteda, ISS тоже какое-то отношение имеют к околоматематическим вещам. У всех больших аутсорсеров есть какие-то проекты.

Только почему-то все стыдятся об этом говорить и прячутся за NDA, как будто если кто-то узнает, что вы используете в работе формулу Байеса, то сразу прозреет и создаcт конкурента...

Спасибо за интересную информацию. Постараюсь связаться с этими компаниями, может, поучаствуют в создании нашей «картины мира» :)

Несколько вопросов по Grammarly, если ты не против:
1) Насколько я понимаю, под капотом движка Grammarly находится в основном ML/NLP. Можешь дать чуть больше информации, какие алгоритмы/подходы вы используете в модели?
2) С какими сложными проблемами вы сталкивались? Как решали?
3) Судя по вебсайту сейчас вы поддерживаете только английский язык. Планируете ли запуск других языков?
4) Сколько у вас сотрудников работает непосредственно над движком? Насколько я понимаю, у вас есть какой-то core team, остальные сотрудники занимаются веб-программированием и сопутствующими вещами, верно?
5) Где искали первых специалистов? Как развивали направление?
6) Как обучаете своих специалистов? Берете ли новичков в команду?

Мы используем все NLP-подходы и модели, которые дают какой-то результат (можно посмотреть материалы Курсеровских лекций по NLP — там много всего описано).
Самая главная проблема — это отсутствие качественных данных (в нашей области — корпусов), и решаем мы ее разными способами: ищем по миру, готовим сами.
Над движком у нас уже работает больше 10 человек, а, вообще, компания продуктовая, поэтому есть полный спектр людей: от поддержки пользователей до пиарщиков.
Сотрудников ищем обычными методами, только это занимает много времени, поскольку у нас высокие требования, а хорошие специалисты в основном работают на хороших работах. Но берем иногда и начинающих, если это будущие гении, а у нас есть для них задачи. Первых специалистов мы не искали — часть из разработчиков этим занималась с самого начала. Благо, у нас про эти вещи на базовом уровне рассказывают в университетах, а дальше опен-сорс и научные статьи никто не отменял.
Про обучение специалистов: на этом уровне каждый должен сам уметь учиться. Компания, впрочем, помогает, если нужно. Например, может отправить на конференцию по теме или оплатить какой-то курс.
На бизнес вопросы я авторитетно ответить не смогу.

Привет, действительно, мы YouScan тоже занимаемся подобными вещами (хотя ИИ термин конечно очень широкий). У нас, как и Grammarly, это больше про NLP — в частности мы занимаемся автоматическим определением тональности высказываний (cм. blog.youscan.ru/...-sentiment.html ), выявлением трендов в больших объемах текстовой информации (анализ Big Data из социальных медиа, если угодно), и работаем над рядом других применений. C машинным обучением также экспериментируем.

Алексей, спасибо за ответ и ссылку на пост :)
Если я правильно понимаю, ваш продукт практически полностью строится на NLP и Sentiment Analysis. Уверен, такие продукты сейчас очень популярны среди разных компаний, которые хотят мониторить отношение клиентов к своим продуктам и бренду. Несколько вопросов, если Вы не против:
1) Сколько людей работает над Sentiment Analysis-ядром?
2) Какой использовали технологический стек?
3) Какие сторонние библиотеки и инструменты для NLP/Sentiment Analysis используете?
4) Какие языки вы поддерживаете на данный момент, кроме русского?
5) С какими сложными NLP сталкивались ваши специалисты?
6) Как пришла идея продукта, почему поверили в нее? Как развивался стартап?

Мы в Codeminders занимались распознаванием жестов и немного системами рекомендаций (Collaborative Filtering). Элементы ML иногда всплывают в том или ином потенциальном проекте. Сейчас ML настолько развит что базовые его технологии это практически мэйнстрим, и тут особо даже хвастаться нечем. :)

Вадим, спасибо, что отозвались :)
Скажите, а распознавание жестов и рекоммендательные системы — это были отдельностоящие проекты, или просто к существующим решениям прикручивались те или иные фичи, требующие ML? Есть ли у вас в компании выделенные люди, которые занимаются ML-решениями, или просто разработчики разобрались сами, когда было нужно? Какие алгоритмы использовали?

Это были отдельные проекты. Специальной ML группы у нас в компании нет, но есть сотрудники разбираются в этих технологиях. Тех кто с ML не работал — если есть желание стараемся обучать/привлекать.

У автора ошибка: курс закончило куда больше 760 человек. В статье указывается что в этом году на курс ЗАПИСАЛОСЬ 760 человек.

Согласен, спасибо за уточнение. Но тут надо понимать, что это по сути обычный курс в Стэнфорде, а не онлайн-курс. То есть почти наверняка кто-то из студентов завалил его, но не думаю, что это большой процент :)

Этот курс там преподают по крайней мере 2004-го года (а возможно и раньше). За эти годы его закончили я думаю несколько тысяч студентов. А если добавить тех, кто прошел бесплатную online версию то будет еще больше. Я не придираюсь, просто эти цифры показывают насколько популярно Machine Learning.

Безусловно популярен. Учитывая, насколько ML — это узкая область знаний по сравнению с другими курсами, это серьезное достижение. Онлайн версию курса уже прослушали десятки, если не сотни тысяч людей, насколько я знаю. Конечно, процент закончивших курс там очень невелик, но это вполне себе компенсируется массовостью.

Про стартапы — есть gosave [disclaimer: я там работаю], там инвесторы и люди из менеджемента и разработки раньше участвовали во Viewdle. У нас есть задачи связанные с анализом-данных. Пользуясь случаем, скажу что мы ищем интернов (в голове сидит образ студента последнего курса, но на самом деле это может быть кто угодно) которым интересно будет заниматься анализом и оптимизацией поведенческих данных.

Спасибо за пополнение :) Правильно ли я понимаю, что у вас там внутри геймификация какая-то зашита? Можете рассказать подробнее, что именно с анализом данных вы делаете?

Мы поставляем API, которое встраивается в приложение (обычно игры) и обеспечивает функциональность начисления очков (что-то типа виртуальной валюты, которую можно конвертировать в реальные электронные товары) и показа рекламы. Очень упрощенно, можно сказать что данные — это поток событий о поведении пользователя, цели анализа — лояльность пользователя к приложению и таргетирование рекламы.

Пинай начальство, скажи что им надо присутствовать [пиариться] на ДОУ. Оформить нормально организацию [презентовать], чтобы сотрудники оставили отзывы и наполнили рейтинг. Ну и те кто хочет поднимать под собой интернов пусть рассказывают кто-чего-зачем.

Идея проекта достойная. Намекну: что львиную долю дохода Гугл имеет именно через таргетинг рекламы. И этот рынок растёт, растёт, растёт. Если вы действительно готовы поймать удачу за усы и выкусить рыночную долю — стартовать нужно серьёзно, не как стартап. Потому что урвать рынок у Valve — непросто, нужно как минимум иметь столь же глубокий кадровый фундамент. Иначе сожрут и не подавятся.

Другими словами, на ДОУ не только боссам надо появиться, но и инвесторам не грех будет посетить, и интервью дать.

// Серьёзный проект с геймификацией — это круто для Украины. Welcome!

бы хотел задать вам пару вопросов, если вы не возражаете
1.Как стать junior специалистом по data mining нормальному специалисту не по data mining? Таким, чтобы можно было устроиться на работу хотя бы в украинский софт-серв. Я имею в виду, что типична ситуация, когда есть обычный дев, но у него нет достаточного количества знаний чтобы стать таким специалистом. Ему даже не предложат вакансию интерна в вашем отделе. Что нужно делать, чтобы предложили? Coursera? Open-source проекты? Аспирантура? Может каие-то компании готовы брать девелоперов на обучение, если у них есть какая-то база? Какая это база?
2.Я спросил в предыдущем вопросе про аспирантуру. Простите моё любопытство, но я просмотрел Ваш линкедин и меня довольно заинтересовало Ваше образование. Вы не могли бы рассказать о нем побольше? Может что-то посоветовать? В Украине? За границей?
Спасибо.
Ответить

Внизу я задал Сергею эти вопросы, но буду рад, если другие тоже поделятся мнениями на этот счет.

Для меня самым большим открытием было то, что ландшафт ИИ в Украине не только существует, но и постоянно меняется. Я думал, что всё ИИ заканчивается на университетских кафедрах. Оказалось, что есть реальные и главное интересные проекты. И их будет больше. ИИ можно эффективно продавать. В хорошей упаковке методы и технологии ИИ больше всего похожи на чудо.

Привет! Спасибо, что вспомнили нас :-) Если у вас будут вопросы о работе Data Science Group в SoftServe, с удовольствием на них отвечу :-)

Привет, приятно познакомиться :) Вопросов есть у нас, но не знаю, на все ли вам можно отвечать. Поэтому я задаю, а вы решайте :)
1) Чем занимается Data Science Group в целом? Какие задачи решаете?
2) В группе больше хороших математиков/статистиков или инженеров? Много ли PhD и аспирантов?
3) Какой инструментарий используете? Какие алгоритмы и подходы приходится использовать чаще?
4) Как создавалась группа? Как пришло осознание, что она нужна?
5) Какие планы развития группы на будущее? Какие глобальные цели ставятся?
6) Есть ли в компании другие группы, которые занимаются AI? Логично предположить, что есть, раз есть вакансия Program Manager for AI, интересно, чем они занимаются?

Привет, Александр.

1) Мы занимаемся анализом данных и предсказательной аналитикой (predictive analytics). Помогаем решать старые бизнес-проблемы новыми методами :-)

2) Больше математиков и специалистов в теоретических компьютерных науках. У нас нет каких-то формальных критериев и требований по части наличия определенной степени. В группе, в первую очередь, работают талантливые и способные люди, которые знают и умеют использовать самые совершенные методы и инструменты анализа данных. Практика показывает, что такие люди приходят из разных профессий, имеют разный предыдущий опыт и разные степени. Потому они — степени — вопрос второстепенный для нас.

3) Из технических инструментов: Python, R, Matlab/Octave, NVIDIA CUDA. Из фреймворков: scipy/numpy, pylearn2, theano. Также мы разработали собственный инструментарий для построения deep learning neural networks — SoftServe Brain.
По алгоритмам и подходам: мы стараемся использовать алгоритмы, дающие наивысшую из возможных точностей для наших задач. Сейчас довольно широко используем deep learning и unsupervised feature learning. Учить такие сети на CPU довольно долго, потому мы используем GPU для обучения наших нейросетей.
Отдельно надо сказать, что мы не ограничиваемся технической и математической стороной. Понимание экономического эффекта от наших моделей и экономическая оптимизация — тоже часть компетенций группы.

4) Группа создавалась с целью приносить большую пользу нашим заказчикам, для того, чтобы иметь возможность предлагать им эффективные методы решения их проблем. Важным фактором был спрос на рынке. К примеру, McKinsey прогнозирует, что к 2018 году в одних только США будет недоставать от 140 до 190 тыс. специалистов в области анализа данных и до 1.5 млн. аналитиков и менеджеров, которые умеют использовать big data для решения бизнес-задач.

5) Целей и планов довольно много, но, конечно же, очень важным фактором в развитии группы будет обратная связь от рынка и от клиентов. Потому они могут меняться.

6) Самой сильной компетенцией группы на сегодняшний день является machine learning — подраздел AI. В этом смысле вся группа занимается AI :-) Отдельно, artificial intelligence как раздел компьютерных наук входит в нашу модель компетенций, и мы ожидаем от наших дата сайнтистов его понимания и владение его инструментами.

Сейчас довольно широко используем deep learning и unsupervised feature learning.
Круто!

Спасибо за развернутый ответ! Очень приятно удивили :) Надеюсь, в других компаниях тоже удастся найти подобные отделы или проекты.

Если можно, еще несколько вопросов от меня:

1) Сколько людей работает в группе (хотя бы порядок цифр)?
2) Как вы обучаете ваших сотрудников? Наши вузы полноценных спецов же не готовят.
3) Если много членов группы — математики и статистики, есть ли проблема недостатка программерских навыков? Если да, то как вы их компенсируете?
4) С какими основными проблемами сталкивались при развитии группы и как их решали?
5) Вы выполняете больше консультационные услуги для разных клиентов/проектов или есть AI/ML-сфокусированные проекты, на которых ваши сотрудники работают фултайм?
6)

Группа создавалась с целью приносить большую пользу нашим заказчикам, для того, чтобы иметь возможность предлагать им эффективные методы решения их проблем.
Можно ли немного больше конкретики или примеров задач здесь? Без явок и паролей, конечно же :) Все понимаем, что NDA и все такое

1) До 10 человек.

2) У нас есть knowledge model, являющаяся частью data science group competence model, которая описывает навыки, необходимые для наших дата сайнтистов, каждого из профессиональных уровней. Каждый навык разделяется на knowledge items, каждый knowledge item содержит ссылки на ресурсы. Как ресурсы мы используем и онлайн-курсы (Курсера, Юдасити), и литературу, и открытые ресурсы (SEE).

Кроме того, у нас есть практика регулярных встреч группы для обмена знаниями и опытом. Каждый из нас представляет остальным что-то, в чем хорошо разбирается.

Ну, и немаловажно: наши дата сайнтисты посещают самые авторитетные научные конференции в области анализа данных, такие как ICML и NIPS. Это позволяет нам следить за трендами и результатами академии и применять их в работе буквально сразу же после публикации.

3) Такой проблемы практически нет. Наша задача — подготовить аналитическую модель. Необходимые для этого знания в области эффективных алгоритмов и структур данных у дата сайнтистов есть. Интеграцией модели в продукт занимается отдел разработки, мы только помогаем им в этом. Потому архитектура, reusability кода и другие сугубо программистские квалификации нас не касаются. Ну, а если и нужен какой-то совет, мы всегда можем обратиться к нашим программистам и архитекторам :-)

4) Пожалуй, как и в любом другом инновационном начинании: правильное планирование, эффективный контакт с рынком и заказчиками, внутреннее сопротивление изменениям. Ну, а о путях решениях можно писать целый пост :-)

5) И то, и другое. Консультационные проекты тоже подразумевают full time работу, просто длятся меньше и имеют свою специфику.

6) SoftServe предлагает ряд решений (солюшенов) в рамках нескольких бизнес-вертикалей, таких как здравоохранение или банкинг, к примеру. Эти решения создаются с целью покрытия каких-то наиболее типичных проблем отрасли, и в рамках некоторых из них есть место анализу данных. К примеру, для розничной продажи это системы рекомендаций, а для банков — fraud detection.

Я бы хотел задать вам пару вопросов, если вы не возражаете
1.Как стать junior специалистом по data mining нормальному специалисту не по data mining? Таким, чтобы можно было устроиться на работу хотя бы в украинский софт-серв. Я имею в виду, что типична ситуация, когда есть обычный дев, но у него нет достаточного количества знаний чтобы стать таким специалистом. Ему даже не предложат вакансию интерна в вашем отделе. Что нужно делать, чтобы предложили? Coursera? Open-source проекты? Аспирантура? Может каие-то компании готовы брать девелоперов на обучение, если у них есть какая-то база? Какая это база?
2.Я спросил в предыдущем вопросе про аспирантуру. Простите моё любопытство, но я просмотрел Ваш линкедин и меня довольно заинтересовало Ваше образование. Вы не могли бы рассказать о нем побольше? Может что-то посоветовать? В Украине? За границей?
Спасибо.

1) Направление анализа данных в Украине еще очень молодо, и каждая компания имеет какие-то свои практики и представления о месте анализа данных в ее бизнесе. Разнится будут и ожидания от кандидатов, потому мой ответ не претендует на истину для всех.

Дата сайнтист для меня — это, скорее, мировоззрение, а не набор специфических навыков. Если человек действительно любит ИИ и анализ данных, плюс, любит и умеет учиться, это уже полпути к должности дата сайнтиста :-) Деталям и техникам мы научим.

Сейчас очень много замечательных курсов есть на Курсере. Хорошим вступлением в machine learning будет курс Andrew Ng. Курс Джеффри Хинтона Neural Networks for Machine Learning может дать представление о нейронные сетях. Есть ряд хороших курсов по статистике, теории вероятности, R...

Попробовать свои силы можно на соревнованиях по дата сайнсу Kaggle.

Применение анализу данных можно найти на каждом шагу вокруг нас. Кто-то из нас когда-то делал модели предсказания стоимости квартиры — просто для себя. Кто-то — пытался распознавать мысли по сигналам энцефалограммы. Кто-то — писал систему автоматического создания логотипов на основе картинок, которые нравятся пользователю. Примеров масса. Сегодня мы все — SoftServe Data Science Group :-)

2) С удовольствием расскажу. Но чтобы что-то советовать, важно знать, что вы ожидаете от образования и для чего хотите его получать. Если хотите, напишите мне ЛС. Думаю, образование будет оффтопиком в этом треде :-)

Кстати, а что можете сказать насчет ШАД от Яндекса? Они вот снова под НГ выкатили свои лекции: habrahabr.ru/...ex/blog/208034

А образование и карьерный путь зачетные. Думаю, надо намекнуть Мише Марченко, чтобы он с вами подкаст сделал :) Он же теперь тоже в львовском Серве работает.

Про ШАД ничего не могу сказать, никогда не с ними не сталкивался.

Всегда рад :-)

в Финляндии в университете Аалто учусь на магистерской программе Machine Learning and Data Mining,

есть много мест для PhD, весь департамент с 80 года занимается Neural Networks, Pattern Recognition etc., а с недавних пор — Deep Learning, Data Mining итд

А реальные проекты университет делает или только науку двигает? Можете рассказать подробнее?

по моей программе пока больше упор на науку, но в целом у универа очень много проектов в сотрудничестве с крупными компаниями. Науку ради науки здесь даже представить сложно, все наши лекторы работают над своими проектами или в группах, большая часть из них так или иначе связана с индастри и результаты заточены под конретное применение. Я в курсе нескольких проектов по augmented reality, deep learning. Департамент ежегодно получает гранты от государства на те или иные практические исследования

Подписаться на комментарии