Обов'язкові плани на weekend для професіоналів у тестуванні — TestingStage і вибори Президента!
×Закрыть

Кто ищет специалистов Machine learning, data science?

Интересно, а как много компаний ищут специалистов из этих сфер?

LinkedIn
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Всем привет!
Кто может поделиться тестовым заданием для Junior Data Analyst?
Буду признателен!)
maxim.levin@onthe.io

Хрюши, да вы издеваетесь.
Вы сферического аналиста в вакууме ищете или под конкретные задачи?
Если в вакууме, то лучше набивания круглыми люками разноцветных гномиков в боинг 737 MAX 8 ничего не придумали.
Если под конкретные задачи, то и дайте одну из них в упрощенном сильно варианте.

А мы в свинарнике?
Есть тестовое, поделись!

Мы сейчас ищем для клиента с Германии. Обращайтесь

Автор получил ответ через 2 года. Печаль.

Всё нормально, это немцы. Они, бывает, по полгода решаются пригласить на собеседование.

Strong Java / Python programming skills
...
ideally with libraries like TensorFlow
Не, этого не знаю.
matlab, c++ да речевые образы знаю.
Так что не подхожу.

Вот на мыло пришла вакансия «Аналитик» :) Норм....

www.jobs.ua/...y/view/1465162


Если Вы отвечаете положительно на следующее:
— Процессор — это та черная коробочка с лампочками.
— Компьютер — это та штука на столе, где всё показывают.
— Можно ли закачать Интернет на компьютер?
Вы нам не подходите.
:))) Да и зп у них ниче ? Как думаете ?

бесплатный проезд в троллейбусах и трамвае — это очень мотивирует!

Высшее техническое образование в области IT или радиоэлектроники
и
— Процессор — это та черная коробочка с лампочками.
— Компьютер — это та штука на столе, где всё показывают.
— Можно ли закачать Интернет на компьютер?

Спечатляет. Это такие студенты у вас нынче?

Должность: Аналитик/Оператор ПК

«Аналітик» — це для пафосу. Реальність: це буде Оператор комп"ютерного набору за мізерну ЗП (до 2к грн) із постійними овертаймами.

Ой, у меня компьютер не работает. Спасай. А она то всего-лишь монитор не включила. Видал таких, правда никогда подобной работой не занимался. Это так о работе.

Вот только нафига им

Высшее техническое образование в области IT или радиоэлектроники
?

Деградація вишкої освіти і освіти загалом... Якщо не має «папірчика» ВУЗу, тоді це повний *** для офісної роботи.

Вимога щодо технічних спеціальностей: можуть набивати дані для Укртелекому чи щось подібне. Є шанс, що випускники-технарі (навіть і такі, що готові працювати за мізер) не пропустять дурниць.

Maybe you could come to our deep learning group, you will find companies) dou.ua/...ms/topic/12772

Настоящая задача по настоящей data science
Вот прислали на медне ссылочку на статейку.
ord-ua.com/...itikom/?lpage=1
В общем-то, если то, что написано там — правда, то вот оно реальное, полезное, нетривиальное применение науки «об извлечении информации из кучи наваленных данных». Тем не менее — даже представить себе не могу, как он это делает. Даже если предположить, что он сидит за компьютером по 20 часов в сутки, все равно извлечь такие данные, реально отследить цепочечные ссылки, провести параллели, вычленить детали, .... у меня в голове не укладывается. Делать все в ручную? Или использовать какой вспомогательный софт? Никаких идей. Даже близко.
Кто там жаловался, что нет реальных задач? :-) Вот вам вполне sucsess story о том, как data science может найти место в реальной жизни. И — за одно — идея для неплохого стартапа :-)

Ручками сер, они и не в одиночку, а толпой. Но вожно автоматизировать сей процес, но кому надо в спецслужбах сей софт они имеют уже — остальным он нафиг не нужен.

У нас есть отдел, мы периодически берём людей :)
Из того, что я знаю по другим компаниям вакансии периодически появляются, но спрос еще не так велик, как хотелось бы. На других специалистов он значительно выше.

Посколько не описали детелей, как Dmitry Gerasimenko, может я буду вам интересен. Все есть в моем профиле, предпочтительна удаленка.

Виктор, будем иметь в виду, если будут задачи по распознаванию речи.
Чем-то еще занимались?

Последнее время сделал одному простейших поиск слов (с морфологией — слова могут изменяться по формам, дальше ничего не надо было, так что до языковых моделей не пошел), основываясь на словаре Хагена.
Сейчас вот вашему АТО с БПЛА немного помогаю там 3D графика и немного численных методов.
Опыт у меня больше в идентификации диктора, обликовых харасктеристиках, эмоции и т.д. , что из речи можно получить, а это первичные вектора-признаки (LPCC, MFCC и т.д. их много разных — для каждой задачи нужно оценивать оптимальные). Затем Гауссовы смеси или еще что из матстатистики попроще и метод опорных векторов (SVM). Это все как бы большая часть machine learning.
В визуальных образах не знаю сейчас нижнего уровня: фильттрации, выделения признаков, верхний он схож с тем же, что и в речи.
Работаю в стиле алгоритм на матлаб, порт его на с++. На выходе готовая либа с документацией.

Вы бы написали, что вам надо. В общем я готов сменить область, но прекрасно понимаю, что на вникание в другую область уйдет время, так что вначале буду почти как студент.

У нас сейчас различные проекты идут, но обработки речи нет. DSP, Time Series forecasting, классификация/регрессия. Конкретно сейчас справляемся силами нашего текущего состава, но присматриваемся к толковым людям на будущее.

Спасибо за развернутую информацию.

Time Series forecasting
Финансы что-ли?

Не совсем. Цены на авиабилеты

Так они же в первую очередь зависят от затрат плюс прибыль. Или они сейчас уже как торги на бирже?

Очень похоже. Компании пытаются максимизировать свой доход — продать как можно больше мест в самолете за как можно большие деньги. Но при этом есть же еще и конкуренты, летающие по тем же направлениям. Судя по колебаниям цен, там уже серьезные модели стоят в каждой компании, которые занимаются ценообразованием, учитывая туеву хучу факторов, включая цены конкурентов.

Где-то я встречал проект, в котором пытаются предсказать специальные ценовые акции авиакомпаний. На основании конечно ДатаМайнинга. Интересно, на сколько это возможно с учетом того, что в конечном счете решение принимает какой-нибудь директор, т.е. весьма велика вольюнтаристская составляющая?

пытаются предсказать специальные ценовые акции авиакомпаний. На основании конечно ДатаМайнинга.
ШТО Я ПРОЧИТАЛ? :)
З.Ы. А вообще если есть слово «акции», то от проекта надо сразу морозится :)

Акции — они бывают разные :-).
В данном случае — это специальные праздничные или еще какие-то цены на билеты на определенные направления или даже конкретные рейсы, в конкретные дни. Я например, недавно был удивлен, когда узнал, что знакомый купил билет из Мюнхена в Киев и обратно (!!!) за что-то около 150ЕВРО со всеми сборами и налогами. При «обычной» цене — в районе 600-700.
Вот это и есть пример «акции авиакомпаний». Так что надо-ли от них морозиться,? Не уверен.

Вот это и есть пример «акции авиакомпаний». Так что надо-ли от них морозиться,? Не уверен.
Тут мы вступаем в на тонкий лед того, что можно предсказать в рулетке, а что нельзя. Фактически, если у тебя есть инсайдерские документы определения цены конкретной компаниий, то вероятность предсказания цены будет высока, если нет, то можно пытаться вычислить этот подход на основе внешней информации. Вот степень успешности сего действа под большим вопросом. Со стороны — это как предсказывать цены на форексе. Играть с плюсом можно, а вот предсказать цену в конкретный момент времени нельзя.

Это ж интернет, обычно можно закраулить количество свободных мест в самолете с экрана выбора места, если за определенный промежуток времени перед рейсом места еще не раскуплены — жди акций.

Можно вот только акции иногда объявляются месяца за три до рейса. Причем на разные рейсы. Вот и решай турагенствам всяким — что лучше брать билеты пока дают, а они могут и подорожать ближе к дате вылета, или ждать акции. Причем акции могут быть только на определенные рейсы, только на определенные даты и пр.пр. пр.
Тут или к гадалке — или к специалистам по датамайнингу. :-)

Можно вот только акции иногда объявляются месяца за три до рейса.
Ну так для этого и нужно машинное обучение — заоптимизировать функцию вероятности акции за н месяцев до рейса базируясь на куче всяких данных вроде заполненности рейсов, индексов потребительской активности, цен на бензин, релевантной активности в соц сетях, и т.д.

И получить в итого равномерное распределение.

Билеты из KBP в MUC никак не могут в среднем стоить 600-700 евро. ЗА 600-700 евро можно слетать в штаты, или в юго-восточную азию (и обратно :D). В Мюнхен стоят 150-300 евро. Хотя бы потому, что в Мемминген летает wizzair.

Простите, Вы это говорите со знанием дела — или просто так?
Жаль, сюда нельзя прикрепить скрин экрана.
Поэтому делаю копию прямо с экрана запроса стоимости билетов рейса среда, 04.03.2015 15:35 PM
Международный аэропорт Киев-Борисполь (KBP)
Мюнхен — Франц-Йозеф Штраус (MUC)
пятница, 06.03.2015 19:20 PM
Мюнхен — Франц-Йозеф Штраус (MUC)
Международный аэропорт Киев-Борисполь (KBP)

Расчёт стоимости
Цена за пассажира Количество пассажиров Промежуточная сумма
Взрослые 15,777 UAH x 1 15,777 UAH
Взрослые 16,186 UAH x 1 16,186 UAH
Общая стоимость билетов за всех пассажиров, вкл. налоги и сборы 31,963 UAH (1)

Один билет, туда и обратно, Economy Flex класса.
31,963 UAH — переведете в ЕВРО сами?
Для справка, тариф Economy Basic — обойдется 20,079 UAH. Это самый дешевый тариф. Сколько это там в ЕВРО получается?

Проект интересный, но при чем тут ИТ вообще? Сажаем по «уточке» в маркетинг каждой из интересующих авиакомпаний = профит!

Тут уже много постов на эту тему было.
Фактически в Украине ищут уже готового спеца в их узкой области и не более, а если не наудут американского спеца пригласят (если очень надо). Причина, скорее всего проста — цена. В Америке такой спец в несколько раз дороже. Да и спецов различных в америках больше.
А вот для специалистов есть проблема. В глубокие познания в узкой области ты идешь десятки лет и область становиться все уже. В итоге дальше простая лотерея, если оказалась вакансия по твоей узкой области ты на коне, если такой нет, ты без работы.
Вот как мой пример: ЦОС, machine leаrning, matlab, C++. Ни распознавание визуальных образов, ни data mining я сходу не знаю и надо изучать (а в вакансиях нужен здесь и сейчас готовый с узкими конкретными знаниями) — а это время (и ни одна контора не готова его оплачивать).
Все. Или ждать вакансии в своей узкой области исключительно или переквалифицироваться в джаваскрипт (идти обычным програмером в аутсорсинговую контору, а им 50летние не очень интересны). Так же и с другими узкими направлениями широкой области data science.

P.S. Итог и как совет молодежи, не лезьте здесь в науку, а если очень хотите, то максимально быстро сваливайте на Запад.

В Украине готовых спецов ищут «неготовые» рекрутеры, поэтому «искать» бесполезно.

Нет. Рекрутеры — это просто трата несколько недель на доступ к тому, с кем будешь собеседоваться. Это так бессмысленная и никому не нужная прослойка.
А причина глубже. Здесь по сути не занимаются исследованиями и разработкой чего-то относительно нового. 99% задач — нужно как можно быстрее прикрутить какой-то известный алгоритм (чаще просто выковырять его из инета). Для решения такой задачи больше всего подходит человек, что уже решал эту или очень близкие задачи.
Соответсвенно брать кого-то, кто будет вникать в тему, разбираться и после что-то сделает — просто не выгодно. В таком случае выгоднее уже искать кого-то во всем мире, кто эту задачу уже решал и кому смогут оплатить. Иностранцы — дороги.

Вот недавно общался с одними, типа ищем человека, кто будет делать у нас распознавание речи, достукался до непосредственного нанимающего — оказалось, что нужен человек, кто максимально быстро заюзает опенсурсный сфинкс и их западный заказчик будет это продавать под своей разработкой. А я вот, именно сфинксом не занимался, я всегда сам разрабатывал алгоритмы в области рядом, а не прикручивал имеющиеся (сам на конторе поднял скандал, когда пару человек хотели так встроить опенсурсный софт в проприетарный продукт — директора решили, что риск судебных разбирательств им не нужен). Соответсвенно не подхожу. Да и по сути им нужен студент, который внимательно прочтет доку и подключит сфинкса.
Или другой пример, как достучался до непосредственного специалиста, оказалось, что ребята занимаются оптимизацией кода (хоть и для обработки речи) для различных железяк (а код им с запада присылают и алгоритмы там же разрабатывают). Хрюшки не в курсе, чем толком занимаются на конторе.Этот абзац был о хрюшках.

I think the job market exists, but remains unstructured. Job offers are scattered, and lack visibility. Use your data mining skills to find them))

Speech about Ukraine and here there are 1-3 vacancies per years.

most jobs are not advertised, and if he does not find a local company, he can still work remotely (for example, for an American company). He should focus on getting the right skillset, because this specialty is moving fast.

Yes, of course, and first is good verbal english ;). And here many people does not have it. They should getting

right skillset
.
Many people here has not enought verbal english and it’s problem for them.
And theme here is more about why such jobs are too low here and should they do for it.

ok, then I agree, it is probably too early for this job market. better to stick to established fields. but there are still few job offers, and it will probably grow in the future.

he can practice verbal english for free here: languageexchangekyiv.ning.com/...ishconversation

tuesday and saturday, mostly

Пока рынок пуст, к сожалению, в отличие от зарубежья. А если и вскочила вакансия так и та — на технологичность 2-х летнего владения навыками с редким ПО, которому от роду ... полгода.

Просто оплата твоего времени на вникание в узкую область и после получение от тебя результата сравнима с оплатой готового американского специалиста и соответсвенно ты не выгоден местной конторе. А ты знать все не сможешь никогда.

Так может я интересен буду? В профиле все есть (линкедин).

У вас опыт в другой предметной области. Мы работаем с текстом, графом ссылок, социальными сигналами и т.п.

Небольшой опыт с текстом был. Простейший поиск с использование словаря Хагена. До языковых моделей не понадобилось идти.
Но machine learning в идентификации диктора по голосу — это основное. Там в упрощенном виде цепочка MFCC -> GMM — SVM.

У вас опыт в другой предметной области.

Да, для дата саентиста это ж главное многолетний опыт в предметной области ! sarcasm.jpg :)))

А как вы представляете вообще работу ДС, интересно узнать ? Типа часа 3 приводишь б**е данные к нужному тебе виду, потому что кто-то *** и скрипта нужного нет, а потом часа 4 просто думаешь-читаешь, после того как пропробовал разные подходы к данной областе и данной задаче... Времени писать код больше занимают сложные графики (дето около часа) и таки да, свои функции и «програмирование». Минут 10-20, строчек 20-30. Так ???
Бо некоторые вакансии приведенные ниже, это тупо Facepalm. Охрененно :

3+ years of experience with Java
5+ years of experience with Text Mining/Text algorithms

Пусть наши работодатели разберутся кого и зачем им нанимать. Им нужен синьер джава програмист + с навиками и опытом применения, например, некоторых стат моделей, или им просто нужен чел, который разбирается в этих моделях/алгоритмах с навыками программирования ?? Или им вообще нужен космонавт, нафиг ?
Короче в Украине с этим туго...

Скажу, как датасаентист с хорошим стажем — 80% собеседований имели вопрос типа «А вы на джаве кодить для бигдата можете и архитектуру кластера поднять?»

А могли еще по макросам экселя погонять!

Т.е. то что называют здесь под machine learning это джава, хадуп и немного МС?

Т.е. то что называют здесь под machine learning это джава, хадуп и немного МС?
Это «data science» очевидно а не машинное обучение

Вот и еще один рекламный термин по типу БигМака (тьфю БигДаты). Ибо там только программирование и 0 саенс.

Да, я хотел написать data mining но протупил.
Датасцайнц это действительно хрень непонятная

А вот data mining очень разный и перейти из одной области в другую полгода или год нужен.
А в Украине, если ищут то толко со 100% попаданием в их требования и чтобы ты сразу все начал делать и знал как делать.
Воот например ты с визуальными образами работал, что перейти в речевые тебе минимум год и с учителем понадобиться.

Ты про какой то не датамайнинг говоришь. Датамайнинг это когда у тебя есть огромная свалка всяких логов, данных, и т.д., а ты сидишь их разбираешь, парсишь, упорядочиваешь, мерджишь, джойнишь, выдергиваешь полезную инфу что бы потом бизнесу построить какой то график, или какой то датасет полезный вытащить.

Я написал о затратах времени по переходу из одной узкой области в другую. А вот построить кучку различных графиков по данным и простой программист сможет. Может не надо это называть data mining?

Но твои узкие области датамайнингу иррелевантны

Я не знаю насчет речи и образа, с ними не работал, но вы упамянули, что там используются те же статистические модели типа SVM, GMM, сети, и в моделях, наверно, ж теже задачи как то сравнения какая лучше, подбор всяких конфигураций типа ядра и т.д. Да и потом построение графиков и автоматизация/"прикручивание" интерфейса на каком то языке программирования остаются неизменными для любой области. То есть если есть мат. подготовка, то можно попробовать разобратся и «перепрыгнуть» в другую.

А если работаешь с таблицами данных то «область» очень важна для постановки стат гипотез, а для задач регрессии/классификации как то и не сильно (главное знать в общих чертах)... Да и «табличные данные» покрывают где то 80% (дето читал что с текстом работают 15% и на все остальное 5%(голос, изображение и т.д.)). Но я конечно хз.

Да, можно. Но нужно время на изучение «первичного анализа» — выделение векторов признаков, применяемых в данной области — это полгода съест. В речи для не стандартных задач взять вот сходу какой случайный нельзя, обычно надо из всех возможных выбрать наиболее важные и по ним уже работать в конкретной задаче (ГА тот же, но тут уже упираешься в железо — суперкомпьютеры деньги стоят, так что специфические познания нужны пока). И вот эти знания не за 1 месяц приобретаются и даже не за полгода. А еще понимать их физический смысл.

И вот здесь затык. Все хотят сразу готового спеца в их узкой области и не готовы первые полгода оплачивать тебе учебу на работе. Все возможные области и подоблати и за 3 жизни не изучишь, остается только надеятся, что повезет.
Вот тут было:
«Как определить какие ссылки низкого качества (купленные, искусственныe, спам,... )?
Как рассчитать рейтинг страниц (лучше чем то что есть)?
Как определить какая тема у каждой страницы? Какой тип?
Как определить осмысленный текст или нет? Какая часть текста на странице уникальный контент этой страницы?
Как определить изменение метрик естественное или искусственное?
...
Как эти задачи решить так, чтобы принимать решение хотя бы сотни миллионов раз в день, и не выйти за бюджет?»
В этой области, чтобы перейти до стандартных путей из распознавания надо сначала пройти и изучить весь нижний уровень выделение признаков — а это полгода займет приналичии наставника. Это кучи статей перечитать и понять надо. Я бы с удовольствием в эту область вошел, но кому я нужен в варианте, что первые полгода буду только тему изучать и только после смогу что-то реально полезное делать.
И на собеседованиях на этом все заканчивается — всегда нужен спец здесь и сейчас, по крайнем мере в моей окрестности (Украина, РБ).
А для иностранцев нужен английский уровня свободно понимать иностранца и свободно с ним объясняться. Для чего тоже нужно время.

Все хотят сразу готового спеца в их узкой области и не готовы первые полгода оплачивать тебе учебу на работе.
Здивуєтеся, але і готовим спецам не готові нормально платити на території колишнього совка (включаючи аутсорс) та й, наскільки орієнтуюся, на фрілансерських біржах.
І навіть за готові продукти на рівні топ-10 (у більш вузькій ніші) бажання платити на рівні високоплачуваних java/c++: «Мозок той-таки ж...»

На это я уже давно забил. Прошу около $12 в час. Но обычно все заканчивается, вы специалист в другой области — досвидания. И я их понимаю. Но мне от этого не легче.

Я бы с удовольствием в эту область вошел, но кому я нужен в варианте, что первые полгода буду только тему изучать и только после смогу что-то реально полезное делать.
Зазделегідь вибачте, що втручаюся не у свої справи. Ви про це пишете як мінімум рік. А чи не варто було цей рік провести із користю та вивчити самостійно розпізнавання зображень (маючи таку хорошу практичну і теоретичну базу у суміжній області)? Це швидше риторичне запитання.

Выучить можно, но спрос на них чуть больше, чем на речь. Проблема в том, что не знаешь что учить. Всегда оказывается нужно что-то другое, а не то, что ты учил.
Ну да, моя вина, что не выучил. Также моя, что не знаю английский на хорошем разговорном уровне и много еще чего — это моя вина.
Просто это еще 10 лет назад не мешало работу находить, а стало значимым после 45.

А нюансов море. Возьму ту же GMM, для их сравнения используют Кулбака-Лейблера меру. Но нагугливаемый алгоритм ее вычисления дает очень грубую оченку сверху, мне в одной задаче такая не подходила, пришлось реализовать расчет по Монте-карлу. И вот такие нюансы узнаются только с большим опытом в конкретной области.

Ну выбор меры, оценка и т.д. уже ж к датасаенсу относится, а не к области. Но я понял, что к области относится выделение признаков и в этом весь «трабл».....
З.Ы. мне аж жалко, что "монте-карлом"/бутстрепингом/перестановками с матерым компом можно все что угодно оценить :(( И что делали люди 50 лет назад ? :)

Но я понял, что к области относится выделение признаков и в этом весь «трабл».....
В первую очередь. А это знание саой области. А вот методы распознавания — они почти стандартны.
З.Ы. мне аж жалко, что "монте-карлом"/бутстрепингом/перестановками с матерым компом можно все что угодно оценить :(( И что делали люди 50 лет назад ? :)
Тогда не решали таких задач. Другие были. Это раз.
Но Монте-карло в определенных случаях наиболее удобен. И Монте-Карло уже как лет 50 используют.
Еще в девяностых, для оценки смеси использовали VQ, потому как EM подход железо в массе своей не тянуло. Хотя и сейчас оно осталось в случаях, когда EM не будет работать. Правда ЕМ тогда и изобретали в 90-х. Посмотри когда тотже SVM появился (Вейник) и когда его массово стали применять.

А вот уже ГА и сейчас непросто применить, крутиться приходиться, чтобы время разумное было. Железо еще не тянет.

Ибо там только программирование и 0 саенс.
На самом деле наверное есть science, вот у меня знакомый работает на винчестерной фабрике, они там собирают туеву кучу всяких чисел телеметрии с разных экспериментов, и он потом над какими то моделями в SAS корпит, что бы новые технологии винчестеростроения развивать, наверное наука.

И вот переход в дуругую область, например обработки текстов займет у него от полугода и больше.

Переход у него займет один день — перетащить попу в другую контору. Ну а на новом месте да, прийдется много учить, ну так это всегда так.

Значит твой друг гениален, странно, что до сих пор между делом не разработал теорию всего.

Та нет, не гениален, программисты все время между областями скачут, типа нет проблемы перескочить с финансов в интернет стартап. Почему у дата сцайнтистов-аналистов должны быть проблемы?

на винчестерной фабрике
В Украине есть такая фабрика? В РБ точно таких нет.

Для меня это звучит, как там Раю.

Для Data Scientist может быть важным продолжать прокачиваться в выбранной области. Это выбор Data Scientist. Предупредить его — хороший тон, так ведь? ;)

Опишу примеры задач которые актуальны для нас:
Есть индекс ~150млрд html страниц, ~5трлн ссылок между страницами, ~5млрд страниц каждый день обновляются.

Как определить какие ссылки низкого качества (купленные, искусственныe, спам,... )?
Как рассчитать рейтинг страниц (лучше чем то что есть)?
Как определить какая тема у каждой страницы? Какой тип?
Как определить осмысленный текст или нет? Какая часть текста на странице уникальный контент этой страницы?
Как определить изменение метрик естественное или искусственное?
...
Как эти задачи решить так, чтобы принимать решение хотя бы сотни миллионов раз в день, и не выйти за бюджет?

Я думаю что 95% людей, считающих себя Data Scientist, эти задачи поставят в тупик. Нам интересны оставшиеся 5%. Язык программирования не очень важен. Но со знанием OCaml будет проще.

Т.е вы ищете именно человека со знаниями в этой узкой области, который придет со своими наработками и за пару месяцев все реализует?
В этом случае да, действительно нужно искать именно специалиста, что уже долго работал в этой области. Но есть ли такие в Украине. Если есть, то он уже работает в этой области и каков шанс, что перейдет к вам.
Т.е. по сути играете в лотерею, придет, повезло, не придет, ну и фиг с ним.

З.Ы. Да, действительно у меня опыт в другой области и для варианта прийти и сразу все сделать я не подойду, где-то несколько месяцев, как минимум, нужно изучать область. И даже больше, вполне возможно вам выгоднее взять умного студента по рекомендации преподов и его уже подготовить, чтобы через пару лет он слинял в америки ;) (шутка).

И еще добавлю. Хорошо, если в Украине 20 спецов, что работали в разных областях data science. Итого 5% — это тот единственный, который вполне вероятно уже работает и не собирается уходить (вероятнее всего уже работает на Гугл или Яндекс).

Т.е вы ищете именно человека со знаниями в этой узкой области, который придет со своими наработками и за пару месяцев все реализует?
нет.
Мы ищем человека, который способен решать такие задачи, вот и все.
Но есть ли такие в Украине.
Мы ищем не только в Украине.
Итого 5% — это тот единственный, который вполне вероятно уже работает и не собирается уходить (вероятнее всего уже работает на Гугл или Яндекс).
Задача сложная, не спорю.

---
Обратите внимание, как много здесь уже удалось нафантазировать (думаю, с помощью переноса своего предыдущего опыта на незнакомого человека) всего их трех фактов:

Мы ищем.
У вас опыт в другой предметной области. Мы работаем с текстом, графом ссылок, социальными сигналами и т.п.

Так не хочется срача разводить про нафантазировать.
Просто общение и выяснение непонятных моментов. Вот тут же вопрос сразу возникает:

нет.
Мы ищем человека, который способен решать такие задачи, вот и все.
Как вы это определять будете? Кто способен, а кто нет. Вот мне же сразу отказали потому как
У вас опыт в другой предметной области.
. Да, я категорически не напрашиваюсь (99%, что я вам не подхожу), просто интересно как вы оценивать способность будете?

В первую очередь интуиция. Есть много сигналов по которым видно, насколько человеку интересно решать наши задачи, и насколько у него это будет получаться. Большинство кандидатов можно отсеять просто беглым взглядом в резюме или код.
Но основной критерий — тестовое задание.

Вам, кстати, не отказывали. Я указал что опыт у нас в другой области, в данном случае это имеет значение, потому что различия существенные. Если вы уже хорошо разбираетесь в speech recognition, то нужны весомые причины переходить в другую область. Предполагалось, что если у вас они есть, то вы найдете способ в этом убедить.

Даже немного уже получается. Дока в идентификации, распознавание немного другое. И в общем-то те кто занимаются идентификацией не занимаются распознаванием и наоборот — есть нюансы, которые требуют узкого опыта (но, понятно с задержкой небольшой перключаться могут). И в общем я готов сменить область, но прекрасно осознаю, сколько времени может понадобиться на смену. На речь, чтобы вникнуть глубоко нужно 5 лет минимум (если не 10).
И да, убеждать я вас не планировал, предложился, не подошел и бог с ним.
Спасибо за объяснение четкое и понятное, что вы хотите найти и что ожидаете от кандидатов.

З.Ы. И, вдруг будут какие небольшие отдельные задачки из области machine learning, могу поделать удаленно (уточню сразу, сначала делаю алгоритм на матлабе, затем порт на с++, если нужно), имейте в виду меня на будущее, мало ли что. Но вашу область, я, конечно, совсем не знаю, а время на изучение нужно прилично. Фактически первые полгода я был-бы ничем не лучше студента.

З.Ы. И прислушайтесь к совету взять умного студента (по рекомендации преподов, которым доверяете). Я так делал в своей области. Да, полгода за ручку водишь, а потом уже можно и отдачу нормальную получить.

Есть много сигналов по которым видно, насколько человеку интересно решать наши задачи
Подсказка: задачи они везде одинаковые +/-. Попробуйте предложить денег, эдак баксов 50 в час — думаю найдёте достаточно быстро
Подсказка: задачи они везде одинаковые +/-. Попробуйте предложить денег, эдак баксов 50 в час — думаю найдёте достаточно быстро
Люди с достаточно годными мозгами для решения описанных задач выезжают в силиконовку и получают в районе 150-200 баксов в час.

Только выезжают еще студентами и там защищают пхд. А после ппо контактам там же находяь работу.

Та ну, ерунда, можно сделать опенсорс тематический проект, пройти собеседование в гугл/фейсбук/мс/эпл, и там уже водятся такие ЗП, пхд не обязателен.

В этой области проекты не за месяц и 2 пишутся, а годами. Это раз.
Второе — собеседование в означенные конторы описано и они здесь набирают исключительно программистов с теоретическими знаниями — вероятно такой глючный софт у гугла в больших количествах.
А вот уже, если твой проект получился крутой и ты раскрутился, возможно они купят тебя, как контору.

Ну так выше и обсуждали программистов.

Причина для Data Scientist может быть банальной — желание попробовать себя в другой предметной области. Ведь часто на этой позиции работают люди, которые раньше занимались наукой при вузах. И которые поэтому привыкли реюзать (reuse) подходы мышления для решения разных задач, а не применять (apply) постоянно способы решения нескольких задач для разных входных данных, к чему приводит работа длительное время в одной и той же предметной области.

Если человек не теряет в зарплате, переход в другую область для него может быть чем-то вроде challenge.
Соглашусь, вакансий для Data Scientist в Украине почти нет...

А почему вакансии не публикуете тут?
jobs.dou.ua/...refs/vacancies

Походу не очень то и много. Ну по крайней мере в вакансиях пишут или непонятно что (чисти масив за 3к гришек :) ), или с уклоном на Большие Данные с требованиями Джава, ООП и тд. и тп :) На фрилансе вроде работа есть, но там конкуренция ппц.

Пока пусто по моим наблюдением.

Подписаться на комментарии