Data Scientist роль у продуктових компаніях Канади

Усім привіт!

Вирішила конвертувати свій величезний нетворк у всьому світі у корисний контент. Тепер проводжу відкриті прямі ефіри з нашими спеціалістами, які працюють у великих компаніях, і разом із ними досліджую аспекти їхніх ролей: що від них очікують компанії, які хард та софт скіли важливі, які особливості найму в тих країнах, де вони живуть. Ефіри проводжу на Лінкедін-сторінці (вони всі зберігаються). Якщо у вас будуть побажання щодо питань чи спеціалістів, пишіть мені в особисті.

На DOU публікуватиму найважливіше з розмов.

Говорила з Оксаною Курило, Data Scientist у Chegg Inc (Канада). Оксана більше ніж 7 років працює з Natural Language Processing, 2 з них — у міжнародних компаніях в Канаді. Має Master’s Degree у Data Science in Computational Linguistics (University of British Columbia). У 2020 році була директоркою Women Who Code ком’юніті в Києві. 😌 Якщо коротко, то Оксана — дуже класна. Ділюся розмовою.

  • Які завдання ставить бізнес перед тобою як Data Scientist? Яка роль Data Scientist у міжнародному технологічному продукті?

Data Scientist — це професіонал, який спеціалізується на отриманні знань із даних, за допомогою алгоритмів машинного навчання, статистичних методів та інших методів штучного інтелекту. Роль Data Scientist у компанії залежатиме від того, яка це компанія, команда та проєкт.

Якщо це стартап, ви будете на всі руки майстер. Крім завдань Data Scientist, це можуть бути і функції Data Engineer, тобто ви будете налаштовувати ETL-процеси, готувати дані (збір, очищення та інтеграція даних з різних джерел). Чи роль включатиме ML Ops — побудову інфраструктури навколо вашого рішення.

Якщо це компанія, яка вже давно на ринку, тут ще потрібно відповісти на питання, чи вона data-driven. Компанія може бути великою, але при цьому ніколи не збирати дані, або збирати тільки якусь частину. Чи, наприклад, якщо в компанії вже все налаштовано.

В них може бути data science відділ, а може бути команда data engineers та окремо data scientists. І від цього, відповідно, залежатиме роль. У цьому кейсі, коли вже все налаштовано, ви можете працювати більше над побудовою моделей, читати останні наукові дослідження та імплементувати їх. Тобто це буде зовсім інша робота.

Ще хотіла додати про команду. Коло обовʼязків відрізнятиметься від того, чи ви приєднались у команду data scientists/data engineers, чи у команду backend/frontend, і ви на проєкті одна/один (чи перша/ий) data scientist. І, звісно ж, залежатиме також від проєкту та домену.

Тому у мене немає загальної відповіді про особливості роботи data scientist в Канаді. Усе залежатиме від компанії, команди і проєкту.

Наприклад, у моїй компанії є data science відділ. Команда розташована у США, і вони працюють над одними завданнями, а я приєдналася до проєкту, де взагалі немає data scientists, є back-end та front-end інженери, і вони ніколи не працювали з data science. Тому специфіка ще й у тому, що потрібно по-іншому комунікувати свої ідеї.

  • Наші глядачі ставили таке питання: де пролягає межа між data analytics та data scientist?

Data Scientist і Data Analyst відрізняються колом обовʼязків та стеком технологій. Data Analysts зосереджуються на інтерпретації наявних даних, створенні запитів і відображенні аналітики даних. Усе, що пов’язане з візуалізацією, тобто з використанням різних дашбордів, таких як Power BI, та написанням SQL-запитів. Data Analyst тісно працює з бізнесом, ви будете мати конкретні запитання, на які треба давати відповіді. З іншого боку, Data Scientist працює з ширшими запитанням для прогнозування майбутніх тенденцій і поведінки.

  • Чи бачиш ти певні особливості у вимогах до Data Scientist конкретно серед канадських компаній? І в чому вони полягають?

Тут більше звертають увагу на освіту, ніж в Україні. Сам університет не настільки важливий (хоча звичайно, що чим кращий, тим більший плюс для резюме), насамперед хочуть профільну освіту в computer science, статистиці, математиці, data science, фізиці. Після появи LLMs (large language models) почали включати комп’ютерну лінгвістику, і навіть просто лінгвістику.

Багато є класних позицій для тих, у кого є PhD, і їх можна отримати одразу після закінчення університету. У вас зарплата буде вища, ніж у магістрів чи навіть того, хто вже працює кілька років. Я не скажу, що така як у senior, але все одно може бути вищою.

Якщо ви приїжджаєте в Канаду і взагалі не маєте комерційного досвіду, і крім цього, не маєте потрібної профільної освіти, то ваше резюме просто не буде сильним порівняно з резюме канадського студента. Тобто перша відмінність — це освіта.

Друга, як на мене, це мова програмування. В основному — це Python, але може бути і R. Я бачила менше в українських позиціях саме мову програмування R, але в Канаді її більше використовують у державних установах, лікарнях. І третя, не те щоб і відмінність — це англійська мова. Розмовна англійська має бути на хорошому рівні.

  • Освіта має бути в основному канадська або американська, чи європейська?

Ні, це може бути європейський чи наш український виш. Якщо у вас є достатньо років досвіду і хороші проєкти, на освіту не так звертатимуть увагу. Але що менше у вас досвіду, то краще, щоб у вас була профільна освіта.

  • Які типи проєктів / бізнесів, на твій погляд, зараз і в найближчий час потребуватимуть Data Scientists? На чому твоїм колегам варто зосередити увагу в плані розвитку в цій професії?

Я думаю, що всі компанії певною мірою будуть data-driven компаніями, і їм будуть потрібні data scientists. Тобто тут немає якогось тільки одного визначеного домену чи типу компаній. Я б дивилася на те, що зараз у тренді, наразі — це generative AI.

Тобто, якщо ми говоримо про NLP, ви маєте вміти працювати з large language models. Ви маєте вміти працювати як з open source моделями, наприклад, Mistral, так і з моделями від open AI. Ви маєте розуміти, принаймні, що таке prompt engineering і як з ним, за потреби, працювати. Також все, що пов’язане з deep learning, нейронними мережами, RAG та векторними базами даних і таке інше. Тобто це все, що зараз продається.

Якщо ви плануєте бути full stack data scientist, то маєте вміти робити все, як зі сторони data engineer, так і MLOps, тобто full stack. Попит на full-stack є. Що більше ви можете автономно працювати, то більше у вас є шансів потрапити у ті компанії, які тільки планують бути AI компаніями, і ви зможете робити майже все.

Ви можете бути там першою data scientist, і це буде набагато краще, ніж ви будете фокусуватися, відточувати якусь одну технологію. Так, ви generalist, але у вас може бути фокус тільки NLP, тільки computer vision. Чи, наприклад, працювати тільки в домені медицини. Головне — це широкий спектр інструментів, а далі ви можете фокусуватися на якомусь домені, і таким чином ви більше підійдете певним компаніям. Наприклад, їм потрібен саме такий спеціаліст, і їм важливо, що ви вмієте працювати з природньою мовою в домені медицини.

  • Я чую від кандидатів, що канадці дуже люблять кандидатів саме з канадською освітою. Хоча б якісь курси мають бути, але канадські. У тебе ж саме канадська освіта?

Коли я почала працювати у 2013 році, комп’ютерна лінгвістика була чимось новим, і я та мої одногрупники не дуже розуміли, що з нею робити. Я починала з ролі компʼютерного лінгвіста, далі NLP Engineer. Я вже працювала data scientist, але, коли вирішила переїхати в Канаду, хотілося бути більш конкурентною на цьому ринку. Я не була впевнена, що диплом з прикладної лінгвістики і невеликий досвід у ролі data scientist будуть достатніми.

Я чула, що до своєї першої роботи в Канаді твої роки досвіду не так цінуються, бо для них більш зрозуміло, коли є саме канадський досвід, хоча, відверто, я досі не розумію, чим він відрізняється від нашого українського. Але кажуть, що після досвіду роботи в першій канадській компанії, весь твій досвід стає валідним 🙂

  • Наскільки потрібно мати комерційний досвід у data science, щоб потрапити на junior-позицію? Чи можна презентувати некомерційні проєкти у цій сфері як своє портфоліо?

Якщо у вас профільна освіта, але немає комерційного досвіду, отримати роботу буде дуже важко. Зараз я буду не дуже коректною. Уявіть собі, є 2 студенти. Один, який закінчив тут бакалавріат або магістратуру, і ви як компанія розумієте, за якою програмою він вчився, що він теоретично знає чи не знає. І такий же кандидат із українським дипломом без досвіду. Кого б ви обрали?

Далі, якщо ви хочете потрапити на стажування, то воно доступне саме тим, хто зараз навчається і повернеться до навчання. Наприклад, два роки магістратури. Ви рік провчились, далі йдете на 4 місяці на стажування, і це — ваш перший комерційний досвід.

Вакансій для джунів майже немає, особливо зараз, через стан ринку і скорочення. Щодо пет-проєктів, бажано, щоб вони одразу були комерційними. Зробіть щось для наших державних установ, нон-профіт організацій чи попрацюйте в компанії безкоштовно. Але будьте готовими, що і з пет-проєктами, і виступами на конференціях, і публікаціями — отримати роботу буде важко.

  • Що б ти порекомендувала загалом для інженерів, які хочуть знайти роботу в Канаді? Що обовʼязково писати в резюме? Яка тактика пошуку, на твій погляд, працює найкраще?

Почнемо з найважчого і найсерйознішого. Якщо ви можете переїхати з вашою компанією, я б радила переїжджати з нею і працювати там. Це буде найлегше у психологічному та фінансовому плані. Якщо ви переїжджаєте без компанії, у вас має бути дозвіл на роботу.

Наприклад, за програмою CUAET, яка дає три роки відкритого дозволу на роботу, ви зможете працювати на будь-яку компанію. Канадські компанії не хочуть цим займатись. Вони мають по 500-1000 відгуків на вакансію, тому їм не вигідно цим займатись (якщо це не Apple, Amazon...). Питання про дозвіл на роботу — це буде одне з перших питань рекрутера.

Подаватися з України чи з Канади?

Вам буде потрібен канадський номер, тому що рекрутер спілкуватиметься з вами по телефону. Деколи користуються Zoom-oм, і це буде від 15 до 30 хвилин із вимкненою камерою. Деякі компанії спочатку напишуть лист: «ви нам підходите і ми вам подзвонимо», інші — одразу телефонують, тому ви можете втратити потенційну співбесіду.

Але я б таки радила бути вже в Канаді, не всі рекрутери зрозуміють, чому ви не тут. Дуже раджу до переїзду бути готовим до проходження співбесід. У середньому закласти собі пів року, щоб спокійно та якісно підготуватися, якщо є змога.

Щодо співбесід.

Звичайно, на такій ролі, як Software Engineer, Data Scientist, NLP Engineer, Machine Learning Engineer, Front-end, Back-end — у вас будуть алгоритмічні задачки. Алгоритмічні задачі — це наше все. Навіть якщо ви думаєте: «Нащо воно мені потрібно. Я це в роботі не використовую, я вам краще покажу, як я вмію робити це і це», — ви не пройдете. Вам треба прийняти правила гри.

90% моїх співбесід мали алгоритмічні задачі.

Візьміть 6 місяців, і кожного дня робіть по 2-3 задачі. Не треба по 10 за раз, бо все забудеться. Воно має працювати на автоматі, на інтуїції.

Один із хороших ресурсів — це платформа Neetcode, створена інженером, який працював у Google та Амазон. Він відібрав 150 найбільш поширених алгоритмічних задач, які запитують компанії. Ви можете пройтись по списку всіх цих задач, прослухати пояснення і подивитись розв’язки, якщо буде потрібно. Є три рівні, easy, medium і hard. Ви маєте вийти на рівень, на якому робите всі easy за 15-20 хвилин. Тобто ви подивилися на задачу — і знаєте, який принцип її вирішення. Ви про це не задумуєтесь.

Те саме з medium задачами — принаймні 100-200 задач, у яких ви теж розбираєтесь. Ще раз повторюю, алгоритмічні задачки — наше все. Ми до них не звикли, але вони будуть майже на всіх співбесідах. А для дата аналітиків — це будуть завдання із SQL і переважно без алгоритмічних задач. Щоб мати можливість вибирати серед оферів і проходити інтерв’ю, ви маєте добре підготуватись. Які б розумні ви не були, і скільки б досвіду у вас не було — робіть алгоритмічні задачі.

  • Секундочку, ти маєш на увазі шість місяців для проходження різних співбесід, чи тільки підготовки до співбесід?

Шість місяців для проходження різних співбесід та, якщо у вас є багато часу на підготовку, шість місяців для підготовки. Коли ви працюєте в Україні, у вас є стабільна оплачувана робота, ви готуєтесь до переїзду, ваша сім’я готується до переїзду, сім’я вас підтримує, і ви щовечора сідаєте робити по дві задачки — це найкращий варіант.

Якщо у вас є три місяці, тоді ви робите більше. Місяць — це дуже мало, якщо ви вперше в житті бачите алгоритмічні задачі, якщо ви до цього їх робили, тоді вам буде легше, але — це мало.

Від першого надісланого резюме до офера — закладіть мінімум шість місяців. І це кожного дня ви будете подаватися на 5-10-15 позицій. У вас буде загальне резюме, але під кожну позицію ви будете його переробляти.

А ще буде багато позицій, в яких, крім того, що ви підвантажили PDF із вашим резюме, ще потрібно заповнювати три-чотири сторінки через Workday. Workday парсить ваш PDF, але ви все рівно вручну ще заповнюєте. І це займає багато часу. Якщо ви подалися на 50 вакансій, це ні про що. Ви маєте податись на 500, і що більше, то краще. Будуть інтерв’ю, які триватимуть по два-три місяці з однією компанією.

Лайфхак. Ніколи не йдіть на співбесіду у компанію, в якій ви хочете працювати, першою. Спочатку тренуємося на котиках — на всіх компаніях, у яких вам не буде боляче отримати відмову. Якщо ви хочете потрапити в компанію мрії, то, по-перше — вам обовʼязково потрібен реферал. По-друге — вам треба бути готовими до інтервʼю і готуватись заздалегідь! По-третє — ідеально, якщо ваш досвід метчиться під проєкт і команду.

  • А скільки етапів?

По-різному. Перший буде рекрутер. Другий — наймаючий менеджер чи хтось із команди. Далі — технічні інтервʼю. А може бути тільки рекрутер і далі один-два-три раунди алгоритмічних задач. Бувають компанії і з раундом задач до розмови з рекрутером.

Це дві-три задачі, які ви робите, наприклад, за годину-півтори. Це як гейт-кіпер перед тим, щоб поговорити з рекрутером. Далі йтиме онсайт-інтервʼю, під час якого будуть знову технічні раунди, потім поведінкове або розмова з СТО, якщо це невеликий стартап.

Тобто бувають різні сценарії. У моєї знайомої було 6 етапів в державній установі, а весь процес зайняв 6 місяців. Також ви можете дійти до кінця, по всіх етапах, і в останній момент вам скажуть: «Вибачте, у нас є кандидат, ви нам підійшли, все класно, але в нього є публікації і виступи на конференціях. І ми беремо його. No hard feelings, все класно, все чудово, просто в нього сильніший профіль». Тому шість місяців — це мінімум.

Bи будете подаватися по всій Канаді, і деякі з вакансій на Штати, які мають або представництво, або ви будете працювати ремоут, але легально платити податки в Канаду. Але загалом у вас тільки ринок Канади. Якщо в Україні у вас є Україна, Європа, і Штати — то тут у вас Канада.

Тобто, ще раз, бажано підготуватися вдома в Україні. Зробити всі документи, щоб ви могли працювати в Канаді. Розраховувати 6 місяців на підготовку. Підготувати розмовну англійську, переробити резюме. Також, ви не просто подаєтесь на сайті чи у Лінкедін, бо до вашого резюме банально навіть не дійдуть.

Основна стратегія — пошук рефералів. Наприклад, на сайті Blind, на ньому люди пишуть: «I’m looking for referrals to any FAANGMULA+ companies. I have 4 years of experience in software engineering as ...». Якщо ви бачите рекрутера, який запостив, напишіть йому/їй. Якщо це запостив хайринг-менеджер чи тіммейт, пишіть їм напряму. Не соромтесь писати їм напряму.

І наголошую, кожного дня подавайтесь. Під кожну позицію ви переробляєте резюме — змінюєте формулювання, додаєте більше/інші технології, і включаєте ключові слова з опису вакансії, щоб рекрутеру було зрозуміло, що ви матчитесь на цю позицію.

Також є платформи, на яких ви платите 20-30 доларів, і люди з різних компаній проводять мок-інтерв’ю з алгоритмічними задачами чи інтерв’ю щодо системного дизайну. Є різні групи українців у Канаді, які працюють в ІТ, і там можна просити реферали або готуватись по LeetCode.

Дуже класно, якщо ви вестимете файл, у який будете записувати, коли ви подались на певну вакансію, коли контакт із рекрутером, бачити статус по кожному і т.п.

Наступне — приїжджати з запасом грошей. Якщо ви приїжджаєте не один/одна і ваш партнер працює, це дуже добре. Тому що будуть моменти, коли вам будуть відмовляти, і ви будете брати це на свій рахунок. Вам потрібна буде моральна підтримка, а також заощадження та фінансова підтримка. Якщо у вас було 5 тисяч доларів в Україні, то тут якщо вам дають 120 тисяч канадських доларів, то з них забирають ~30-35% податків (залежить від провінції).

Далі оренда. Якщо це однокімнатна квартира, проста, звичайна — це ще 2 500, залежить від провінції. Тобто ви можете порахувати, скільки всього вам потрібно. І це буде ваш перший рік еміграції, вам і так буде нелегко. Ви скоріш за все просядете в зарплаті, ви не зможете відкладати так, як ви відкладали.

І я говорю про узагальнений випадок. Ви маєте орієнтуватися на гірший сценарій і на те, що буде важко. Ви маєте розуміти для чого ви приїхали. Якщо ви приїхали, щоб потім працювати в наступних компаніях, кращих, де вищі зарплати, і у вас є цілі розвитку в кар’єрі, ви маєте тим надихатись. Це те, що вас буде гріти в моменти, коли вам буде важко.

  • Оксано, а які вимоги до резюме? Ти просто сказала, що не таке резюме, як у нас, а які основні вимоги?

Це більше про формат. Ніяких фенсі-резюме. Це простий pdf, з вашим ім’ям, прізвищем, тайтлом, без фотографії та без сімейних статусів. Це ваша пошта, це ваш канадський номер телефону, GitHub та LinkedIn профіль. Далі йде коротке інтро про себе (1-3 речення).

Потім, хтось ставить зверху, хтось ставить у самому кінці — стек технологій, якими ви володієте. Але основне — це те, як ви описуєте кожну вашу роботу, що ви робили і який це мало результат. І це має бути щось на кшталт «Developed and deployed a predictive model for inventory management that decreased overstock by 30% and understock by 22% across key categories in North America». Тобто наголос на результати.

Переважно це одна сторінка, але не страшно, якщо вийде більше, бо у вас великий досвід і ви хочете все показати, що релевантно для позиції, на яку подаєтесь. Важливо — під кожну позицію ви його переробляєте. Тобто є одне загальне резюме, яке тюните під кожен кейс.

  • Останнє питання — про супровідний лист. Додатково потрібен до резюме?

Особисто я та мої знайомі, яких я запитувала, не писали. Це здебільшого роблять студенти, в яких немає досвіду, на джуніор-позиції або інтернатуру. Або — це позиція, яка вимагає PhD, як наприклад, в Amazon чи Meta, там часто додають супровідні листи.



👍ПодобаєтьсяСподобалось3
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі