Pet-проєкти для аналітика даних. Навіщо робити, де взяти ідеї та дані початківцю

Усі статті, обговорення, новини для початківців — в одному місці. Підписуйтеся на телеграм-канал!

Всім привіт, мене звати Роман Повзик. Майже 2 роки я співпрацюю з геймдев-компанією Bini Games (у минулому — Bini Bambini) як аналітик даних. Сам я світчер: влітку 2021-го перейшов у цю сферу з проєктного менеджменту в digital-агенції.

Влітку минулого року, маючи майже рік досвіду, почав менторити початківців, які б теж хотіли почати кар’єру в аналітиці даних (детальніше тут). Питання з сесій перетворюються на теми для статей на DOU, наприклад: «Що варто вчити, щоб стати аналітиком?» або «Як проходить робочий день аналітика?».

Приклади статей, які виникають після розмов з початківцями-аналітиками

Одна з тем, яка часто лунає від початківців, стосується pet-проєктів або портфоліо.

Раджу послухати запис цього войсчату 👇Це хвилює на початку кар’єри, коли людина не має комерційного досвіду, а за кожну вакансію конкурує з такими ж світчерами.

Питання pet-проєктів актуальне не лише аналітикам. У квітні команда DOU навіть проводила войсчат на цю тему, де я пояснював, навіщо їх робити.

Нині хотів би повніше розкрити тему і поговорити лише стосовно аналітики даних. Хоча деякі ідеї та підходи можна використати і в інших спеціальностях.

Що таке pet-проєкт і навіщо його робити

У моєму розумінні, pet-проєкт — завдання, яке виконуєш поза основною роботою з власною ціллю. Мета може бути різна. Для початківця це зазвичай — довести, що є навички та знання технологій, необхідних для обраної вакансії.

Pet-проєкт має допомогти пройти перший етап процесу найму — від відгуку до рішення рекрутера поговорити з кандидатом. Звісно, він також може принести користь і далі, наприклад, як тема для розмови під час технічного інтерв’ю. Але це вже бонуси.

Коли на ринку висока конкуренція за кожну вакансію, pet-проєкт допомагає виділитися серед інших початківців. Додаткова активність тільки додає плюсів.

Які у мене були pet-проєкти

Про необхідність сторонніх проєктів я дізнався, коли надумав світчитися в ІТ. Мені вже майже був 31 рік і я вирішив проконсультуватися зі знайомою — Chief People Officer у Beetroot Тетяною Бойченко. Вона порадила не думати про вік, але тримати в голові три складові успіху: фінансову подушку, англійську мову та pet-проєкти.

У процесі самонавчання значну частину часу я приділяв Python. Тому для першого pet-проєкту і використав його як основну технологію.

Я мав «біль»: у медіа виходили цікаві лонгріди, а мені складно читати довгі тексти з ноутбука — око втомлюється і намагається перескакувати слова. При цьому люблю бігати і завжди слухаю подкасти у цей час.

Можливістю поєднати вирішення проблеми та водночас створити pet-проєкт стало написання начитника текстів. Це був нескладний скрипт в Jupyter Notebook, який за допомогою бібліотеки від Google gTTS допомагав перетворювати подібні лонгріди на аудіофайли для пробіжки.

Детальніше про цей проєкт розповідав тут.

Два роки потому я б не радив робити щось подібне аналітику. Адже тут взагалі немає нічого, пов’язаного з цією спеціальністю, крім Python. Але і бібліотеки не ті, які використовуватимеш у роботі, типу Pandas, Numpy, Matplotlib.

Зі свіжих прикладів pet-проєктів від знайомих: хіт-парад топ-50 від Spotify в Україні, Польщі, Румунії, Угорщині, Словаччині та світі від Зіновія Маланія. Це приклад з дата-інженерії, але застосування дашборду робить його частково і проєктом з аналітики даних.

Проєкт допомагає оцінити, наскільки смаки українських слухачів подібні до меломанів сусідніх країн.

Дашборд з музичними вподобаннями від Spotify (автор — Зіновій Маланій)

Де шукати ідею pet-проєкту

Тему проєкту бажано, щоб знайшла людина, яка його робитиме. В ідеалі, це має бути або ваша пристрасть, або біль. Так більше шансів, що проєкт доведуть до кінця, не кинувши на півдорозі.

Початківець працюватиме над ним цілком безоплатно, вкладаючи час та зусилля без жодних гарантій, що це принесе офер. А якщо ця людина має основну роботу, доведеться жертвувати вільним часом замість відпочинку.

Ще один приклад з досвіду — асистент для гри «Словко». У лютому 2022-го у цю п’ятилітерну забавку грало багато людей з мого оточення — як дружина, так і колеги. Тому хотілося написати скрипт, який би допомагав відгадувати слово дня на основі популярності тієї чи іншої літери.

Штучного інтелекту там не було, частину інформації кожного разу доводилося вносити вручну. Але все одно майже без зусиль отримував правильну відповідь. Бажання вразити навколишніх мотивувало просидіти кілька вечорів над проєктом.

Приклад роботи скрипта з допомоги розгадування слів у грі «Словко»

Коли робиш проєкт на тему, яка тебе драйвить, є неочевидний бонус: під час розповіді про нього очі «горітимуть». Це враження зацікавленості, яке важко зімітувати. Для когось це — NFT, для іншого — художня гімнастика протягом понад століття на Олімпійських іграх. Але це тема, у яку тобі цікаво заглибитися на десяток годин.

Інколи чітко знаєш, у який домен хочеш потрапити. Тоді і тему проєкту підбираєш відповідну. Наприклад, космічні супутники та зображення, які вони роблять. Це допоможе сильно виділитися серед інших в очах компанії такого спрямування.

А використання основних технологій, які застосовуються в аналітиці даних, дозволить додавати цей проєкт і для вакансій з решти доменів.

Які технології використовувати для pet-проєкту

Як я описував вище, pet-проєкт ти робиш, щоб довести рекрутеру й техменеджеру, що володієш технологіями, описаними у вакансії. Стек для проєкту варто обирати відповідний.

У більшості вакансій на аналітика даних шукають людину, яка б:

  • вміла писати запити на SQL,
  • робити дашборди в Power BI чи Tableau,
  • працювати з датасетами на Python,
  • розбиралася у статистиці,
  • розуміла продуктові метрики та
  • знала англійську.

Чим більше з цих вимог вдасться використати при створенні pet-проєкту — тим краще.

Як варіант, можна подумати про комплексний проєкт. Адже задача аналітика переважно вимагатиме використання кількох інструментів. Технічному менеджеру простіше переглянути один проєкт замість кількох спеціалізованих.

Проте початківцю, який ще не мав досвіду роботи з реальними задачами, може бути складно відразу робити комплексні проєкти. Тому немає нічого страшного, якщо ти зробиш менші, але чітко спеціалізовані за технологіями проєкти, наприклад:

  • розв’язання задач на CodeWars, HackerRank чи LeetCode, запаковані з умовами в окремий репозиторій на GitHub;
  • дашборд з цікавої теми в Power BI або Tableau. У випадку останнього, якщо зроблений у Tableau Public, то отримаєш посилання на нього, яке і зможеш прикріпити до резюме. Power BI раджу вантажити на Google Drive;
  • аналіз датасету на Python у Jupyter Notebook в окремому репозиторію.

Профіль на Github може бути додатковим плюсом, оскільки в акаунті видно твою активність протягом року. Зелене поле говорить про те, що ти не минулого тижня вперше закомітив код SQL чи Python.

Низька активність там може, навпаки, погіршити враження про тебе: якщо дійсно робота з кодом тільки почалася.

За моєю активністю на Github можна побачити, коли я був у відпустках

Де брати дані для проєкту

Я бачу три підходи щодо пошуку датасетів для pet-проєкту.

Перший і найпростіший — сайт зі змаганнями для спеціалістів з даних — Kaggle. Окрім коротких курсів для початківців та самих змагань, він цінний і величезною базою датасетів.

На Kaggle так само важливо визначитися з темою: від неї залежить, які ключові слова вводитимеш у пошук. Наприклад, хочеш працювати з мобільними іграми — обираєш відповідну тему. Нині на Kaggle 92 датасети за ключовими словами «mobile games».

Приклад пошуку датасетів про мобільні ігри на Kaggle

Популярність набору даних можна визначити за кількістю голосів зліва. Якщо їх багато, швидше за все, у вкладці «Code» знайдеш купу прикладів аналізу, який з цими даними зробили інші. Це допоможе побачити приклади робіт колег з усього світу.

Інша можливість отримати датасет — самостійно його створити за допомогою парсингу. Тобто коли через спеціальні бібліотеки Python — зазвичай це requests та BeautifulSoup — береш інформацію з певного сайту.

Так можна створити унікальний набір даних. Наприклад, розвиваючи проєкт начитника тексту, про який говорив вище, я створив скрипт, який брав з «Української правди» певну кількість найсвіжіших заголовків і начитував мені їх вголос.

Ще одна можливість даних для аналізу — власні дані. Тобто якщо використовуєш якісь застосунки, що регулярно збирають інформацію про тебе, спробуй цю інформацію зібрати. Якщо, звісно, є можливість через API чи парсинг.

Наприклад, понад чотири місяці через застосунок Google Digital Wellbeing я збирав дані про щоденний екранний час, кількість розблокувань та сповіщень у смартфоні.

На жаль, не знайшов можливості робити це автоматично, тому доводилося виписувати цифри вручну. Але потім робив візуалізації і знаходив деякі патерни у своїй онлайн-поведінці.

Аналіз власних даних допоміг сильно зменшити кількість сповіщень, які отримую щодня

Навіть кількість розблокувань смартфона за 4 місяці — уже унікальний датасет

Проєкт на основі власних даних цікавий тим, що працюватимеш з датасетом, якого не має ніхто, на відміну від того ж Kaggle. Також результати особливо цікаві тобі самому, оскільки отримаєш нові знання про себе і можливості якось покращити своє життя.

Скільки проєктів варто робити і додавати у резюме

Інколи початківці намагаються зробити багато pet-проєктів з одними і тими ж технологіями. І всі їх хочуть залишити у резюме. Людину можна зрозуміти: шкода викидати те, на що витратив багато годин.

Я прихильник ідеї «боротьби проєктів». Тобто з кожної технології, навички в якій хочеш показати, варто залишати один проєкт — найкраще з усього, що маєш з цією мовою програмування чи BI-системою. Як тільки у тебе з’являється щось якісніше, воно має викинути гірший проєкт з резюме.

Дехто з менті аргументує, що кілька пет-проєктів різного рівня допоможуть побачити ріст навичок кандидата. Але я не вірю, що у такому резюме рекрутер чи технічний менеджер детально видивлятиметься прогрес.

Ймовірніше, якщо і відкриють, то зайдуть на найслабший проєкт. І саме за ним зроблять висновок про навички. Щоб цього не сталося — лишай сильніші проєкти.

Ще момент: якщо даєш посилання на Github, то відразу давай лінк безпосередньо на проєкт, а не лише на акаунт. Чим складніше натрапити на потрібний репозиторій, тим менше шансів, що на нього взагалі зайдуть. А от пусте поле активності на головній сторінці акаунту — легко побачать.

Які помилки роблять початківці при роботі з pet-проєктами

Вище розповів про помилку великої кількості проєктів різного рівня з однаковими технологіями, всі з яких додають до резюме.

Також не варто видавати за власні pet-проєкти домашні роботи, зроблені на певних курсах. Зазвичай, це прості завдання з визначеним розв’язком, які навряд чи покажуть повноту твоїх навичок.

Час від часу бачу у проєктах, як кандидат надто захоплюється частиною, пов’язаною з кодом. І забуває про проміжні пояснення та аргументацію дій, а головне — про висновки.

Для бізнесу головне — зрозуміти, які рішення на основі твого аналізу варто прийняти і чим це підкріплено. Тому якісна комунікація у проєкті — складова, яку не можна пропускати.

Початківці інколи не беруться до pet-проєкту, оскільки ще не відчувають впевненості у своїх силах, а сам проєкт вважають чимось на зразок дисертації — серйозним і великим.

Раджу спростити очікування: виділити 5-6 годин на вихідних і спробувати за цей час провести аналіз чи зробити дашборд. Так, вийде не шедевр. Але принаймні уже щось, що можна покращувати, здобуваючи нові знання та розвиваючи себе.

Чи можна отримати офер без pet-проєкту

Як би це не звучало дивно у статті про pet-проєкти, але отримати офер можна і без нього.

Завжди є шанс, що на проєкти у твоєму резюме навіть не глянуть. Рекрутер може не розуміти цих технологій, а технічному менеджеру забракне часу чи бажання заглиблюватися. І це не завадить пройти далі.

Але все ж, можливо саме їх наявність уже виділить тебе, навіть без занурення у безпосередній контент.

Саме технічна співбесіда та тестове завдання, а не pet-проєкти, визначатимуть рішення щодо оферу. Моя колега, Senior Recruitment Specialist в Bini Games Олександра Миронова пояснює, що навіть при наявності pet-проєкту кандидат отримує тестове, яке пріоритетніше для компанії. Адже воно зроблене з урахуванням вимог до майбутньої посади.

Олександра Миронова

— Але це не значить, що початківцю не потрібно розповідати про свій проєкт. У джуна немає досвіду, тому ця людина має розповідати про все, де вона — молодець: pet-проєкти, фриланс, стартап, дипломні на курсах. Одне із завдань рекрутера — зрозуміти на старті амбіції людини: що вона вже зробила, щоб увійти у професію, — ділиться Олександра.

Ключова роль pet-проєктів у отриманні оферу полягатиме не у тому, що це допоможе тобі виділитися серед кандидатів, а у покращенні навичок.

Коли закінчується програма курсу і потрібно самостійно розбиратися з датасетом — з’являються десятки питань і необхідність глибше закопуватися у тему, алгоритм, бібліотеку. Саме такі навички дослідницької роботи і допоможуть у якісному виконанні тестового завдання.

Так робити чи не робити pet-проєкт аналітику-початківцю

Я вірю у pet-проєкти як хорошу можливість початківцю прокачати себе і збільшити шанс на розмову з рекрутером. Їх не варто переоцінювати, але й ігнорувати теж не раджу. Це змога напрацювати впевненість у собі та додаткові бали в очах майбутньої команди. Тож чому б не скоритатися?

А якщо хочеш рухатися в аналітиці даних, але все ще маєш питання про цю сферу — напиши мені і я з радістю поспілкуюсь. Принаймні, один знайомий серед аналітиків у тебе з’явиться. І, можливо, незабаром українська ІТ-спільнота поповниться ще одним якісним фахівцем.

Повідомлення, заради яких я пишу подібні статті

👍ПодобаєтьсяСподобалось15
До обраногоВ обраному9
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Дякую, дуже корисна інформація у максимально доступній формі. Відчувається глибина підходу. Здається, що при ваших наступних наймах роботодавцям буде цілком достатньо ознайомитись з цією та іншими статтями, щоб прийняти рішення на вашу користь :)

Привіт, Романе.
Дякую за теплі слова. Радий, що стаття сподобалася.
Так, така системна медійність привертає увагу рекрутерів та хайринг-менеджерів. Наврядчи лише статті допоможуть отримати наступний офер, але це хороший доказ щодо софт навичок)

Радий, що сподобалося) Тема вічна, але спробував висловити своє бачення)

Дякую за статтю, дуже корисна інформація. Якраз почав займатися своїм портфоліо та своренням pet-проєктів!!

Тоді зичу успіхів з портфоліо. Буду радий, якщо щось з порад стане у нагоді й допоможе на цьому шляху)

Дякую за інфо, все зрозуміло та структуровано написано. В мене ще немає pet- проектів, завдання собі в календар на червень поставлено.

Від рішення зробити пет-проєкт до його ідеї — півкроку. А там лишиться втілити цю ідею в життя — і вже готове посиланнячко в резюме.

Корисна інформація, дякую.

Радий, що відгукнулося і дякую, що читаєте)

А якщо я напишу що Facebook та Instagram теж були пет проектами а Apple забрати в гаражах.. поцікавився історією

Чого ж ми в космос не літаємо якщо такі професори в іт.ох і запити у вас куди там Н.Теслі,чи Енштейну такі вже генії таке вже вміють...

До чого ця агресія? Людина просто показала один з варіантів саморозвитку, який додатково може допомогти при пошуку роботи. Вас же ніхто не змушує їх робити

Підписатись на коментарі