Як я здобув сертифікат з аналізу даних від Google за п’ять днів
Мене звати Роман Повзик. Свого часу з аспіранта-будівельника я перейшов у digital: 7 років працював проєкт-менеджером у полтавській агенції Yoda Consult. Цього року зрозумів, що хочу повністю працювати з даними, тим паче, я частково займався аналізом, пов’язаним із медіа та соціальними мережами.
Тому після кількох місяців навчання необхідних для цієї сфери інструментів та навичок, здобув посаду дата-аналітика в харківській геймдев-компанії Bini Bambini, яка створює мобільні розвивальні ігри для дітей.
Нині я на третьому місяці випробувального терміну. Активно поглинаю всі доступні знання в аналізі даних. Одне із моїх джерел — профілі колег в Linkedin, звідки виписую цікаві курси і програми, які б хотілося пройти, щоби спілкуватися на одному рівні.
Побачивши відмітку Google Data Analytics Professional Certificate від Coursera, зацікавився, що це за навчання.
З чого складається сертифікація
Зацікавлені в аналізі даних можуть знайти на Coursera дві сертифікації за цим напрямом (якщо не брати до уваги Data Science):
Сертифікація від Google, про яку йтиметься далі, з’явилася цієї весни. Вона складається з восьми курсів, що охоплюють стандартні кроки для аналітика: основи про дані, які питання варто ставити до початку дослідження, підготовка до використання даних, як їх очищати, аналізувати, візуалізувати, презентувати аудиторії та робити висновки.
Станом на 10 листопада на перший курс зареєструвалося 478 536 користувачів, а на останній — 51 851. Тобто менше 11% від повних ентузіазму аналітиків на початку. Закінчують програму ще менше людей, але ці дані ні Google, ні Coursera не оприлюднюють. Тому для початківця в аналізі даних наполегливість у проходженні програми допоможе виділитися серед інших. Адже без зусиль сертифікат не здобудеш, а менш як 52 тисячі студентів у масштабах усього світу — дуже незначне число.
Курси спрямовані на початківців, але наявність базових знань допоможе пройти їх швидше. Хоча навіть людям із досвідом може стати корисною структурованість навчального процесу, яка допоможе заповнити прогалини в теорії.
Кожен курс розбитий на
Практичні інструменти куратори розглядають на прикладі роботи з Google Spreadsheets, SQL, R та Tableau. У відео показують приклади роботи з цими інструментами, тому можна повторювати за лекторами. Датасети, які використовуються в навчанні, теж надають або як лінк на онлайн-документ, або файлом.
Вартість навчання
Перший тиждень доступу плата не стягується. Потім контент і оцінювання коштуватиме 39 доларів на місяць.
У колеги на проходження пішло близько 100 годин. Це багато свідчить про кількість контенту в курсах.
Як оцінюють знання
Наприкінці кожного тижня курсу є міні-іспит із
Наприкінці курсу іспит: два кейси, у межах яких ви допомагаєте вигаданим компаніям аналізувати дані.
З кожною спробою запитання видозмінюються, але стосуються того ж. Наприклад, в одному разі запитають, які дані використовувати, коли проєкт дуже обмежений у часі. А в іншому — коли найкраще застосовувати історичні дані.
Місія: пройти сертифікацію менш ніж за тиждень
Крім схвального відгуку від колеги, у моєму випадку зіграли роль дата-влогери Tina Huang та Luke Barousse, яких я періодично дивлюся. Вони робили огляди, де порівнювали переваги та недоліки навчальних програм сертифікацій Google та IBM. Зрештою, такий соціальний вплив і наживо, і онлайн призвів до підписки на цей цикл курсів.
Перший, розбитий на п’ять тижнів, я пройшов менш ніж за п’ять годин, у неділю. Відео переглядав повністю, але на швидкості 1,25, щоб зберігалося розуміння спікера. Подивившись на темп «1 навчальний тиждень за годину», зрозумів, що майже 40 тижнів контенту нереально здолати за 7 днів. Але допоміг азарт: чи реально здобути сертифікат за тиждень? Ще і працюючи з 9 до 18 у будні. Це стало для мене навчальним челенджем, який захотілося подолати.
Забігаючи наперед, скажу, що все вийшло. Весь процес зайняв 17,5 годин — приблизно по 3,5 години протягом 5 днів. Але, звісно, усе було не так рівномірно: у неділю — близько 8 годин, а в будні —
Сертифікація вважається пройденою, якщо складено всі курси. А вони своєю чергою вважаються зарахованими, якщо складено всі іспити в межах курсу: спочатку тижневі, а потім підсумковий. Самих іспитів загалом 38: 30 тижневих і 7 підсумкових (останній курс факультативний). Тому лише щоб пройти їх, мені знадобилося б чимало часу.
Але якщо перегляд і прочитання контенту можна було відкласти, то складання іспитів ніяк не уникнути. І я вирішив почати саме з них. Звісно, це було доволі самовпевнено, але допомогло зрозуміти слабкі місця й перевірити наявну базу в теорії й на практиці. А проваливши іспит, я по-іншому реагував на навчальний контент, де обговорювалася ця тема.
Щодо іспитів, то я йшов із темпом «два курси за день». Зазвичай, у межах курсу траплялися
Розумію, що в ідеалі варто дивитися відео, потім читати тексти, і спокійно складати іспити. У такому форматі за
Технічний стек курсу відрізнявся від того, з чим щоденно працюю. Я використовую Power BІ. Але куратори в курсі візуалізації навчали Tableau. На щастя, проходив цей інструмент раніше, тому тут складнощів не було.
Найважчим серед усіх інструментів для мене стало програмування в R, оскільки тут я — повний нуль. Тому щоби скласти теорію, дивився відео курсу. А дістати відповіді з датасетів допомагав добре знайомий Python з бібліотекою Pandas.
Я вирішив, що для мене як дата-аналітика головне — знайти правильні відповіді, які допоможуть ухвалити потрібне рішення. А інструмент другорядний. Не виключено, що колись вивчу і R, але точно не для того, щоби пройти курс.
Часто помилки під час іспитів траплялися через неуважність. Творці програми постаралися заплутати, пропонуючи схожі варіанти. Тим паче після кількох годин поспіль англійська сприймається гірше. Тому, щоби зберігати увагу, після
Але якщо деякі іспити забирали 10 хв, то траплялися й екземпляри на 13 питань, які затягувалися на понад півгодини. Переважно це завдання, пов’язані з R. Тому рівномірно розподілити час ставало тим складніше, чим менше нескладених іспитів лишалося.
Останній іспит я проходив о 23:40, рівно за хвилину після того, як минули «штрафні» 24 години через його невдале проходження. Успішно розквитавшись із питаннями, засинав із розумінням, що челендж подолано навіть не за сім, а за п’ять днів.
Що далі?
Проходження сертифікації в дата-аналітиці не означає, що рекрутери закидають пропозиціями. Це «термометр» необхідних підходів та базових навичок: постановка правильних питань, робота з формулами та функціями Spreadsheet, запитами SQL, візуалізаціями та обробкою даних.
Мені це випробування дало змогу зрозуміти власні сили в аналізі даних, нехай програма й розрахована на базовий рівень. Челендж ще раз довів мені, що системний підхід може творити дива.
Озираючись назад, розумію, що свою стратегію б не змінював. Навпаки, спробую застосувати її й у подальших програмах Coursera.
Після отримання сертифікату сервіс автоматично скасував підписку й залишив доступ до всього контенту. Тож нині знайомлюся з відео й текстами до тем у комфортному темпі «один навчальний тиждень на день».
Далі в планах ознайомитися із сертифікацією Data Science від IBM. Можливо, пізніше напишу і про неї. Але там процес точно триватиме довше.
17 коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів