«Ти б ще ракетобудування обрала»: Як я світчуся у Data Science в 30 років та без технічної освіти
Привіт, мене звати Катерина Богуславська. Я — технологічна журналістка, яка понад рік тому вирішила світчитися у Data Science.
Сьогодні ця спеціалізація як ніколи користується популярністю. Так, у рейтингу 50 найкращих професій США від Glassdoor дата-саєнтист вже 7 років не полишає трійку лідерів (у
Утім, Data Science має високий поріг входу — світчнутися у сферу непросто. У цій статті я хочу розповісти про свою мотивацію для опанування цієї спеціальності, низку труднощів, з якими зіштовхнулася та уроки, які з цього винесла. Сподіваюся, вони допоможуть зекономити час іншим новачкам у сфері.
Чому Data Science
За освітою я — магістр культурології Могилянки. Мені завжди подобалася робота з інформацією, тому понад 5 років я працювала на позиціях, так чи інакше повʼязаних з медіа. Спочатку редакторкою у кількох інтернет-виданнях, далі — координаторкою проєктів медійної громадської організації та, зрештою, — технологічною журналісткою у виданні Vector. На своєму останньому місці роботи я створила близько 800 матеріалів — новин і статей, добірок та інтервʼю, адаптованих перекладів і нативної реклами.
У певний момент я зрозуміла, що хочу не просто писати про технології, а й спробувати щось опанувати. Я прагнула навчитися обробляти великі обсяги даних, дізнатися про більш технологічні методи роботи з інформацією. Саме тоді я вирішила подивитися у бік Data Science. На той момент мої знання про сферу обмежувалися древніми кліше на кшталт «найпривабливішої професії 21 століття» (Ще у 2012 році у виданні Harvard Business Review вийшла відома стаття Data Scientist: The Sexiest Job of the 21st Century, що пророкувала надзвичайну популярність цій спеціальності).
Щоб краще розібратися, що це за сфера і чи підходить вона мені, я прочитала книгу Джона Келлехера та Брендана Тірні «Наука про дані. Базовий курс». Її автори у доступній формі розповідали про машинне навчання, задачі дата-саєнтиста та різні цікаві кейси.
Зокрема, мене приголомшила історія, яку автори взяли з публікації The New York Times. Якось до одного з магазинів американського ритейлера Target прийшов розлючений батько дівчини-підлітка. Він показав менеджеру магазина купони, який торгова мережа надсилала їй. Виявилося, що його неповнолітній доньці пропонували рекламу одягу для вагітних та інші товари, пов’язані з материнством. Менеджер вибачився перед ним та за кілька днів передзвонив, щоб зробити це знову. Проте цього разу просив вибачення вже ініціатор конфлікту. Виявилося, що його дочка справді вагітна — просто торговельна мережа дізналася про це раніше.
У Target знали: під час великих змін у житті покупці більш схильні до придбання нових товарів. Тому, проаналізувавши споживчі патерни, компанія навчилася визначати вагітність своїх клієнток. Зокрема про це сигналізувала вибірка з 25 продуктів, таких як лосьйон без запаху чи певні харчові добавки.
Хоча ця історія балансує на межі етичності, вона непогано ілюструє суть Data Science: пошук прихованих закономірностей, що здатні вирішувати проблеми та приносити користь бізнесу і не тільки.
Після цієї книги я зрозуміла: це саме те, чим би я хотіла займатися. Хоча я не мала технічної освіти та досвіду у програмуванні, все ж вирішила, що спробувати варто. Колись давно я закінчила фізико-математичний ліцей, тому уявлення про точні науки у мене було. Оскільки моя зацікавленість стрімко зростала, я перейшла зі штатної роботи на фриланс, почала потроху вчити Python та невдовзі записалася на свої перші курси в одну з українських IT-шкіл. З початком війни кількість текстів у роботі зменшилася, і я вирішила приділити навчанню практично весь свій час.
Чудовисько Франкенштейна, або високий поріг входу
Щоб «увійти» у Data Science, треба опанувати доволі багато компетенцій. Як мінімум, потрібно:
- знати статистику, матаналіз і лінійну алгебру;
- вміти програмувати на Python;
- працювати з базами даних та SQL;
- розумітися на машинному навчанні.
І це лише більш-менш універсальні компетенції, не кажучи вже про знання того чи іншого домену.
Один з моїх улюблених блогерів Кен Джи (Ken Jee) у відео з провокативною назвою «Чому ви, ймовірно, не станете дата-саєнтистом» жартома називає спеціальність «чудовиськом Франкенштейна». Він зазначає, що різноманіття скілсету формує високий поріг входу. Не кожен може бути мотивований достатньо, щоб пройти цей шлях.
На мою думку, це той аспект, який обовʼязково варто враховувати. Опанування такої комплексної спеціальності — це марафон, а не забіг. Коли у мене в черговий раз щось не виходило і я була через це сильно засмучена, мій хлопець сказав:
«Це дуже складні речі, які не можуть вийти з першого разу. Ти б ще ракетобудування обрала і дивувалася, чому не отримуєш миттєвого результату».
Як не вбити свою мотивацію у зародку
На моєму шляху були два моменти, коли я була готова поставити хрест на всій історії зі світчем у Data Science. Обидва вони повʼязані з невдало обраними курсами на перших етапах навчання. Так, коли я тільки починала опановувати Python, то звернулася, певно, до найнуднішого курсу з Udemy. Вже за тиждень він практично повністю відбив у мене бажання займатися програмуванням.
Але тут втрутилася доля. На дні народження подруги я розповіла про цю ситуацію і людина, яку я вперше бачила у житті, порадила мені іншу навчальну платформу. Вона мені сподобалася, і невдовзі я таки опанувала основи Python.
Другий епізод стався тоді, коли я вже мала гарну базу і прийшла прокачувати машинне навчання в одну з відомих українських IT-шкіл. Лектору не бракувало компетенції, але заняття були неструктурованими та затягнутими. Я втомлювалася від хаотичної подачі інформації, мені почало здаватися, що я перегоріла. Тоді я навіть вирішила припинити навчання на середині курсу. Але згодом усвідомила, що мені так само цікаво проходити різні онлайн-програми та читати статті, як і раніше. Стало зрозуміло: проблема була не в матеріалі, а в його подачі.
Існує досить дивна ідея у стилі репресивної педагогіки: той, хто хоче навчитися, навчиться за будь-яких обставин. Але це не так. У світі, де існує шалена конкуренція за увагу та надзвичайне різноманіття контенту, наші вимоги до нього теж зростають. Інформація має бути цікавою або принаймні логічно викладеною. На інше вже немає часу.
«Пастка» онлайн-курсів
Після невдалого досвіду з курсом в IT-школі я зосередилася на самонавчанні. Проходила онлайн-курси один за одним, читала різні матеріали, робила конспекти. Спочатку мені здавалося, що все йде як треба. Але згодом я зрозуміла, що мені банально бракує зворотного звʼязку. Я не могла адекватно оцінити свій рівень знань, не розуміла, що зараз відбувається у сфері, не знала, варто мені вчити все підряд чи вже обрати напрям. Один курс закінчувався, починався інший, а розуміння, скільки їх ще потрібно, не було.
Тоді я вирішила взяти персональну консультацію у менторки, яка викладала на курсах Python for Data Science, де я отримала солідну базу знань. Буквально одна зустріч, де ми пропрацювали мої запити, принесла більше користі, ніж кілька тижнів, якщо не місяців самонавчання. Я зрозуміла, що хочу сконцентруватися на NLP, дізналася, з чого мені почати, отримала фідбек щодо свого резюме та багато іншого.
Пізніше, коли я знову відчула, що потребую зворотного звʼязку, я вже не вагаючись взяла консультацію в експертки з NLP. І знову це було надзвичайно корисно: ми проговорили те, якими проєктами мені варто доповнити портфоліо, які бібліотеки довчити та як підтягнути знання з лінгвістики.
Важливість комʼюніті
З попереднього пункту логічно випливає наступний: ментори та комʼюніті допомагають прогресувати набагато більше, ніж може здаватися на перший погляд. Онлайн-курси — це база та гарний старт, але ніщо не замінить спілкування з практиками.
Наприклад, у січні-лютому я потрапила до школи «NLP for Good: tune your bot from scratch» від некомерційної організації AI HOUSE (частина екосистеми Roosh) та IT-компанії Master of Code Global. Цей досвід сильно відрізнявся від самонавчання з двох причин. По-перше, я отримала змогу працювати над проєктами у команді зі спеціалістами-практиками та студентами технічних спеціальностей.
По-друге, навчання прокачало мій нетворкінг, що вже дуже скоро дало свої плоди. NLP-інженерка Софія, з якою ми були в одній команді, запропонувала мені парт-тайм участь у її фриланс-проєктах. Я дуже зраділа такій пропозиції, адже для новачка відсутність досвіду — найболючіша проблема.
Порада «йти до людей» під час опанування нової професії чи вміння видається банальною, але вона працює. Онлайн-курси не розкажуть про актуальні можливості і не запросять на стажування :)
Не боятися «обнулитися»
Якщо у медіа я вже достатньо сформована спеціалістка, то у Data Science мені треба було прийняти той факт, що я новачок. Щоб витримати внутрішнє напруження, яке виникає через це, потрібно памʼятати про дихотомію growth mindset та fixed mindset.
Коли розумієш, що будь-які вміння можна опанувати, варто лишень інвестувати у справу достатню кількість часу та зусиль, ти на стороні growth mindset. Але щойно починаєш думати, що люди ледь не народжуються зі знанням алгоритмів машинного навчання, а ти зі своїм бекграундом ніколи цього не осягнеш, вмикається fixed mindset.
У останньому немає розвитку — тільки картання та відчуття приреченості. Зараз я переважно спілкуюся зі студентами і надихаюся від того, що можу багато чому у них навчитися. Також, коли я думаю, що мені вже пізно змінювати карʼєру, на допомогу приходить це відео «Why You Still Have Time To Change Career».
Зараз всі ці 15 місяців, які я інвестувала у нову спеціальність, можуть здатися великим часовим проміжком. Але чи здаватиметься він таким, коли мені буде 40, 50 чи 60 років? З майбутньої перспективи цей період вже не виглядатиме таким довготривалим.
Що далі
Наразі я подаюся на усі можливі освітні ініціативи та шукаю свою першу фул-тайм роботу. Увійти в IT-сферу тоді, коли кількість відгуків на вакансії сягає рекордних показників, — задача із зірочкою.
Звісно, мені б хотілося розповісти історію з доконаним видом дієслова у заголовку: «Як я світчнулася у Data Science в 30 років та без технічної освіти». Але будь-якому «успішному успіху» завжди щось передує. І оскільки моїм головним рушієм є цікавість, мене радує не лише кінцевий результат, а й шлях до нього.
Підсумок
Якщо ви думаєте над тим, щоб світчнутися у Data Science, я б порадила:
- мати на увазі високий поріг входу;
- обирати тільки курси, де подача матеріалу вас надихає;
- за будь-якої можливості отримувати зворотний звʼязок від спеціалістів з реальною практикою;
- якомога швидше стати частиною професійного комʼюніті;
- не боятися «обнулитися» та стати новачком;
- цінувати не лише кінцевий результат, а й шлях до нього.
Найкращі коментарі пропустити