Як мислить Data Scientist: коротко про дані, етику та ШІ 🧠

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Це новий випуск YouTube-рубрики «Х питань», де ми розпитуємо представників різних спеціальностей про їхній фах і те, що турбує IT-спільноту.

🤖 У цьому відео розібрались, як працює Data Science ізсередини. Чим Data Scientist відрізняється від аналітика, які фейли трапляються з даними та де проходить межа між ШІ й приватністю. Поговоримо про упереджені моделі, етику й те, як дані можуть змінювати світ.

Ганна Пилєва — CEO&Founder Data Loves Academy.

Навігація

00:00 Інтро
00:17 Чим займається Data Scientist? Поясни простими словами.
00:40 У чому головна різниця між Data Scientist, Data Analyst та Machine Learning Engineer?
01:52 Чи потрібно вміти добре програмувати, щоб бути Data Scientist?
02:22 Що складніше — зібрати якісні дані чи навчити модель?
03:29 Наскільки складно (або легко) стати Data Scientist?
05:45 Чи може Data Scientist випадково (або свідомо) створити упереджену модель?
06:59 Розкажи про свій найбільший фейл, повʼязаний з пошуком/вивченням даних.
08:39 Де межа між Data Science і втручанням у приватність?
10:07 Чи є конкуренція між Data Science та ШІ?

Все про українське ІТ в телеграмі — підписуйтеся на канал DOU

👍ПодобаєтьсяСподобалось2
До обраногоВ обраному0
LinkedIn



2 коментарі

Підписатись на коментаріВідписатись від коментарів Коментарі можуть залишати тільки користувачі з підтвердженими акаунтами.

Дякую. Цікавий і концентрований опис того, що зараз прийнято називати data science в комерційному середовищі. (Бо в академічному середовищі це дещо інше).

Відмітив для себе, що слово «ймовірність» не було використано жодного разу. Чи бувають у вас проекти, де треба використовувати теорію ймовірності?

Я працюю із фінансовими моделями і обчисленням ризиків. Мене зацікавив приклад задачі по передбаченню ЛТВ, яка «не вірішується» через «надто велику стохастичність». В моїй сфері це доволі типова ситуація, коли fat tails розподіл якоїсь метрики буде мати середнє (expected value), але не мати кінечної дисперсії, що робить точкове прогнозування марним через неможливість вказати довірчий інтервал. Можливо, це і є ситуація, де теорія ймовірності підказала б інший шлях/іншу корисну метрику?

Вітаю! Так, я працювала в Gr8 Tech і там ми використовували формули з ТЙ. ТЙ також питають на співебідах — теорему Баєса, повної імовірності, бо ТЙ — це основа статистики, яка вже використовується безпосередньо в аналітичних і дата саєнс задачах часто. Тож, коли я і інші фахівці кажемо про необхідність знання статистики — це включає необхідність знання і ТЙ.

В бетингу справді з баєсівським підходом і ТЙ моделюють події. Я на жаль в цьому не спеціаліст, бо це окремий великий світ, але знаю, що так роблять)

Підписатись на коментарі