Курс «Time Series: Baseline» (событие в архиве)

Відбулось
12 жовтня (вівторок)
Місце
Online
Вартість
10 000 грн/міс

На курсі освоїмо фундамент, на якому будується весь Time Series.

Прогнозування продажів, ефективності маркетингової стратегії, попиту на той чи інший товар та навіть детекція поз людини — ці завдання можна вирішити за допомогою Time Series (часових рядів).

Упродовж курсу зрозуміємо, що взагалі таке часові ряди. Дізнаємося фундаментальні принципи Time Series і навчимося працювати з необхідними бібліотеками. Будемо формувати й перевіряти гіпотези. Зрозуміємо, як адаптувати тези машинного навчання з інших дисциплін для роботи з Time Series.

На курсі студенти працюватимуть з кейсом від Fozzy Group. Після курсу отримаємо фундамент для роботи з часовими рядами та чітке розуміння сфер застосування Time Series.

12 жовтня 2021, курс триває 3 місяці
10 000 грн/міс, 30 000 грн при повній оплаті курсу, 10 500 грн/міс при оплаті частинами
25 студентів, кожен студент отримує регулярний фідбек від кураторів групи

Деталі та реєстрація

Кураторка

Анна Вітюк

CEO та співзасновниця у Reactive Capital.

Програма курсу

1. Екскурс в математичну статистику
— Поняття безумовної та умовної ймовірності.
— Поняття ймовірнісних просторів, поняття розподілу ймовірності, середнього, дисперсії, стандартного відхилення, перекосу, ексцесу, довірчого інтервалу та їх приклади.

2. Типи завдань машинного навчання — регресія, класифікація, ранжування
— Природа випадкової величини, що моделюється (дискретна, безперервна).
— Гранична теорема у визначенні природи шуканої випадкової величини (у).
— Структура даних і різноманіття задач часового ряду; чим часовий ряд відрізняється від звичайної регресії / класифікації.
— Приклади датасетів.

3. Що таке часовий ряд
— Поняття дано, шукане і вікно прогнозу. Важливість підбору вікна прогнозу і його горизонту. Поняття довірчого інтервалу та ймовірносних просторів. Взаємозв’язок довірчого інтервалу ймовірності й горизонту вікна прогнозу.
— Уніваріантність і мультиваріантність часового ряду. Ендогенні й екзогенні ознаки.
— Порівняння завдань класичного машинного навчання і часового ряду. Рекурентна залежність шуканого від самого себе у часі в задачах часового ряду і NLP.

4. Моделі ARIMA й ознайомлення з бібліотекою statsmodels: ARMA, ARIMA, SARIMA, SARIMAX
— Порядки авторегресії, сезону, рухомого середнього, їх призначення та оптимальні значення.
— Підбір вікна прогнозу.

5. Поняття сезонності й огляд моделі SARIMA
Мультиваріантний часовий ряд з сезонною компонентою SARIMAX і без — ARIMAX.

6. Підбір гіперпараметрів для сімейства S/ARIMA/X
Введення в тест Акаіке.

7. Введення в машинне навчання для часового ряду
— Повторення основних тез машинного навчання з інших дисциплін, адаптація їх для задач часового ряду.
— Ознайомлення з бібліотекою scikit-learn, xgboost, catboost, lightgbm.
— Деревовидні та бустингові моделі.

8. Формування і перевірка гіпотез, статистичні тести з прикладами
Поняття крос-валідації для часового ряду, її особливості та приклади на scikit-learn.

9. Авторегресія та інженерія ознак. Поняття автокореляції
— Перевірка даних на автокореляції.
— Витяг лагів (shift, expanding) з сирих даних.
— Витяг множини ознак з єдиної величини — часові й автокореляційні.

10. Рухомі статистики для інженерії ознак
Поняття регресії до середнього на прикладі з лінійною регресією, поняття рухомої середньої та інших статистик, а також їх ймовірнісні перетини з шуканим (у).

11. Рекурентні нейронні мережі в задачах класифікації часового ряду
Приклади класифікації людської активності з використанням LSTM.

12. Cracking the Data Science deadline😱
— Автоматизація крос-валідації, підбору моделей і передпідготовки даних — бібліотека PyCaret.
— Прискорення розробки в кілька разів за допомогою автоматизації пайплайну.
— Швидка валідація гіпотез і прототипування моделей.
— Багаторазове підвищення ймовірності не тільки встигнути до дедлайну, але ще й здивувати вашого менеджера результатами ;)

Кому буде корисним цей курс

1. Програмістам
Програмістам з інших сфер, які розуміють Python (класи, функції) та мають хоча б базові знання із Pandas і NumPy.

2. Junior Data Scientist-ам
Початківцям в Data Science, які хочуть освоїти Time Series.

Зареєструватися

👍НравитсяПонравилось1
В избранноеВ избранном0
LinkedIn

Нет комментариев

Подписаться на комментарииОтписаться от комментариев Комментарии могут оставлять только пользователи с подтвержденными аккаунтами.

Подписаться на комментарии