AI HOUSE CLUB, освітня онлайн-платформа від технологічної компанії Roosh, запускає курс «Виявлення фейкових новин».
Початок: 28 листопада 2022 року
Тривалість курсу: 4 тижні
Розклад: Пн — 19:00, Ср — 19:00
Тривалість сесії: 2 год
Про що цей курс
Щодня ми споживаємо тисячі новин, мемів та відеороликів. Багато з них містять дезінформацію. Протягом курсу ми навчимося виявляти ці маніпуляції за допомогою новітніх технік NLP. Для цього зберемо та опрацюємо величезну кількість новин з відкритих джерел. Використовуючи класичні методики NLP та Deep Learning ти також навчишся застосовувати неконтрольовані методи для групування новин за темами, пошуку недостовірної інформації та її класифікації. А оскільки найкраще навчання — це практика, протягом курсу ти створиш власний детектор фейкових новин та підсумовувач новин.
✅ Збір даних з відкритих джерел
✅ Відбір та вивчення даних
✅ Класифікація фейкових новин та маніпуляцій
✅ Використання саммаризації тексту та topic modeling
Кому буде корисним цей курс
- Python-інженерам
/ З базовим знанням ML
ML-інженерам
/ Що працюють в інших напрямках
- NLP-інженерам
/ Яких цікавлять сучасні методи вирішення старих проблем
Коучі
Роман Кислий, PhD in CS, AI Lead в Infopulse
Володимир Сидорський, Kaggle Competition Master, R&D TeamLead в Respeecher
Програма курсу
Тиждень 1. Вступ та формалізація задач у сфері ML
Заняття 1. Вступ
- Огляд структури курсу
- Історія розвитку та сучасний стан дослідження NLP
Заняття 2. Формалізація
- Від бізнес-задачі до математичної формалізації
- Приклади задач
- Метрики
- Формалізація
ML-моделі - Лінійна регресія як формалізована модель ML
Тиждень 2. Обробка даних
Заняття 3. Пошук та підготовка даних
- Основні джерела відкритих даних
- Підготовка текстових даних
Заняття 4. Пошук та підготовка даних
- Створення валідації
- Перевірка валідації на найпростішій моделі
Тиждень 3. Лінійні та рекурентні моделі
Заняття 5. Представлення текстових даних
- Модель Bag of Words
- TF-IDF
- Векторне представлення речень/слів через нейронну мережу (Sentence/Words embeddings)
Заняття 6. Регресії та рекурентні моделі
- Лінійна/логістична регресія
- RNN, GRU, LSTM
- Класифікація речень/токенів
Тиждень 4. Трансформери та кластеризація текстів
Заняття 7. Трансформери
- Огляд моделей
- Типи трансформерів. Cross-attention та Self-attention
- Платформа «Hugging Face»
- Класифікація речень/токенів
Заняття 8. Кластеризація та тематичне моделювання
- Кластеризація. Алгоритми кластеризації
- Кластеризація тексту через векторні представлення (Text Embeddings clustering)
- Тематичне моделювання
***
Подробиці щодо навчання та інших курсів — на сайті aihouse.club
Приєднуйся до нашої AI/ML спільноти у соц. мережах:
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів