Big Data, Machine Learning, Data Science Digest #16: сертифікація TensorFlow, Reinforcement Learning та альтернативи GTP-3
У цьому випуску дайджеста я вкотре збираю матеріали, новини та цікаві проєкти зі світу Machine Learning, Data Science та штучного інтелекту. Ось про що ви дізнаєтесь:
- Які алгоритми конкуруватимуть із GPT-3.
- Як автоматизувати процес наукового дослідження.
- Як пройти сертифікацію TensorFlow.
- Як побудувати альтернативу для Google Photos із PyTorch.
- Як розділяти звуковий мікс у відео на складові.
- Як формувати матриці у режимі coder-decoder.
- Та чимало іншого.
Якщо ви ще не ознайомилися із моїм попереднім дайджестом, його можна знайти тут. Також я завжди радий коментарям та фідбеку!
Що прочитати: статті
Deriving Business Value Through Data Governance
Збірка коротких та влучних порад, які допомагають технічним командам отримати максимум від ініціатив з управління даними.
GPT-3 is no Longer The Only Game in Town
Стаття розглядає і порівнює альтернативи GPT-3: здається, у OpenAI є серйозний конкурент.
На основі дослідження університету Вашингтону та команд із Google стаття розглядає метод для декомпозиції прихованих станів над послідовністю на тимчасові та вхідні компоненти і показує, як формуються матриці уваги в мережах кодер-декодер.
Zillow, Prophet, Time Series, & Prices
Полемічна стаття аналізує, чи правильне рішення Zillow шукати Senior Data Scientist із досвідом використання винятково бібліотеки Prophet.
Mimicking a Scientist: Towards Automated Scientific Discovery
Пост пропонує покроковий процес побудови автоматизованої системи наукових досліджень.
Projected GANs Converge Faster
Незважаючи на значний прогрес у сфері, розробка GAN з нуля все ще є нелегким завданням, особливо для невеликих наборів даних. Метод навчання, описаний у статті, працює, використовуючи попередньо навчену мережу.
Над чим попрацювати: проєкти
JORLDY: OpenSource Reinforcement Learning Framework
Відкритий фреймворк для reinforcement learning, що містить більш як 20 алгоритмів 0+ RL (Pytorch) та включає різноманітні середовища RL.
League of Legends Patch 11.21 Game Playing AI (Reinforcement Learning, Supervised Learning) Dataset
Набір даних, призначений для всіх, хто хотів би спробувати створити агент глибокого навчання за допомогою контрольованного або (офлайнового) навчання з підкріпленням для гри в League of Legends. Набір даних містить 72 ігри з патча 11.21, де гра закінчилася достроковою капітуляцією.
Open Source Photos Platform powered by PyTorch
Автономна альтернатива Google Photos, створена в PyTorch.
Optimization of Hugging Face Transformer models to get Inference < 1 Millisecond Latency
Проєкт показує, як оптимізувати великі моделі NLP та запустити їх на сервері Nvidia Triton.
Що послухати: подкасти
Building Conversational AI to Augment Sales Teams at Structurely
Нейт Джоенс — співзасновник Structurely — платформи для розмовного штучного інтелекту, яка доповнює команди продажів. У цьому епізоді він обговорює технічні та соціальні вимоги, яких необхідно дотримуватися для автоматизації природньої розмови.
Analyzing the 2021 AI Index Report
Глибокий аналіз звіту 2021 AI Index, опублікованого Стенфордським Інститутом Людиноорієнтованого Штучного Інтелекту.
AI For Good | Super Data Science
Подкаст аналізує способи використання штучного інтелекту для соціальної вигоди та пропонує результативні кейси застосування AI для зміни світу на краще.
AI Trends that will impact business leaders | AI in Business
Мартін Форд, футурист та автор New York Times бестселлера «Rule of the Robots», обговорює метатенденції щодо того, як AI змінює бізнес, дає керівнику доступ до нових можливостей та підвищення операційної ефективності.
Що подивитися: відео
I Put Myself INSIDE A Video Game!
Відео розповідає про AI-альтернативу full-body-контроллерам AXIS чи Nintendo Wii для занять фізичним спортом в ігровій формі.
Self-supervised RL: Zero to Paper
Відео зроблене на основі наукової статті, яка пропонує шлях, щоб зробити ефективний вибірковий IRL та спосіб узагальнення за допомогою самоконтрольованого навчання.
How I passed the TensorFlow Developer Certification exam (and how you can too)
У новому відео Daniel Bourke розповідає про те, як розробити план, який допоможе відточити навички машинного навчання та скласти сертифікацію TensorFlow.
[ML News] Google introduces Pathways | OpenAI solves Math Problems | Meta goes First Person
Короткий та влучний огляд останніх подій у світі Machine Learning: нові можливості OpenAI, реліз Pathways від Google та загальний ентузіазм стосовно Meta.
Why neural networks aren’t neural networks
Відео пропонує новий погляд на те, як штучний інтелект сортує дані, обробляє зображення та ухвалює рішення.
Що вивчити: ще наукові статті
Із використанням аналізу даних стаття показує, як суб’єктивна інтерпретація набору даних впливає на результати наукових досліджень.
The cocktail fork problem: three-stem audio separation for real-world soundtracks
Розділення звукового міксу (наприклад, саундтрека до фільму) на три категорії: розмова, музика та звукові ефекти є малодослідженим, незважаючи на широкий спектр потенційних застосувань. Стаття формалізує цю задачу як «cocktail fork problem» та пропонує набір даних «Divide and Remaster» («Поділ та переробка»), щоб сприяти дослідженням на цю тему.
Reward Prediction for Representation Learning and Reward Shaping
Однією з фундаментальних проблем навчання з підкріпленням (RL) є ефективність даних: сучасні алгоритми вимагають дуже великої кількості навчальних вибірок. У цій роботі автори пропонують вивчати «state representation» в самоконтрольний спосіб для передбачення винагород.
ADOP: Approximate Differentiable One-Pixel Point Rendering
Новий точковий диференційований конвеєр нейронної візуалізації для уточнення сцени та синтезу нового вигляду.
Recursively Summarizing Books with Human Feedback
Основною проблемою для масштабування машинного навчання є навчання моделей для виконання великих та складних завдань. Описаний метод показує прогрес у цій сфері на прикладі узагальнення художніх романів із використанням GPT-3.
***
Дякую за увагу! Щоб не пропустити мій наступний дайджест, клікайте «Підписатися на автора» одразу під текстом.
Якщо ви бажаєте працювати у колі однодумців над складними data-centric проєктами — приєднуйтесь до команди Xenoss! Серед наших найгарячіших вакансій:
Lead Node.js Engineer
Team Lead Java Engineer
Senior Data Scientist/ML Engineer
Стежити за новинами Xenoss можна у соц-мережах — LinkedIn та Facebook.
Подобається дайджест? Підписуйтесь на автора, щоб отримувати сповіщення про нові публікації на пошту.

Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів