Big Data, Machine Learning, Data Science Digest #16: сертифікація TensorFlow, Reinforcement Learning та альтернативи GTP-3

Підписуйтеся на Telegram-канал «DOU #tech», щоб не пропустити нові технічні статті.

У цьому випуску дайджеста я вкотре збираю матеріали, новини та цікаві проєкти зі світу Machine Learning, Data Science та штучного інтелекту. Ось про що ви дізнаєтесь:

  • Які алгоритми конкуруватимуть із GPT-3.
  • Як автоматизувати процес наукового дослідження.
  • Як пройти сертифікацію TensorFlow.
  • Як побудувати альтернативу для Google Photos із PyTorch.
  • Як розділяти звуковий мікс у відео на складові.
  • Як формувати матриці у режимі coder-decoder.
  • Та чимало іншого.

Якщо ви ще не ознайомилися із моїм попереднім дайджестом, його можна знайти тут. Також я завжди радий коментарям та фідбеку!

Що прочитати: статті

Deriving Business Value Through Data Governance

Збірка коротких та влучних порад, які допомагають технічним командам отримати максимум від ініціатив з управління даними.

GPT-3 is no Longer The Only Game in Town

Стаття розглядає і порівнює альтернативи GPT-3: здається, у OpenAI є серйозний конкурент.

Washington U & Google Study Reveals How Attention Matrices Are Formed in Encoder-Decoder Architectures

На основі дослідження університету Вашингтону та команд із Google стаття розглядає метод для декомпозиції прихованих станів над послідовністю на тимчасові та вхідні компоненти і показує, як формуються матриці уваги в мережах кодер-декодер.

Zillow, Prophet, Time Series, & Prices

Полемічна стаття аналізує, чи правильне рішення Zillow шукати Senior Data Scientist із досвідом використання винятково бібліотеки Prophet.

Mimicking a Scientist: Towards Automated Scientific Discovery

Пост пропонує покроковий процес побудови автоматизованої системи наукових досліджень.

Projected GANs Converge Faster

Незважаючи на значний прогрес у сфері, розробка GAN з нуля все ще є нелегким завданням, особливо для невеликих наборів даних. Метод навчання, описаний у статті, працює, використовуючи попередньо навчену мережу.

Над чим попрацювати: проєкти

JORLDY: OpenSource Reinforcement Learning Framework

Відкритий фреймворк для reinforcement learning, що містить більш як 20 алгоритмів 0+ RL (Pytorch) та включає різноманітні середовища RL.

League of Legends Patch 11.21 Game Playing AI (Reinforcement Learning, Supervised Learning) Dataset

Набір даних, призначений для всіх, хто хотів би спробувати створити агент глибокого навчання за допомогою контрольованного або (офлайнового) навчання з підкріпленням для гри в League of Legends. Набір даних містить 72 ігри з патча 11.21, де гра закінчилася достроковою капітуляцією.

Open Source Photos Platform powered by PyTorch

Автономна альтернатива Google Photos, створена в PyTorch.

Optimization of Hugging Face Transformer models to get Inference < 1 Millisecond Latency

Проєкт показує, як оптимізувати великі моделі NLP та запустити їх на сервері Nvidia Triton.

Що послухати: подкасти

Building Conversational AI to Augment Sales Teams at Structurely

Нейт Джоенс — співзасновник Structurely — платформи для розмовного штучного інтелекту, яка доповнює команди продажів. У цьому епізоді він обговорює технічні та соціальні вимоги, яких необхідно дотримуватися для автоматизації природньої розмови.

Analyzing the 2021 AI Index Report

Глибокий аналіз звіту 2021 AI Index, опублікованого Стенфордським Інститутом Людиноорієнтованого Штучного Інтелекту.

AI For Good | Super Data Science

Подкаст аналізує способи використання штучного інтелекту для соціальної вигоди та пропонує результативні кейси застосування AI для зміни світу на краще.

AI Trends that will impact business leaders | AI in Business

Мартін Форд, футурист та автор New York Times бестселлера «Rule of the Robots», обговорює метатенденції щодо того, як AI змінює бізнес, дає керівнику доступ до нових можливостей та підвищення операційної ефективності.

Що подивитися: відео

I Put Myself INSIDE A Video Game!

Відео розповідає про AI-альтернативу full-body-контроллерам AXIS чи Nintendo Wii для занять фізичним спортом в ігровій формі.

Self-supervised RL: Zero to Paper

Відео зроблене на основі наукової статті, яка пропонує шлях, щоб зробити ефективний вибірковий IRL та спосіб узагальнення за допомогою самоконтрольованого навчання.

How I passed the TensorFlow Developer Certification exam (and how you can too)

У новому відео Daniel Bourke розповідає про те, як розробити план, який допоможе відточити навички машинного навчання та скласти сертифікацію TensorFlow.

[ML News] Google introduces Pathways | OpenAI solves Math Problems | Meta goes First Person

Короткий та влучний огляд останніх подій у світі Machine Learning: нові можливості OpenAI, реліз Pathways від Google та загальний ентузіазм стосовно Meta.

Why neural networks aren’t neural networks

Відео пропонує новий погляд на те, як штучний інтелект сортує дані, обробляє зображення та ухвалює рішення.

Що вивчити: ще наукові статті

Same data, different conclusions: Radical dispersion in empirical results when independent analysts operationalize and test the same hypothesis

Із використанням аналізу даних стаття показує, як суб’єктивна інтерпретація набору даних впливає на результати наукових досліджень.

The cocktail fork problem: three-stem audio separation for real-world soundtracks

Розділення звукового міксу (наприклад, саундтрека до фільму) на три категорії: розмова, музика та звукові ефекти є малодослідженим, незважаючи на широкий спектр потенційних застосувань. Стаття формалізує цю задачу як «cocktail fork problem» та пропонує набір даних «Divide and Remaster» («Поділ та переробка»), щоб сприяти дослідженням на цю тему.

Reward Prediction for Representation Learning and Reward Shaping

Однією з фундаментальних проблем навчання з підкріпленням (RL) є ефективність даних: сучасні алгоритми вимагають дуже великої кількості навчальних вибірок. У цій роботі автори пропонують вивчати «state representation» в самоконтрольний спосіб для передбачення винагород.

ADOP: Approximate Differentiable One-Pixel Point Rendering

Новий точковий диференційований конвеєр нейронної візуалізації для уточнення сцени та синтезу нового вигляду.

Recursively Summarizing Books with Human Feedback

Основною проблемою для масштабування машинного навчання є навчання моделей для виконання великих та складних завдань. Описаний метод показує прогрес у цій сфері на прикладі узагальнення художніх романів із використанням GPT-3.

***

Дякую за увагу! Щоб не пропустити мій наступний дайджест, клікайте «Підписатися на автора» одразу під текстом.

Якщо ви бажаєте працювати у колі однодумців над складними data-centric проєктами — приєднуйтесь до команди Xenoss! Серед наших найгарячіших вакансій:

Lead Node.js Engineer

Team Lead Java Engineer

Senior Data Scientist/ML Engineer

Стежити за новинами Xenoss можна у соц-мережах — LinkedIn та Facebook.

👍НравитсяПонравилось5
В избранноеВ избранном2
LinkedIn
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Подписаться на комментарии