Big Data, Machine Learning, Data Science Digest #12: GNNs, AI&ML in Gaming, Creative Automation, Reinforcement Learning for Recommendation Systems
Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!
У цьому випуску дайджеста, де я зібрав найцікавіше зі світу AI, ML та Data Science за останній час, ви дізнаєтесь про таке:
- Чи може АІ забути дані?
- Все про графові нейронні мережі.
- 3D-контент для синтетичних даних.
- Поточний стан креативної автоматизації.
- Баг-баунті від Twitter.
- Як побудувати просту ANN з нуля.
- Reinforcement learning для рекомендаційних систем.
- AI/ML в ігровій індустрії.
- Та багато іншого.
Якщо ви проґавили мій попередній дайджест, його можна переглянути тут. Як завжди, фідбек та коментарі вітаються.
Свіжі статті та матеріали
Radar trends to watch: September 2021
Від рідких нейронних мереж до роботів-хамелеонів, від генералізації АІ до перетворення простої англійської мови у виконуваний код — Майк Лукідс, віцепрезидент з контент-стратегії O’Reilly Media, Inc. розглядає нові тенденції, розробки і технології, за якими варто стежити.
Now That Machines Can Learn, Can They Unlearn?
Дослідники шукають шляхи, як позбутися конфіденційних даних без того, щоб перенавчати модель АІ.
Introducing Twitter’s first algorithmic bias bounty challenge
Натхнений спільнотою фахівців з безпеки і «баг-баунті» Twitter пропонує винагороду тим, хто виявить алгоритмічну упередженість.
A Gentle Introduction to Graph Neural Networks
Чудове введення в графічні нейронні мережі, починаючи з основ графів і того, чим графові дані відрізняються від інших типів даних. Це джерело пояснює і будує GNN від простої реалізації до найсучаснішої моделі. Тут є і чого повчитися, і з чим пограти.
How Midsize Companies Can Compete in AI
Стартапи і багатомільярдні гіганти мають всі можливості для використання АІ, але середній бізнес залишається позаду. Ось як спільні підприємства в галузі АІ можуть допомогти їм надолужити згаяне.
Ten Quick Software Design Tips for Data Scientists
Можливо, вам не доводиться писати великі програми, які масштабуються, але поради, викладені тут, допоможуть переконатися, що ваші навіть невеликі скрипти зрозумілі, прості в обслуговуванні і розраховані на розвиток. Це дуже корисний допис, особливо для неінженерів.
Best Practices on Recommendation Systems
Відмінна колекція прикладів, кращих практик і утилітів Python для створення і оцінки рекомендаційних систем.
Getting started with 3D content for synthetic data
Створення систем комп’ютерного зору, що використовують синтетичні дані дуже відрізняються від систем, що використовують реальні дані. На щастя, індустрія кіно і відеоігор стикається з цими ж проблемами контенту вже понад сорок років. За цей час вони розробили нові методи створення контенту, а також великі сховища контенту, більша частина якого вже ідеально підходить для синтетичних даних. У цій статті представлені кращі способи пошуку 3D-контента, кожен з яких підходить для різних типів застосування комп’ютерного зору.
The State of Creative Automation
Як і в багатьох інших сферах нашого життя і роботи, творчість, здатність винаходити або проєктувати щось нове з нуля, може здатися останньою тихою гаванню від автоматизації/машин. Але з новими досягненнями в галузі штучного інтелекту, креативність тепер перетворюють технології, її пропонують як послугу споживачам і компаніям. Тут наводять неповний список категорій контенту, які заново відкриваються за допомогою штучного інтелекту.
Google’s New AI Photo Upscaling Tech is Jaw-Dropping
Збільшення фото у фільмах і телепередачах часто висміюють за правдоподібність, але дослідження щодо реального збільшення резолюції фотографій все більше і більше наближаються до галузі наукової фантастики. Новітня технологія Google зі збільшення фотографій за допомогою штучного інтелекту — чудовий приклад цього.
Building a Vanilla Artificial Neural Network from Scratch (in R)
Простий гід зі створення «ванільного» ANN з нуля (без використання вбудованих модулів).
Reinforcement Learning for Recommendations and Search
У своїх останніх статтях в блозі Євген Ян розповідає про недоліки звичайних рекомендаційних систем і про те, як reinforcement learning може з цим допомогти. У статтях представлені різні підходи, які пропонує reinforcement learning для рекомендаційних систем.
Що нового у наукових працях
Multiplying Matrices Without Multiplying
Finetuned Language Models Are Zero-Shot Learners
Datasets: A Community Library for Natural Language Processing
ReasonBERT: Pre-trained to Reason with Distant Supervision
EvilModel 2.0: Hiding Malware Inside of Neural Network Models
Що послухати
Deep Reinforcement Learning for Game Testing at EA with Konrad Tollmar
Епізод з Конрадом Толлмаром, директором з досліджень в Electronic Arts і доцентом KTH, в якому він розповідає про те, як EA застосовує ML/AI у таких популярних франшизах, як Apex Legends, Madden і FIFA, і про свій погляд на майбутнє ML для навчання в іграх.
Floor to Ceiling Data Strategy
Нейтан Маннхаймер з Tableau розповідає про тонкощі стратегії роботи з даними, починаючи з індивідуального рівня і закінчуючи корпоративним, а також про те, як «гуманізація» даних може підвищити рівень вашої стратегії.
Designing And Building Data Platforms As A Product
Термін «платформа даних» часто вживають, але чи замислювалися ви про те, що він означає для вас і вашої організації? У цьому епізоді Ліор Гавіш, Ліор Соломон і Атул Гупті діляться своїм баченням того, що значить мати платформу даних, обговорюють свій досвід її створення в різних компаніях і дають поради про те, як ставитися до неї як до програмного продукту.
Donald Knuth: Programming, Algorithms, Hard Problems & the Game of Life
Бесіда з Дональдом Кнутом, вченим-інформатиком, лауреатом премії Тюрінга, батьком аналізу алгоритмів, автором книги «Мистецтво комп’ютерного програмування» і творцем TeX.
Moldable Development with Glamorous Toolkit
У цьому епізоді йдеться про moldable programming — практику програмування, за допомогою якої ми створюємо власні інструменти для кожної проблеми розробки, з якою стикаємося.
Decentralizing AI with Divya Siddarth
Що таке децентралізований AI, як і чому ми повинні його розробляти і впроваджувати?
Щоб відповісти на це та інші запитання в цьому епізоді, Дівія Сіддарт розповідає про децентралізацію AI, його демократизацію і про те, як ми можемо використовувати логіку соціальних рухів для впливу на дизайн наших технологій.
Що подивитися
Лекція Ленки Здеборової з літньої школи в Каргезі 2021.
Probability Calibration: Data Science Concepts
Ймовірності, які ви отримуєте від своїх моделей, зазвичай дуже помилкові. Як можна це виправити?
∞-former: Infinite Memory Transformer (aka Infty-Former / Infinity-Former, Research Paper Explained)
Ванільні трансформатори є відмінними моделями послідовностей, але страждають від дуже жорстких обмежень на довжину послідовностей, які вони можуть обробляти. У цій роботі представлено метод, заснований на механізмах безперервної уваги, що дозволяє обробляти необмежену минулу послідовність, представляючи минуле як безперервний сигнал, а не як послідовність.
[ML News] AI predicts race from
Короткий огляд найбільш важливих новин в світі ML за останній місяць.
Записи з воркшопу Центру досліджень базових моделей, нової ініціативи Stanford Institute for Human-Centered Artificial Intelligence (HAI).
***
Дякую за увагу! Щоб не пропустити мій наступний дайджест, клікайте «Підписатися на автора» одразу під текстом.
Якщо ви бажаєте працювати у колі однодумців над складними data-centric проєктами — приєднуйтесь до команди Xenoss! Серед наших найгарячіших вакансій:
Senior Data Scientist/ML Engineer
AI/ML Computer Vision Engineer
Стежити за новинами Xenoss можна у соцмережах — LinkedIn та Facebook.
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів