Big Data, Machine Learning, Data Science Digest #29: StoryDALL-E, презентація Whisper, екосистема Google для ШІ, анонс ACT-1
Підписуйтеся на Telegram-канал «DOU #tech», щоб не пропустити нові технічні статті.
Привіт! З вами на зв’язку Вова Кириченко з черговим випуском новин зі світу Big Data, ML та Data Science. У цьому дайджесті я ділюсь з вами добіркою матеріалів, що видались мені найцікавішими протягом останнього місяця.
Сьогодні ви детальніше прочитаєте про таке:
- DALL-E тепер доступний для всіх бажаючих.
- Анонс моделі штучного інтелекту ACT-1.
- Як AI та Deep Learning допомагатимуть моніторити стан та оберігати Великий Бар’єрний Риф.
- Гайд з генерації нових зображень за допомогою KerasCV.
- Відкрита екосистема Google для ШІ.
- Традиційна підбірка корисних подкастів.
Якщо ви проґавили мій попередній дайджест — не проблема, його можна переглянути тут. Як завжди, фідбек, коментарі та поширення вітаються і дуже цінуються.
Статті про AI/ML
DALL-E image generator is now open to everyone
Днями OpenAI оголосила, що видалила список очікування для своєї служби створення зображень DALL-E AI. Це означає, що тепер кожен бажаючий може зареєструватися та використовувати його. До цього DALL-E був доступний лише за запрошеннями.
New AI assistant can browse, search, and use web apps like a human
Каліфорнійська компанія Adept Yesterday що працює з ШІ, анонсувала Action Transformer (ACT-1), модель штучного інтелекту, яка може виконувати дії в програмному забезпеченні, як людина-помічник, коли отримує високорівневі письмові та усні команди.
DynamoFL aims to bring privacy-preserving AI to more industries
Регуляторні норми про конфіденційність даних, такі як GDPR, CCPA та HIPAA, створили значні труднощі з навчанням систем штучного інтелекту конфіденційним даним, таким як фінансові транзакції, медичні записи пацієнтів і журнали пристроїв користувачів. Про те, як DynamoFL хоче запровадити штучний інтелект в більшій кількості галузей, при цьому зберігаючи конфіденційність, — у даній статті.
Regulating Artificial Intelligence — Is Global Consensus Possible?
ШІ став звичним явищем у житті мільярдів людей всюдисвітно, але залишається одна величезна невирішена проблема — як регулювати його використання? Чи можливий глобальний консенсус у цьому питанні, або фрагментарний регуляторний підхід все ж неминучий? Про це дізнаємось більше з даного матеріалу.
Artificial Intelligence and Deep Learning Models Will Be Used to Protect the Great Barrier Reef
Тепер дослідники матимуть змогу використовувати останні технологічні досягнення для моніторингу та захисту Великого Бар’єрного рифу. Після фотографій, зроблених вченими, буде використано штучний інтелект та deep learning для моніторингу поточного стану Рифу та його захисту.
AI for Beginners — Top 8 Resources for Learning Machine Learning
Машинне навчання для багатьох за останні роки стало модним buzz-word, та при цьому його розвиток за ці роки призвів до суттєвих проривів, і сьогодні воно відіграє одну з ключових ролей у сучасному світі. У цій добірці пропонуємо декілька корисних ресурсів, щоб краще розібратися в технології, котра змінює наше життя.
Наукові статті
High-performance image generation using Stable Diffusion in KerasCV
У цьому гайді детально висвітлено те, як генерувати нові зображення на основі текстової підказки, що використовує імплементацію stability.ai — KerasCV, за допомогою реалізації моделі перетворення тексту в зображення, Stable Diffusion.
Yann LeCun: A Path Towards Autonomous Machine Intelligence
Зміст даного матеріалу можна підсумувати одним запитанням: «Як машини можуть навчатися так само ефективно, як люди і тварини?». Складне запитання, на яке ще потрібно відповісти, і тому ця стаття служить більше як пропозиція щодо майбутніх напрямків дослідження, а не як звичайна технічна стаття.
У даному технічному документі детально розказується про Whisper — систему автоматичного розпізнавання мовлення, що навчена на основі 680 000 годин багатомовних і багатозадачних контрольованих даних, зібраних з інтернету.
StoryDALL-E: Adapting Pretrained Text-to-Image Transformers for Story Continuation
Останні досягнення в синтезі text-to-image привели до великих GPT з відмінними можливостями генерувати візуалізацію з певного тексту. Однак, ці моделі погано підходять для таких спеціалізованих завдань, як візуалізація оповідань, які вимагають від агента створити послідовність зображень з відповідною послідовністю підписів, формуючи таким чином розповідь. У цій роботі продемонстровано, що попередньо навчені моделі синтезу тексту в зображення можна адаптувати для виконання складних і малоресурсних завдань, таких як продовження історії.
Git Re-Basin: Merging Models modulo Permutation Symmetries
У даному дослідженні представлено три алгоритми для перестановки одиниць однієї моделі, щоб узгодити їх з одиницями еталонної моделі. Експериментально продемонстровано феномен єдиного басейну в різноманітних модельних архітектурах і наборах даних, включаючи демонстрацію зв’язку в лінійному режимі без бар’єрів між незалежно навченими моделями ResNet на CIFAR-10 і CIFAR-100.
Подкасти
Data Science For Social Media: Twitter And Reddit
В гостях у Хюго — Кеті Бауер, котра розповідає про етап своєї кар’єри, коли вона працювала з data science у Twitter і Reddit. На момент запису епізоду Кеті була дата сайнс менеджером у Twitter, а до цього була одним із засновників data team у Reddit. Зараз же вона очолює відділ даних у Gloss Genius. У цій розмові вони занурюються в те, з якими проблемами стикаються компанії соціальних медіа, і як наука про дані може допомогти їх вирішити.
Production data labeling workflows
Одна справа — зібрати мітки для своїх даних. Інша справа — інтегрувати маркування даних у ваші робочі процеси та інфраструктуру масштабованим, безпечним і практичним способом. Марк із Xelex є гостем цього епізоду, і розповідає про те, чого він навчився, допомагаючи компаніям масштабувати зусилля з анотації даних. Це дуже практичний епізод, де розглянуто управління робочим процесом, інструкції з маркування, командну динаміку та оцінку якості.
Undiagnosable Cancers, Robot Sales, Decoding Brain Activity, AI Music
В найновішому епізоді AI Podcast:
- використання AI для виявлення недіагностованих ракових захворювань;
- декодування мовлення на основі аналізу активності мозку;
- роботи, що оцінюють психічне здоров’я дітей;
- стратегія розвитку ШІ у Франції з фінансуванням $1,8 млрд.
Complex ML Models with Data Scientist Fernando Lopez
Гість випуску — Фернандо Лопес, що ділиться своїми ідеями та інсайтами стосовно того, як використовувати ML у відео-платформі для найму працівників. Майкл і Бен також глибоко занурюються в різноманітні взаємопов’язані моделі машинного навчання та інші навколо-AI теми.
The Deep Learning Revolution in Space Science
Як Космічні сили США використовують deep learning за допомогою даних телескопів для спостереження за супутниками, потенційно смертельним космічним сміттям, а також для виявлення та запобігання катастрофічним зіткненням? Джастін Флетчер приєднується до цього епізоду шоу, щоб розповісти про все це, і більше.
Відео
У цьому випуску MLOps Coffee Sessions з Кушем Варшні, провідним науковим співробітником і керівником IBM Research, розмова іде про Trustworthy Machine Learning, співорганізатором якого є Крішнарам Кентападі.
Надійне машинне навчання — це спосіб мислення, над яким потрібно працювати та імплементувати протягом усього життєвого циклу розробки машинного навчання, починаючи з фази визначення проблеми, яка має залучати різноманітні зацікавлені сторони.
The Road Ahead: Google’s Comprehensive Platform for Open Source Machine Learning
Google пропонує єдину повністю безкоштовну екосистему з відкритим вихідним кодом для штучного інтелекту та машинного навчання, яка охоплює все: від даних до визначення моделі та навчання, розгортання, операцій, прискореного апаратного забезпечення та інструментів для відповідального використання штучного інтелекту. У цій доповіді Лоуренс розповість вам про масштабні думки, які Google вкладає в майбутнє штучного інтелекту та машинного навчання для любителів, розробників і дослідників.
***
На сьогодні це все найважливіше, чим я хотів з вами поділитись.
Щоб не втрачати зв’язок та не пропустити мій наступний дайджест, клікайте «Підписатися на автора» одразу під текстом.
А якщо ви знаходитесь у пошуку «свого ідеального місця під сонцем» або втратили роботу через війну — долучайтеся до Xenoss, щоб працювати у колі однодумців над складними та довготривалими data-centric проєктами. Наші клієнти — провідні SaaS-компанії, всесвітньо відомі підприємства та стартапи, що активно розвиваються.
Серед наших переваг — цікавезні проєкти, гнучкий графік та повний ремоут. Тому, де б ви не перебували — сміливо надсилайте своє резюме!
Серед наших найгарячіших вакансій зараз:
Senior Backend SDE (Java) | North European advertising platform
Data Scientist for Toshiba product
Senior DevOps Engineer | Media network
Запрошую вас стежити за останніми новинами Xenoss у наших соцмережах — LinkedIn та Facebook.
Дякую за увагу, коментуйте, поширюйте, і до нового випуску дайджесту!
Слава Україні!
2 коментарі
Додати коментар Підписатись на коментаріВідписатись від коментарів