Сучасна диджитал-освіта для дітей — безоплатне заняття в GoITeens ×
Mazda CX 5
×

Big Data, Machine Learning, Data Science Digest #29: StoryDALL-E, презентація Whisper, екосистема Google для ШІ, анонс ACT-1

Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!

Привіт! З вами на зв’язку Вова Кириченко з черговим випуском новин зі світу Big Data, ML та Data Science. У цьому дайджесті я ділюсь з вами добіркою матеріалів, що видались мені найцікавішими протягом останнього місяця.

Сьогодні ви детальніше прочитаєте про таке:

  • DALL-E тепер доступний для всіх бажаючих.
  • Анонс моделі штучного інтелекту ACT-1.
  • Як AI та Deep Learning допомагатимуть моніторити стан та оберігати Великий Бар’єрний Риф.
  • Гайд з генерації нових зображень за допомогою KerasCV.
  • Відкрита екосистема Google для ШІ.
  • Традиційна підбірка корисних подкастів.

Якщо ви проґавили мій попередній дайджест — не проблема, його можна переглянути тут. Як завжди, фідбек, коментарі та поширення вітаються і дуже цінуються.

Статті про AI/ML

DALL-E image generator is now open to everyone

Днями OpenAI оголосила, що видалила список очікування для своєї служби створення зображень DALL-E AI. Це означає, що тепер кожен бажаючий може зареєструватися та використовувати його. До цього DALL-E був доступний лише за запрошеннями.

New AI assistant can browse, search, and use web apps like a human

Каліфорнійська компанія Adept Yesterday що працює з ШІ, анонсувала Action Transformer (ACT-1), модель штучного інтелекту, яка може виконувати дії в програмному забезпеченні, як людина-помічник, коли отримує високорівневі письмові та усні команди.

DynamoFL aims to bring privacy-preserving AI to more industries

Регуляторні норми про конфіденційність даних, такі як GDPR, CCPA та HIPAA, створили значні труднощі з навчанням систем штучного інтелекту конфіденційним даним, таким як фінансові транзакції, медичні записи пацієнтів і журнали пристроїв користувачів. Про те, як DynamoFL хоче запровадити штучний інтелект в більшій кількості галузей, при цьому зберігаючи конфіденційність, — у даній статті.

Regulating Artificial Intelligence — Is Global Consensus Possible?

ШІ став звичним явищем у житті мільярдів людей всюдисвітно, але залишається одна величезна невирішена проблема — як регулювати його використання? Чи можливий глобальний консенсус у цьому питанні, або фрагментарний регуляторний підхід все ж неминучий? Про це дізнаємось більше з даного матеріалу.

Artificial Intelligence and Deep Learning Models Will Be Used to Protect the Great Barrier Reef

Тепер дослідники матимуть змогу використовувати останні технологічні досягнення для моніторингу та захисту Великого Бар’єрного рифу. Після фотографій, зроблених вченими, буде використано штучний інтелект та deep learning для моніторингу поточного стану Рифу та його захисту.

AI for Beginners — Top 8 Resources for Learning Machine Learning

Машинне навчання для багатьох за останні роки стало модним buzz-word, та при цьому його розвиток за ці роки призвів до суттєвих проривів, і сьогодні воно відіграє одну з ключових ролей у сучасному світі. У цій добірці пропонуємо декілька корисних ресурсів, щоб краще розібратися в технології, котра змінює наше життя.

Наукові статті

High-performance image generation using Stable Diffusion in KerasCV

У цьому гайді детально висвітлено те, як генерувати нові зображення на основі текстової підказки, що використовує імплементацію stability.ai — KerasCV, за допомогою реалізації моделі перетворення тексту в зображення, Stable Diffusion.

Yann LeCun: A Path Towards Autonomous Machine Intelligence

Зміст даного матеріалу можна підсумувати одним запитанням: «Як машини можуть навчатися так само ефективно, як люди і тварини?». Складне запитання, на яке ще потрібно відповісти, і тому ця стаття служить більше як пропозиція щодо майбутніх напрямків дослідження, а не як звичайна технічна стаття.

Introducing Whisper

У даному технічному документі детально розказується про Whisper — систему автоматичного розпізнавання мовлення, що навчена на основі 680 000 годин багатомовних і багатозадачних контрольованих даних, зібраних з інтернету.

StoryDALL-E: Adapting Pretrained Text-to-Image Transformers for Story Continuation

Останні досягнення в синтезі text-to-image привели до великих GPT з відмінними можливостями генерувати візуалізацію з певного тексту. Однак, ці моделі погано підходять для таких спеціалізованих завдань, як візуалізація оповідань, які вимагають від агента створити послідовність зображень з відповідною послідовністю підписів, формуючи таким чином розповідь. У цій роботі продемонстровано, що попередньо навчені моделі синтезу тексту в зображення можна адаптувати для виконання складних і малоресурсних завдань, таких як продовження історії.

Git Re-Basin: Merging Models modulo Permutation Symmetries

У даному дослідженні представлено три алгоритми для перестановки одиниць однієї моделі, щоб узгодити їх з одиницями еталонної моделі. Експериментально продемонстровано феномен єдиного басейну в різноманітних модельних архітектурах і наборах даних, включаючи демонстрацію зв’язку в лінійному режимі без бар’єрів між незалежно навченими моделями ResNet на CIFAR-10 і CIFAR-100.

Подкасти

Data Science For Social Media: Twitter And Reddit

В гостях у Хюго — Кеті Бауер, котра розповідає про етап своєї кар’єри, коли вона працювала з data science у Twitter і Reddit. На момент запису епізоду Кеті була дата сайнс менеджером у Twitter, а до цього була одним із засновників data team у Reddit. Зараз же вона очолює відділ даних у Gloss Genius. У цій розмові вони занурюються в те, з якими проблемами стикаються компанії соціальних медіа, і як наука про дані може допомогти їх вирішити.

Production data labeling workflows

Одна справа — зібрати мітки для своїх даних. Інша справа — інтегрувати маркування даних у ваші робочі процеси та інфраструктуру масштабованим, безпечним і практичним способом. Марк із Xelex є гостем цього епізоду, і розповідає про те, чого він навчився, допомагаючи компаніям масштабувати зусилля з анотації даних. Це дуже практичний епізод, де розглянуто управління робочим процесом, інструкції з маркування, командну динаміку та оцінку якості.

Undiagnosable Cancers, Robot Sales, Decoding Brain Activity, AI Music

В найновішому епізоді AI Podcast:

  • використання AI для виявлення недіагностованих ракових захворювань;
  • декодування мовлення на основі аналізу активності мозку;
  • роботи, що оцінюють психічне здоров’я дітей;
  • стратегія розвитку ШІ у Франції з фінансуванням $1,8 млрд.

Complex ML Models with Data Scientist Fernando Lopez

Гість випуску — Фернандо Лопес, що ділиться своїми ідеями та інсайтами стосовно того, як використовувати ML у відео-платформі для найму працівників. Майкл і Бен також глибоко занурюються в різноманітні взаємопов’язані моделі машинного навчання та інші навколо-AI теми.

The Deep Learning Revolution in Space Science

Як Космічні сили США використовують deep learning за допомогою даних телескопів для спостереження за супутниками, потенційно смертельним космічним сміттям, а також для виявлення та запобігання катастрофічним зіткненням? Джастін Флетчер приєднується до цього епізоду шоу, щоб розповісти про все це, і більше.

Відео

Trustworthy Machine Learning

У цьому випуску MLOps Coffee Sessions з Кушем Варшні, провідним науковим співробітником і керівником IBM Research, розмова іде про Trustworthy Machine Learning, співорганізатором якого є Крішнарам Кентападі.

Надійне машинне навчання — це спосіб мислення, над яким потрібно працювати та імплементувати протягом усього життєвого циклу розробки машинного навчання, починаючи з фази визначення проблеми, яка має залучати різноманітні зацікавлені сторони.

The Road Ahead: Google’s Comprehensive Platform for Open Source Machine Learning

Google пропонує єдину повністю безкоштовну екосистему з відкритим вихідним кодом для штучного інтелекту та машинного навчання, яка охоплює все: від даних до визначення моделі та навчання, розгортання, операцій, прискореного апаратного забезпечення та інструментів для відповідального використання штучного інтелекту. У цій доповіді Лоуренс розповість вам про масштабні думки, які Google вкладає в майбутнє штучного інтелекту та машинного навчання для любителів, розробників і дослідників.

***

На сьогодні це все найважливіше, чим я хотів з вами поділитись.

Щоб не втрачати зв’язок та не пропустити мій наступний дайджест, клікайте «Підписатися на автора» одразу під текстом.

А якщо ви знаходитесь у пошуку «свого ідеального місця під сонцем» або втратили роботу через війну — долучайтеся до Xenoss, щоб працювати у колі однодумців над складними та довготривалими data-centric проєктами. Наші клієнти — провідні SaaS-компанії, всесвітньо відомі підприємства та стартапи, що активно розвиваються.

Серед наших переваг — цікавезні проєкти, гнучкий графік та повний ремоут. Тому, де б ви не перебували — сміливо надсилайте своє резюме!

Серед наших найгарячіших вакансій зараз:

Senior Backend SDE (Java) | North European advertising platform

Data Scientist for Toshiba product

Senior DevOps Engineer | Media network

Linux Embedded Developer

Запрошую вас стежити за останніми новинами Xenoss у наших соцмережах — LinkedIn та Facebook.

Дякую за увагу, коментуйте, поширюйте, і до нового випуску дайджесту!

Слава Україні!

👍ПодобаєтьсяСподобалось6
До обраногоВ обраному2
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
OpenAI’s API is not available in your country.

Кому цікаво про результати якості Whisper для української мови, то я зробив тести всіх 5 моделей.

Результати ось в цьому пості — t.me/...​eech_recognition_uk/20686

Якщо коротко, то зявлені метрики не збігаються і є свої підводні камені її використання.

Підписатись на коментарі