Big Data, Machine Learning, Data Science Digest #26: модель GATO, декларативні системи ML, DALL·E Mini, Neural Voice Camouflage

Підписуйтеся на Telegram-канал «DOU #tech», щоб не пропустити нові технічні статті.

Привіт!

Це Вова Кириченко з Xenoss. Це Big Data, Machine Learning, Data Science дайджест — уже 26-й випуск новин про те, чим жив світ новітніх технологій останній місяць.

Тож сьогодні на вас чекає багато статей, наукових матеріалів, відео та подкастів, які розкажуть про таке:

  • DALL·E mini як альтернатива DALL·E з відкритим кодом;
  • штучний інтелект для виявлення зброї та потенційних стрільців;
  • як працює технологія Neural Voice Camouflage;
  • що за нова модель від DeepMind під назвою Gato;
  • впровадження декларативних систем машинного навчання;
  • пояснення, як працюють теореми Стокса та Гріна та багато іншого.

Якщо ви проґавили мій попередній дайджест — не проблема, його можна переглянути тут. Як завжди, фідбек та коментарі вітаються.

Матеріали про використання ШІ у війні України з росією

How Russia and Ukraine are finding new ways to use tech in the war

Вочевидь, розпізнавання облич і криптокмітливість — це лише деякі зі стратегій, які застосовують обидві сторони в конфлікті. У статті розкривається тема використання технологій під час війни.

The AI Defending Ukraine

Ще одна стаття розповідає, як Україна використовує для свого захисту технологію компанії Clearview AI з розпізнавання обличчя. Clearview доповнила свій набір даних із 10 мільярдів зображень ще 2 мільярдами з російської соціальної мережі «ВКонтакте», надавши своєму інструменту можливість ідентифікувати російських солдатів і знайти їхні адреси та сім’ї.

How AI can counteract disinformation in Russia-Ukraine war

Державні установи та фізичні особи використовують технологію штучного інтелекту для створення шкідливих ботів і діпфейків для поширення дезінформації про російсько-українську війну. У цьому відео директор новин TechTarget Шон Сатнер та авторка новин Естер Аджао обговорюють, чому і як поширюється дезінформація.

US Exploits Artificial Intelligence To Monitor Ukraine War

Стаття описує, як Сполучені Штати використовують можливості ШІ в Європі для аналізу даних, пов’язаних з конфліктом в Україні, відстежуючи переміщення та діяльність різних суб’єктів в Європі.

Статті про AI/ML



Papercup raises $20M for AI that automatically dubs videos

Компанія Papercup у пошуках рішення на основі штучного інтелекту, яке зможе допомогти автоматично дублювати контент різними мовами, зберігаючи голос і емоції оригінальних акторів. Останній збір коштів (сумою у $20 млн) дозволить їй досліджувати більш передові технології AI-дубляжу для більш виразних голосів і підтримки більшої кількості мов. Залишаються занепокоєння щодо етики відтворення голосів акторів як живих, так і померлих, а також щодо того, чи може контент, дубльований ШІ, зберігати тонкі емоції та значення, виражені мовою оригіналу.

DALL·E mini, an open source alternative to DALL·E

Після того як вийшов DALL·E 2, всі захотіли спробувати його. Але, оскільки він доступний не всім, для багатьох він так і залишився у списку бажань. У цій публікації пропонують спробувати DALL·E mini — альтернативу DALL·E з відкритим кодом.

E-SKIN THAT CAN FEEL PAIN COULD CREATE NEW GENERATION OF TOUCH-SENSITIVE ROBOTS

Команда інженерів з Університету Глазго розробила штучну шкіру з новим типом системи обробки на основі «синаптичних транзисторів», яка імітує нейронні шляхи мозку для навчання. Рука робота, яка використовує розумну шкіру, демонструє чудову здатність вчитися реагувати на зовнішні подразники.

How AI could be used to detect guns before school shootings

Авторка статті розмірковує, що було б, якби влада США могла використовувати штучний інтелект для виявлення зброї або виявлення потенційних стрільців.

How artificial intelligence brings new superpowers to supercomputers

На Міжнародній конференції з суперкомп’ютерів (ISC) 2022, яка проходила з 29 травня до 2 червня в Гамбурзі, виробники анонсували нові апаратні та програмні системи для найшвидших у світі суперкомп’ютерів.

AI Trained on 4Chan Becomes ‘Hate Speech Machine’

Дослідник штучного інтелекту та ютубер Яннік Кілчер навчив штучний інтелект, використовуючи 3,3 мільйона потоків із політично некоректної /pol/ дошки 4chan. Після того як він завантажив результати, стало зрозуміло, що ШІ був таким же підлим, як і пости, на яких його навчали, кидаючи расистські образи та спілкуючись із антисемітськими тредами.

Artificial General Intelligence Is Not as Imminent as You Might Think

У цій статті Гай Маркус стверджує, що колись машини можуть бути такими ж розумними, як і люди, і, можливо, навіть розумнішими, але гра ще далека від завершення. Попереду ще дуже багато роботи, щоб створити машини, які справді можуть розуміти навколишній світ і міркувати про нього. Те, що нам дійсно потрібно зараз, — це менше позицій та більше фундаментальних досліджень.

Why it’s time for ’data-centric artificial intelligence’

У цьому матеріалі Andrew Ng виступає за «штучний інтелект, орієнтований на дані», який він описує як «дисципліну систематичної розробки даних, необхідних для створення успішної системи ШІ». Він стверджує, що системам штучного інтелекту потрібен і код, і дані, і «весь цей прогрес у алгоритмах означає, що настав час витрачати більше часу на дані».

Is technology spying on you? New AI could prevent eavesdropping

Нова технологія під назвою Neural Voice Camouflage тепер пропонує захист: вона створює користувацькі звукові шуми у фоновому режимі під час розмови, заплутуючи штучний інтелект (AI), який транскрибує наші записані голоси.

WHAT I LEARNED FROM ATTENDING TECTON APPLY(MEETUP)

Apply(Meetup) нещодавно провів ряд доповідей на теми машинного навчання, науки про дані та інженерії. Для тих, хто не зміг бути — Джеймс Лі надає стислі резюме щодо різноманітних виступів, які варто переглянути.

AI reskilling: A solution to the worker crisis

За оцінками Всесвітнього економічного форуму, до 2025 року може з’явитися 97 мільйонів нових робочих місць, оскільки ШІ змінить характер роботи та вплине на новий розподіл праці між людьми, машинами та алгоритмами.


Наукові видання



Resolving the Human Subjects Status of Machine Learning’s Crowdworkers

У цій науковій статті автори зосереджуються на дослідженні обробки природної мови (NLP), щоб виявити відповідне призначення краудсорсингових досліджень та унікальні проблеми, які дослідження ML ставлять для нагляду за дослідженнями.

From data to functa: Your data point is a function and you can treat it like one

Звичайною практикою глибокого навчання є представлення вимірювання світу на дискретній сітці, наприклад, 2D сітка пікселів. Однак, основний сигнал, представлений цими вимірюваннями, часто є безперервним, як сцена, відображена на зображенні. Потужною безперервною альтернативою є представлення цих вимірювань за допомогою неявного нейронного представлення — нейронної функції, навченої виводити відповідне значення вимірювання для будь-якого вхідного просторового розташування. У цій статті автори виводять цю ідею на наступний рівень: що б знадобилося для глибокого навчання цих функцій замість цього, розглядаючи їх як дані? У цьому контексті вони називають дані functa і пропонують структуру для глибокого навчання на functa.

Evaluating Multimodal Interactive Agents

Створення агентів, які можуть природно взаємодіяти з людьми, є загальною метою досліджень штучного інтелекту. Однак оцінка цих взаємодій є складною: збір онлайн-взаємодій між людиною та агентом є повільним і дорогим, але більш швидкі проксі-метрики часто погано співвідносяться з інтерактивною оцінкою. У цій статті автори оцінюють переваги цих існуючих показників оцінювання та представляють новий підхід до оцінювання, який називається стандартизованим набором тестів (STS). STS використовує поведінкові сценарії, отримані з реальних даних взаємодії людей.

A Generalist Agent

У цьому звіті автори описують модель і дані, а також документують поточні можливості нової моделі від DeepMind під назвою Gato.

Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding

Автори представляють Imagen — модель дифузії тексту в зображення з безпрецедентним ступенем фотореалізму та глибоким рівнем розуміння мови. Imagen ґрунтується на потужності великих мовних моделей-трансформаторів у розумінні тексту та залежить від сили дифузійних моделей у створенні високоякісних зображень.

Vision GNN: An Image is Worth Graph of Nodes

Архітектура мережі відіграє ключову роль у системі комп’ютерного зору на основі глибокого навчання. Широко поширена згортка нейронна мережа і трансформатор розглядають зображення як структуру сітки або послідовності, яка не є гнучкою для захоплення неправильних і складних об’єктів. У цій статті автори пропонують презентувати зображення як структуру графа та представити нову архітектуру Vision GNN (ViG) для вилучення функції на рівні графіка для візуальних завдань.


Подкасти



Narrative AI

Гість подкасту — Хіларі Мейсон, співзасновниця Hidden Door — стартапу, який використовує штучний інтелект і машинне навчання, щоб допомогти створювати й розвивати рольові ігри (RPG). Hidden Door створює RPG на основі введених користувачів, а їх платформа — динамічно генерує текст, мистецтво, композицію на основі вибору користувачів і того, що вони вирішують, що має статися далі. У подкасті обговорювались Hidden Door та його технології, поточний стан науки про дані та майбутню програмну доповідь Хіларі на саміті Data+AI у Сан-Франциско.

Using AI and ML to Help Humans, Not Replace Them

Зірка подкасту — Майкл Гріффітс, директор з науки про дані ASAPP — компанії, яка використовує ШІ та машинне забезпечення для розширення й автоматизації людської роботи та покращення операційної ефективності. Майкл ділиться конкретними прикладами того, як це можна зробити для підвищення продуктивності людей у контакт-центрах. Також у випуску обговорюється майбутнє технологій, керованих штучним інтелектом.

The State of Natural Language Processing

Rongyao Huang, провідна дослідниця та експертка з обробки природних мов (НЛП) у CB Insights, у цьому епізоді ретельно оглядає еволюцію технік НЛП за останнє десятиліття, розповідає що буде далі в наступаючому залізному віці НЛП та демонструє свою модель, натхненну Баухаусом, для ефективної науки про дані.

Generalist models & Iceman’s voice

У цьому епізоді подкасту обговорюються деякі останні події у світі AI, включаючи нову модель від DeepMind під назвою Gato. Ця модель широкого профілю може грати у відеоігри, підписувати зображення, відповідати на повідомлення чату, керувати роботами та багато іншого.

Learning from data to create personalized experiences

У подкасті піднімається тема про те, як AI використовується для генерації індивідуальних рекомендацій та створенню досвіду з агрегацією та аналітикою даних, враховуючи конфіденційність осіб.

what the heck is data-oriented programming?

У цьому епізоді спікери порівнюють програмування, орієнтоване на дані, з об’єктно-орієнтованим та функціональним програмуванням. Також обговорюється, як ми можемо застосувати ці висновки в наших кодових базах.

Unlocking ML for Traditional Companies

Гість подкасту — Йоханнес Оттербах, віцепрезидент з досліджень машинного навчання в компанії Merantix Momentum — консалтинговій студії машинного навчання, яка допомагає своїм клієнтам створювати рішення зі штучним інтелектом. В подкасті обговорюються застосування машинного навчання для квантових обчислень, чому Merantix інвестує у створення хмарного технологічного стеку та унікальні проблеми розробки та розгортання моделей для різних клієнтів.


Відео



A developer’s guide to responsible AI review processes

Від стартапів до корпорацій у різних галузях, організації створюють принципи штучного інтелекту та процеси перевірки етики, щоб доповнити технічні підходи до відповідального розвитку машинного навчання та ШІ. У цьому відео представлені нові соціально-технічні методи, інструменти машинного навчання та уроки, отримані від команд Google з перевірки етики, які підтримують розробників у створенні продуктів.

Declarative Machine Learning Systems: Big Tech Level ML Without a Big Tech Team

Декларативні системи машинного навчання — це наступний крок в еволюції інфраструктури машинного навчання. Завдяки таким системам організації можуть поєднати гнучкість низькорівневих API з простотою AutoML. Компанії, які впроваджують такі системи, можуть збільшити швидкість розробки машинного навчання, досягнувши якості та масштабованості, яких досі могли досягти лише великі технологічні компанії, без потреби в команді з кількох тисяч людей. Спікери обговорюють Predibase — готове рішення для впровадження декларативних систем ML у масштабі підприємства.

This is the worst AI ever

Вище я наводив статтю про Янніка Кілчера, який навчив штучний інтелект, використовуючи 3,3 мільйона потоків із політично некоректної /pol/ дошки 4chan. Це ж відео демонструє результат цього експерименту.

Stokes’ Theorem and Green’s Theorem

Теорема Стокса є надзвичайно потужним результатом математичної фізики. Це дозволяє нам кількісно визначити, наскільки векторне поле циркулює або обертається, на основі інтеграла завитка. Відео є оглядом та поясненням як працюють теореми Стокса та Гріна.

Feature Platforms for Data-Centric AI

У цьому епізоді спікери широко досліджують поточну складність інфраструктури даних і те, як вона змінилася за останні п’ять років, а також дозрівання платформ потокових даних.

HOW DOES UBER AI’S WORK?

Як Uber може доставити їжу і завжди прибути вчасно або за декілька хвилин раніше? Відповідь я надавав в одному з останніх дайджестів, а саме — за допомогою алгоритму прогнозування часу їх прибуття під назвою DeepETA. Відео наглядно демонструє як працює DeepETA.

DALL-E 2 is... meh

Ми вже багато чули/бачили/слухали про DALL-E 2 — нову модель комп’ютерного зору з багатомільярдними параметрами для створення зображень за допомогою OpenAI. У цьому відео ми подивимося на дослідницьку роботу та побачимо, як DALL-E прогресує від оригінальної статті до цього нового DALL-E 2.


***



На сьогодні це все, дякую за увагу!

Щоб не втрачати зв’язок та не пропустити мій наступний дайджест, клікайте «Підписатися на автора» одразу під текстом.

Якщо часом ви знаходитесь у пошуку «свого ідеального місця під сонцем» або втратили роботу через війну — долучайтеся до Xenoss, щоб працювати у колі однодумців над складними та довготривалими data-centric проектами. Наші клієнти — провідні SaaS-компанії, всесвітньо відомі підприємства та стартапи, що активно розвиваються.

Працюємо worldwide та fully remote, тому де б ви не перебували — сміливо надсилайте своє резюме!

Серед наших найгарячіших вакансій:

Lead Java Engineer

Lead SDET

Senior Front End SDE (React.js)

Platform Solutions Engineer

Стежити за новинами Xenoss можна у соцмережах — LinkedIn та Facebook.

Слава Україні!

Сподобалась стаття? Натискай «Подобається» внизу. Це допоможе автору виграти подарунок у програмі #ПишуНаDOU

👍ПодобаєтьсяСподобалось2
До обраногоВ обраному1
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі