Big Data, Machine Learning, Data Science Digest #23: AI у війні України та росії, Artificial Counterfactual Estimation, етика ШІ

Підписуйтеся на Telegram-канал «DOU #tech», щоб не пропустити нові технічні статті.

Привіт!

Є думка, що за часів постійного стресу та емоційної напруги, ідея повернутись до чогось звичного та знайомого може бути першим кроком до стабілізації. Тож, як у старі добрі часи, я вирішив підготувати для вас нову добірку останніх новин та апдейтів зі світу Data Science. Сподіваюсь, буде корисно. Та маю надію, що ви та ваші близькі у безпеці та мирі.

У цьому випуску ви дізнаєтесь про:

  • основні висновки нещодавно опублікованого Індексу штучного інтелекту за 2022 рік;
  • ефективні стратегії зниження етичних ризиків у сфері штучного інтелекту;
  • використання Clearview AI у війні України та росії;
  • використання Airbnb Artificial Counterfactual Estimation;
  • MuZero як заступник AlphaGo і AlphaZero для стиснення відео;
  • дослідження впливу ШІ на освіту;
  • багато іншого.

Статті про використання ШІ для військових цілей

Ukraine uses facial recognition to identify dead Russian soldiers

Стаття від Reuters, у якій офіційно повідомляється, що Міністерство оборони України цього місяця почало використовувати технологію Clearview AI. Clearview AI — нью-йоркський постачальник розпізнавання облич, який знаходить у мережі зображення, що відповідають обличчям із завантажених фотографій. Наразі віце-прем’єр-міністр України Михайло Федоров повідомив, що Україна використовувала програмне забезпечення Clearview AI для пошуку акаунтів у соціальних мережах загиблих російських солдатів. Звідти влада надсилає повідомлення родичам, щоб вони домовилися забрати тіло.

Russia-Ukraine war: 10 AI Companies Facing The Consequences

Вторгнення Росії в Україну стало визначальним геополітичним моментом для деяких із найбільших світових компаній зі штучним інтелектом, оскільки їхні платформи перетворилися на велике поле битви для паралельної інформаційної війни, а їхні дані та послуги стали життєво важливими ланками в конфлікті. У статті наведено 10 найкращих компаній зі штучним інтелектом, показана їхня реакція та наслідки, з якими вони зіткнулися через російсько-українську війну.

Artificial Intelligence for Monitoring the War in Ukraine

Намагаючись зробити своє сучасне програмне забезпечення для аналізу штучного інтелекту (ШІ) доступним для всіх, хто шукає перевірену інформацію про війну в Україні, голландський спеціаліст зі штучного інтелекту OPT/NET BV розробляє нову програму: UKROPTOSS. Ця нова платформа заснована на успішному рішенні для аналізу даних TSAR-AI OPT/NET. Програмне забезпечення для аналізу OPT/NET допомагає організаціям аналізувати великі обсяги даних за частку часу, який зазвичай використовується комп’ютерними алгоритмами. Тепер вони використовують цю силу штучного інтелекту для аналізу, підтвердження та документування ситуації в Україні, яка постійно змінюється.

Invading Ukraine has upended Russia’s A.I. ambitions — and not even China may be able to help

Стаття описує, в якому стані перебував штучний інтелект у Росії раніше та як зараз війна впливає на російський AI.

The Russia-Ukraine conflict is a test case for AI in warfare

Оскільки російське вторгнення в Україну продовжується безперервно, воно стає тестом на роль технологій у сучасній війні. У статті наведені приклади, як обидві сторони використовують технології AI як у інтернеті та соцмережах, так і безпосередньо на полі бою.

Статті про AI/ML

10 Most Promising Artificial Intelligence Companies Of 2022

Сьогодні найперспективніші компанії, що займаються ШІ, пропонують унікальні та передові алгоритми штучного інтелекту з високою швидкістю та більш надійними рішеннями за конкурентоспроможними цінами. У статті — топ-10 найбільш перспективних компаній зі штучного інтелекту у 2022 році.

Auto-generated Summaries in Google Docs

Google розмістив узагальнення тексту на основі мовної моделі в Google Docs, що є ще однією ознакою економічної значущості великомасштабних генеративних моделей. Зокрема, Google нещодавно використав свою модель Pegasus для абстрактного підсумовування, щоб дати користувачам Google Doc можливість переглядати короткі резюме своїх документів.

Emerging Architectures for Modern Data Infrastructure

Цей детальний огляд сучасного стека даних спочатку був створений у 2020 році, а нещодавно оновлено, щоб показати, як все розвивається. Він охоплює найкращі у своєму класі архітектури як для аналітичних, так і для операційних систем, і викладає гіпотезу, чому відбуваються певні зміни.

Artificial Counterfactual Estimation (ACE): Machine Learning-Based Causal Inference at Airbnb

Коли Airbnb хотіли виміряти вплив змін, які не можна було перевірити за допомогою A/B тестів, вони розробили нову методологію, яка використовує ML та причинно-наслідковий висновок для штучного відтворення «контрфактичного» сценарію, створеного шляхом випадкового розподілу. Допис описує, як це працює.

12 Graphs That Explain the State of AI in 2022

Індекс штучного інтелекту за 2022 рік, який був нещодавно опублікований, вражає як ніколи: 190 сторінок охоплюють дослідження та розробки, технічні показники, етику, політику, освіту та економіку. У цій статті наведені 12 діаграм, які відображають поточний стан справ.

Andrew Ng predicts the next 10 years in AI

Andrew Ng є одним з найвідоміших діячів у галузі штучного інтелекту, засновником LandingAI та DeepLearning.AI, співголовою та співзасновником Coursera, а також професором Стенфордського університету. У цій статті обговорюється те, що він називає «підходом, орієнтованим на дані» до ШІ, і як він пов’язаний з його роботою з Landing AI та загальною картиною AI сьогодні.

Ethics and AI: 3 Conversations Companies Need to Have

За останні кілька років занепокоєння щодо етики штучного інтелекту набуло поширення. Гравці ринку розуміють, що щоб запровадити, масштабувати та підтримувати ефективні стратегії зниження етичних ризиків у сфері штучного інтелекту, компанії повинні почати з глибокого розуміння проблем, які вони намагаються вирішити. Детальніше про це можна прочитати у статті.

Google AI and UC Berkely Researchers Introduce A Deep Learning Approach Called ‘PRIME’

Команда Google AI та UC Berkeley представила PRIME — підхід до оптимізації, який керований даними, що генерує архітектури мікросхем AI, використовуючи зареєстровані дані без подальшого апаратного моделювання.

Наукові статті



Singularity: Planet-Scale, Preemptive and Elastic Scheduling of AI Workloads

Microsoft представила Singularity — програмний стек, який вона використовує для планування та навчання завдань AI у своєму глобальному парку центрів обробки даних. Singularity вказує на величезні масштаби, на яких виконуються сучасні робочі навантаження AI, а також говорить про амбіції технологічних компаній об’єднати всі свої центри обробки даних в єдиний величезний об’єм обчислень.

MuZero with Self-competition for Rate Control in VP9 Video Compression

DeepMind презентував MuZero — так званий заступник AlphaGo і AlphaZero для стиснення відео. Зокрема, DeepMind співпрацював з YouTube, щоб використовувати MuZero з метою визначення правильного параметру квантування для використання у відкритій версії VP9 кодека, libvpx. Під час тестів DeepMind виявив, що зміг використовувати отриманий в результаті MuZero Rate-Controller, щоб заощадити бітрейт від 3% до 5%.

IndicNLG Suite: Multilingual Datasets for Diverse NLG Tasks in Indic Languages

Дослідники з IIT Madras, Колумбійського університету, Національного інституту інформаційних та комунікаційних технологій Японії, Microsoft, Единбурзького університету та AI4Bharat створили IndicNLG — набір оціночних наборів даних для індійських мов. Програмне забезпечення з відкритим вихідним кодом підтримує наступні мови: ассамську, бенгальську, гуджараті, хінді, маратхі, одію, пенджабі, каннада, малаялам, тамільську, телугу та англійську, а також включає підтримку завдань NLG, пов’язаних зі створенням біографії, заголовків новин, підсумовуванням речень, генерацією запитань та перефразів.

Mapping global dynamics of benchmark creation and saturation in artificial intelligence

Дослідники з Медичного університету Відня, Оксфордського університету та Інституту майбутнього людства проаналізували 1688 контрольних показників для різних завдань ШІ, щоб спробувати зрозуміти, як розвивається ландшафт ШІ.

A New Era: Intelligent Tutoring Systems Will Transform Online Learning for Millions

Дослідники зі стартапу в галузі технологій Korbit, MILA та Університету Бата дослідили, наскільки ШІ впливає на освіту. Зокрема, вони перевірили різницю в освітніх результатах між студентами, які вивчали науку про дані за допомогою онлайн-курсу MOOC, і студентами, які вивчали той самий предмет за допомогою персоналізованого викладача, створеного Korbit, з використанням штучного інтелекту. Результати цього дослідження наведені у статті.

Відео



Machine Learning from the Viewpoint of Investors

Зірки подкасту Leigh-Marie Braswell з Founders Fund та Davis Treybig з Innovation Endeavors обговорюють їхні погляди на можливості MLOps та прикладного машинного навчання. Також вони розглядають поширені підводні камені та проблеми, які спостерігаються у стартапів зі сфери ML та стосуються нових проєктів, які вони вважають захоплюючими та цікавими у цьому просторі.

Using Data to Drive Private Equity — Lessons, Trends, and Opportunities for Data Scientists

Спікери обговорюють місце науки даних у світі приватного капіталу. У розмові вони роблять огляд ринку PE та тенденцій того, як наука про дані входить у приватне інвестування, розглядають, як програмно визначити набори композицій для різних класів активів, та багато іншого.

Vector Calculus and Partial Differential Equations: Big Picture Overview

У цьому відео розглядається векторне обчислення — це мова, яку ми використовуємо для виведення диференціальних рівнянь у частинних похідних (PDE) для кодування фізичних законів, таких як маса, імпульс і збереження енергії в рідинах. Матеріал є першою лекцією з серії, яка описує Div, Grad і Curl; теореми Гауса і Стокса; виведення рівнянь безперервності та Нав’є-Стокса та багато іншого.

All about AI Accelerators: GPU, TPU, Dataflow, Near-Memory, Optical, Neuromorphic & more

Відео-інтерв’ю з Аді Фуксом, автором серії під назвою «AI Accelerators» та експертом із сучасних технологій прискорення ШІ. Тут розглядається багато аспектів створення апаратного забезпечення для ШІ, зокрема, чому графічні процесори були настільки успішними, як виглядають найбільш перспективні підходи, як вони працюють та багато іншого.

#71 — ZAK JOST (Graph Neural Networks + Geometric DL) [UNPLUGGED]

Доволі цікаве та змістовне інтерв’ю про Graph Neural Networks та Geometric Deep Learning. Зірка інтерв’ю — Зак Джост, який працює вченим-дослідником у Amazon Web Services та є власником Youtube-каналу WelcomeAIOverlords.

Подкасти

Language Tech For All

У цій розмові Рейчел Тетман та ведучий обговорюють історію НЛП і розмовних AI/чат-ботів, а також занурюються у тему протидії між методами, заснованими на правилах та ML із глибоким навчанням.

DeepMind: The Podcast

До вашої уваги — високо оцінений, номінований на нагороду подкаст «DeepMind: The Podcast», ведуча якого намагається з’ясувати, як ШІ може принести користь нашому життю та суспільству, в якому ми живемо. Другий сезон складається із епізодів, у яких ведуча розкриває, як штучний інтелект прискорює науку в критичних областях, детально розглядає створення штучного загального інтелекту (AGI) та багато іншого.

Business Infrastructure in ML with Joe Reis — ML 065

У цьому епізоді Бен, Майкл та Джо Рейс обговорюють такі питання:

  • захоплюючі тенденції для Data Science вперше за останні 10+ років;
  • чому сьогодні вам потрібен маркетинговий підхід у сфері ML;
  • найважливіші речі, які ви повинні враховувати під час найму та масштабування, щоб зберегти вашу бізнес-інфраструктуру.

Full-Stack AI Systems Development with Murali Akula

Герой подкасту — Муралі Акула, старший директор з розробки програмного забезпечення в Qualcomm. У подкасті він досліджує складності, які є унікальними для машинного навчання на пристроях із обмеженими ресурсами. Також тут вивчаються деякі методи, які застосовуються для того, щоб складні моделі працювали на мобільних пристроях та аналізується процес перенесення цих моделей із досліджень у реальні додатки.

Creating a culture of innovation

Деніел і Кріс спілкуються з Лукасом Еггером, керівником відділу інновацій та стратегічних проєктів SAP Business Process Intelligence. Лукас описує, що потрібно, щоб привнести культуру інновацій в організацію, і як наповнювати розвиток продукту цією культурою інновацій.

GPT-3 for Natural Language Processing

У цьому епізоді експерт з природної мови Melanie Subbiah разом із ведучим обговорює свій нещодавній прорив в обробці природної мови, GPT-3, його сильні та слабкі сторони, а також майбутнє НЛП.

AI for Algorithms, Chemical Weapons, Zelenskyy Deepfake, Border Control

Один із останніх випусків подкасту Lastweekin.ai, який є підсумком та обговоренням головних новин зі світу ШІ минулого тижня. У цьому епізоді ви послухаєте про те, як:

  • ШІ запропонував 40 000 нових можливих видів хімічної зброї лише за шість годин;
  • розріджена модель All-MLP від Meta AI подвоює ефективність тренувань у порівнянні з трансформаторами;
  • ШІ використовується у якості дезінформації в російсько-українській війні;
  • створюються ігри та додатки повністю за допомогою природної мови, використовуючи моделі коду-давінчі OpenAI.

***

На сьогодні це все, дякую за увагу!

Щоб не втрачати зв’язок та не пропустити мій наступний дайджест, клікайте «Підписатися на автора» одразу під текстом.

Якщо часом ви знаходитесь у пошуку «свого ідеального місця під сонцем» або втратили роботу через війну — долучайтеся до Xenoss, щоб працювати у колі однодумців над складними та довготривалими data-centric проєктами. Наші клієнти — провідні SaaS-компанії, всесвітньо відомі підприємства та стартапи, що активно розвиваються. Не ведемо бізнес з ринком рф.

Серед наших найгарячіших вакансій:

Lead Java Engineer

Senior Java Engineer

DevOps Engineer (AWS, K8s)

Стежити за новинами Xenoss можна у соц-мережах — LinkedIn та Facebook.

Слава Україні!

Сподобалась стаття? Натискай «Подобається» внизу. Це допоможе автору виграти подарунок у програмі #ПишуНаDOU

👍ПодобаєтьсяСподобалось7
До обраногоВ обраному1
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі