Big Data, Machine Learning, Data Science Digest: 2022-й в ретроспективі і тренди на 2023 рік
Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!
Привіт, спільното DOU! У цьому році ми з вами ще не бачились, тому вітаю з Новим
Структурою та наповненням цей випуск буде відрізнятися від звичного вам формату мого дайджесту, тому що на зламі років заведено підсумовувати рік попередній та спробувати заглянути в рік прийдешній.
І я теж вирішив дотримуватися такого підходу, тому в цьому дайджесті будуть 3 логічні блоки:
- Загальний огляд стану впровадження рішень AI/ML у корпоративному сегменті. Цю частину сформовано на основі аналітичних даних від експертів Deloitte, McKinsey, The Economist та інших.
- Блок з важливими новинами за 2022 рік, які мали суттєвий вплив на розвиток AI. Тут я також зробив традиційну добірку цікавих досліджень та випусків подкастів за рік.
- Розділ з трендами, де ми спробуємо спрогнозувати, чого ж очікувати у сфері AI в новому році. Сюди ж я додав список інфлюенсерів, за якими рекомендую слідкувати, щоб бути в курсі подій.
Принагідно скажу, що весь попередній рік я регулярно писав дайджест Big Data & AI & ML, тому, якщо вам цікаво, ви можете переглянути попередні випуски тут.
А тепер запрошую до прочитання дайджесту!)
Огляд
Бурхлива галузь штучного інтелекту сильно контрастує зі скрутною ситуацією у світі технологій — який уже на пів шляху до глибокого занепаду. Згідно з даними від дата-компанії PitchBook, 2022 року венчурні капіталісти вклали $67 млрд у фірми, що входять до галузі AI. Всесвітня частка угод з венчурним капіталом за участю таких стартапів зросла на 15% від середини
Між січнем і жовтнем налічувалося 28 нових юнікорнів (приватних стартапів, оцінених від $1 млрд) у сфері штучного інтелекту. Подейкують, що Microsoft веде перемовини, маючи на меті збільшити власну частку в компанії OpenAI, — вона розробляє foundation models, а також випустила ChatGPT. Крім того, існує інформація про плани Alphabet, материнської компанії Google, інвестувати $200 млн у Cohere, що конкурує з OpenAI.
Відповідно до звіту Нейтана Бенейча та Ієна Гоґарта, вихідці з OpenAI та DeepMind — однієї з AI-лабораторій компанії Alphabet — запустили щонайменше 22 AI-стартапи.
Ступінь запровадження штучного інтелекту зріс більш ніж удвічі порівняно з
Компанії, що вбачають у штучному інтелекті найвищу рентабельність, продовжують випереджати своїх суперників. Як свідчать результати, лідери більше інвестують у штучний інтелект, долучаються до щодалі прогресивніших практик для його швидшого розвитку і займають кращі позиції на конкурентному ринку AI-талантів.
Ринок штучного інтелекту стрімко розростається, і провідні гравці в різних індустріях послідовно визнають важливість AI для їхнього майбутнього. 94% бізнес-лідерів стверджують, що штучний інтелект відіграватиме критичну роль для їхньої успішності в наступні 5 років. Тим часом складні завдання таки даються взнаки.
В середньому організації взяли на озброєння удвічі більшу кількість можливостей, що їх надає штучний інтелект, наприклад генерування природної мови чи компʼютерне бачення. Минулого року цей показник досяг позначки 3.8, а у
Проте список найтоповіших варіантів використання AI відносно стабільний: оптимізація сервісних операцій посідає перше місце протягом останніх 4 років.
У
Компанії жваво прямують до впровадження AI. Тож розгортання штучного інтелекту минулого року істотно підвищилося: 79% опитаних повністю розгорнули 3 або навіть більше типів штучного інтелекту, а у
Разом з наростальним запровадженням штучного інтелекту прослідковується посилення інвестицій. Наприклад, 5 років тому 40% респондентів з організацій, що використовують AI, повідомляли про більш як 5% від цифрового бюджету, виділених на штучний інтелект, — тепер же цю саму цифру озвучують понад 50% опитаних.
Щодо залучення нових талантів, то це становить виклик для бізнесу, однак для високоефективних компаній він менш серйозний. Усі організації заявляють, що наймати AI-кадри, особливо data scientists, досі важко. Високоефективні AI-компанії інформують про трохи менший ступінь складності і — порівняно з іншими організаціями — про частіший найм людей на певні посади, як-от інженер машинного навчання.
Найбільш найманими працівниками у сфері AI протягом останнього року є розробники програмного забезпечення, перевершуючи в цьому плані дата-інженерів та AI data scientists. Ці дані чітко вказують на те, що багато організацій здебільшого перевели увагу з експериментів на активне впровадження штучного інтелекту в корпоративні застосунки.
Сповільнити цей процес у деяких компаніях може нестача технічних кадрів, яка не подає жодної ознаки послаблення. Більшість респондентів упродовж останнього року простежили труднощі в наймі людей для кожної AI-позиції. До того ж більшість зазначає, що це завдання виявилося не легшим або ж навіть важчим, ніж у попередні роки.
Перепідготовка та підвищення кваліфікації — поширені альтернативи залученню талантів. Найбільшу популярність має перепідготовка раніше найнятих фахівців: її застосовує приблизно половина опитаних.
Також широко розповсюджений набір людей з першокласних університетів та непершокласних технологічних компаній, серед яких, наприклад, регіональні лідери. Однак стратегії саме високоефективних бізнес-гравців наштовхують на думку, що найкраще послуговуватися якомога більшою кількістю рекрутингових каналів звʼязку.
Передовики не обмежують себе в розмаїтті застосовуваних джерел пошуку. Попри більшу схильність до залучення талантів з топових технічних університетів та компаній, вони аж ніяк не цураються інших університетів, навчальних академій, програм розвитку різноманітності чи професійних організацій.
Коротко підсумовуючи сказане, можемо дійти висновку, що AI в корпоративному сегменті з речі «nice to have» упевнено переміщається в категорію «must-have», і його вплив у наступні 5 років буде лише посилюватись. Цьому сприятимуть і процеси, які зараз відбуваються в технологічній галузі США, адже кризи — це не тільки про оптимізацію, але й про можливості та нові підходи.
Новини
Why everyoneʼs obsessed with ChatGPT, a mind-blowing AI chatbot
Бот під назвою ChatGPT від компанії OpenAI — одна з найсенсаційніших новинок минулого року. Щонайперше, він дає розмовні, хоч і дещо не природні відповіді на запитання. Крім того, йому властиво запамʼятовувати хід діалогу, а отже, використовувати попередні питання та відповіді для подальшої комунікації. Відповіді чат-бота базуються на великих обсягах інформації з інтернету.
State of AI Report — щорічний звіт від Нейтана Бенейча та Ієна Гоґарта, присвячений розвитку штучного інтелекту. Мова йде про релевантні дослідження, комерційне використання AI, його регулювання та геополітику, економічні наслідки, повʼязані ризики, а також передбачення. У звіті розкрито актуальні, подекуди гострі теми, наприклад кількісний розрив між галузевими дослідженнями США та Китаю.
AI platforms like ChatGPT are easy to use but also potentially dangerous
Незважаючи на прогресивність ChatGPT, науковець Ґері Маркус вбачає в ньому небезпеку. Річ у тім, що бот досить непогано імітує живе спілкування і ним можна скористатись для масового поширення фейків. Скажімо, він здатен генерувати відповіді, які здаватимуться авторитетними і правдоподібними, та насправді такими не будуть. При цьому не існує механізму для перевірки їхньої правдивості.
Using AI to decode speech from brain activity
Щороку понад 69 млн людей по всій планеті потерпають від травм мозку, які забирають у них можливість спілкуватися за допомогою мови, тексту чи жестів. Вирішити цю проблему заповзялися Жан Ремі Кінґ, Александр Дефоссе та їхні колеги. Вони розробили модель штучного інтелекту, яка дозволяє розкодовувати меседжі, що криються в неінвазивних записах активності головного мозку.
Amazon launches CodeWhisperer, a GitHub Copilot-like AI pair programming tool
Також ми не оминули увагою Code Whisperer — ще один AI-інструмент для парного програмування, цього разу від Amazon. Завдяки новій розробці можна автозавершувати цілі функції на основі одного лише коментаря або кількох натискань клавіш. Система підтримує C#, Java, JavaScript, Python і TypeScript та інтегрується, зокрема, з JetBrains, Visual Studio Code, AWS Cloud9 i AWS Lambda.
DALL·E mini — generate images from any text prompt
Модель DALL·E від OpenAI надихнула Бориса Дайму та Педро Куенку створити її open-source версію — DALL·E mini, яку пізніше заребрендили як Craiyon. Генерація зображень із будь-якої текстової підказки можлива завдяки навчанню, що полягає в перегляді картинок з інтернету і підписів, повʼязаних з ними. Craiyon здатний не лише репродукувати раніше побачені зображення, але й формувати цілком нові.
Дослідження
Fine-mixing: Mitigating backdoors in fine-tuned language models
Відомо, що глибинні нейромережі вразливі до бекдор-атак, які відбуваються завдяки зараженим даним під час тонкого налаштування великомасштабних попередньо навчених мовних моделей. Щоб помʼякшити цю проблему, дослідники пропонують міксувати попередньо навчені ваги мовних моделей з тими, що піддалися атаці, а після цього — тонко налаштовувати вже зміксовані ваги.
На сьогодні large-scale language-image (LLI) моделям вдається досягати більш ніж задовільних результатів у генерації зображень та розумінні семантики. Усе, що потрібно, — це текстова підказка, і приваблива візуалізація вам гарантована. Та чи можливо відредагувати вже згенероване зображення, замінивши один елемент на інший? Відповідь на це запитання ви знайдете в цьому дослідженні.
Один з аргументів проти традиційної етики штучного інтелекту — її здатність сповільнювати інновації. Натомість Джеймс Брюссо демонструє спробу переналаштувати етику на роль прискорювача інноваційних процесів. Порівнюючи взаємопротилежні особливості двох систем — Diffusion від Stability AI і DALL·E від OpenAI — Джеймс виділяє 5 концептів, що характеризують прискорювальну етику.
Рушієм нещодавнього прогресу в обробці природної мови є вдосконалення архітектури та попереднього навчання моделей. Новітній тип архітектури — трансформер — посприяв створенню більш високопродуктивних моделей, i постійно оновлюваний open-source проєкт з промовистою назвою Transformers дає змогу користуватися черговими здобутками у сфері машинного навчання.
AI-generated characters: Putting deepfakes to good use
Зображення людей, генеровані штучним інтелектом, зазвичай асоціюються з дезінформацією та медіаманіпуляціями, а тому відомі як діпфейки. Однак вчені зі Стенфорду, Кембриджу, MIT та інших університетів доводять, що такі зображення дедалі більше слугують хорошим цілям, наприклад мистецтву, освіті, терапії, гуманітарним зусиллям, телекомунікаціям та недоторканності приватного життя.
Novel transformer model achieves state-of-the-art benchmarks in 3D medical image analysis
Дослідники з Nvidia презентують Swin UNETR — перший transformer-based pretraining фреймворк для самоконтрольованого аналізу медичних 3D-зображень. У рамках цього підходу використовується PyTorch-фреймворк MONAI, спрямований на deep learning у галузі медичної візуалізації. Саме завдяки такому принципу роботи Swin UNETR породив нові стандарти в сегментації медичних зображень.
200 languages within a single AI model: A breakthrough in high-quality machine translation
Інновація від Meta AI: модель NLLB-200 (No Language Left Behind) здатна перекладати між двома сотнями різних мов, а якість результатів у кожній з них підтверджена шляхом широкого оцінювання — за допомогою нового датасету FLORES-200. Задіяні методи моделювання і знання, отримані від цього проєкту, вже сприяють удосконаленню перекладів у Facebook, Instagram та Wikipedia.
A year in the making, BigScience’s AI language model is finally available
Відбувся реліз мовної open-source моделі Bloom, над якою більш ніж рік працювали понад тисячу вчених-волонтерів — за підтримки інженерів з великих організацій і зі стартапів, а також етиків, філософів та правознавців. Компанія Hugging Face випустила безкоштовний вебзастосунок, і тепер будь-хто може спробувати винахід, що претендує на конкуренцію зі знаменитими GPT-3 i DeepMind.
Подкасти
IV квартал
Inside the generative AI revolution
Поточну ситуацію у сфері генеративного штучного інтелекту опише Мартін Мусьол — співзасновник та викладач Generative AI і data scientist в IBM. Він розкриє проблеми, що стосуються конфіденційності та інтелектуальної власності, наведе визначні приклади використання генеративного штучного інтелекту і поділиться своїм баченням щодо подальшого розвитку цієї галузі.
Tesla bot, text-to-video, speech-to-text, AI voices Darth Vader
Ілон Маск демонструє прототип робота-гуманоїда, OpenAI запускає мультилінгвальну систему розпізнавання мовлення, Climate Alpha прогнозує вплив кліматичних змін на міста, Meta анонсує генератор відео на основі текстових описів, а модель штучного інтелекту від Nvidia створює 3D-обʼєкти для віртуальних світів — про ці та інші новини ви дізнаєтеся в цьому подкасті.
AGI, neuron simulators, and more with Charles Simon
Гість цього випуску — Чарлз Саймон, підприємець та розробник з досвідом створення унікальних систем штучного інтелекту для неврології. Зокрема, у розмові йтиметься про класичні алгоритми в порівнянні з ручним дизайном, а також Саймон розповість про концепції штучного інтелекту і машинного навчання: artificial general intelligence, машинне навчання на основі графів, deep learning.
III квартал
Undiagnosable cancers, robot sales, decoding brain activity, AI music
Як машинне навчання може допомогти в діагностиці раку? Чим корисний штучний інтелект у дослідженні постійно затінених регіонів Місяця? Наскільки реально розшифрувати меседж на основі активності людського мозку? Що зʼясували кембридзькі вчені стосовно здатності роботів оцінювати психічне здоровʼя дітей? І це лише частина запитань, відповіді на які ви почуєте.
Innovation and AI strategies with award-winning data science leader Vidhi Chugh
Відхі Чуґ — стратег та інноваційний лідер у галузі AI — висловить свою думку щодо відповідального штучного інтелекту, інноваційних стратегій і model intelligence. До того ж Відхі — data scientist, саме тому вона також розкаже про якість даних, data-driven компанії, показники якості, інструменти для автогенерованих бізнес-інсайтів та славнозвісні, але невдалі проєкти.
GPT-3 and our AI-powered future
Цього разу до обговорення штучного інтелекту запросили Сандру Кублік та Шубхама Сабу — авторів книги GPT-3: NLP with LLM. Тож є нагода послухати про особливості GPT-3, нововідкриті варіанти використання штучного інтелекту, технології в основі цієї моделі, ризики та обмеження. Також ви довідаєтеся, чи масштабування моделей приведе нас до artificial general intelligence.
II квартал
Nonsense sentience, condemning GPT-4chan, deepfake bans, CVPR plagiarism
Meta i Microsoft мають намір застосувати штучний інтелект для кращого функціонування своїх дата-центрів, Nvidia спільно з Університетом Вашингтону представляє новий набір методів симуляції фізичних явищ та інструментів для навчання роботів, DALL·E 2 створює першу в історії журнальну обкладинку, згенеровану штучним інтелектом, — і ще не одна важлива звістка.
Using AI and ML to help humans, not replace them
Майкл Ґріффітс — Director of Data Science у компанії ASAPP і знається на використанні штучного інтелекту й машинного навчання для автоматизації людської праці. У цьому випуску він поділиться конкретними прикладами, порівняє автоматизовані системи з тими, що контролюються людьми, а також зіставить традиційну розробку зі створенням програмних засобів для машинного навчання.
OpenAI’s DALL·E 2, Google’s PaLM, AI Intel in Ukraine, hugging robots
У Стенфорді розробили новий алгоритм на основі машинного навчання: він здатен помічати аутизм, аналізуючи знімки мозку. ChestLink — засіб для аналізу рентгенівського проміння за допомогою штучного інтелекту — отримує сертифікацію від Євросоюзу. Окрім того, вчені з Університету Джонса Гопкінса повідомляють, що штучний інтелект може передбачати зупинку серця на 10 років наперед.
I квартал
AI-developed drug, AI beats Moore’s law, Russia’s AI army, Baidu’s robotaxis
Розпочинається випробування перших у світі ліків, повністю розроблених штучним інтелектом. Walmart запускає віртуальний інструмент, який дозволятиме покупцям обирати персонажа свого розміру, комплекції та відтінку шкіри — і таким чином бачити, підходить одяг чи ні. З іншого ж боку Земної кулі — плани Baidu щодо розгортання свого сервісу безпілотного таксі в 100 містах до 2030 року.
Business infrastructure in ML with Joe Reis
Data scientist та розробник Джо Ріс захоплюється процесами, як-от удосконалення комунікації в людей і формування міцної бізнес-інфраструктури. Відповідно, розмова стосуватиметься найму та масштабування бізнесу задля інфраструктурної цілісності, теперішньої значущості маркетингово орієнтованого підходу в
Delivering smarter cities & better public policy w/ data
Про можливості, які відкриває перед нами data science, розповість Каве Вессалі — засновник багатьох стартапів у Кремнієвій долині, колишній виконавчий директор у Salesforce, Siebel та SAP і поточний партнер PwC Middle East. Серед обговорених тем — звʼязок сфери data з державною політикою, смартміста, проєкти цифрової трансформації в державному секторі на Середньому Сході та інші деталі.
Тренди
Робити прогнози за звичних умов — це річ доволі невдячна та ризикована, а коли невизначеність цілих економік стає нормою, тим паче. Однак намагання «заглянути за горизонт» є незмінною рисою людської натури, до того ж у такій цікавій і динамічній сфері. Тому я зробив добірку прогнозів з надійних джерел, завдяки яким ви зможете самостійно синтезувати своє бачення AI/ML на цей рік.
AI trends for 2023 ‒ generative AI continues to make content creation easier
На думку Анни Юань і Джо Адамчика, покращення в моделюванні зображень та обробці природної мови відкривають нові перспективи для контент-мейкерів у галузях бізнесу та мистецтва. Маркетологи використовують спеціалізовані моделі штучного інтелекту для створення персоналізованого клієнтоорієнтованого контенту, а креативні фахівці — для літературних творів та візуальних робіт.
AI in the automotive industry: A 2023 outlook
Вплив штучного інтелекту на автомобільну промисловість лише посилюватиметься, а його сукупний середньорічний темп зростання складе 40%, сягнувши $15,9 млрд до 2027 року. Задовольняючи дедалі потужніший запит на підключені авто й смарттехнології, цей індустріальний напрямок щораз більше покладатиметься на AI та автоматизацію в дизайні, виробництві й експлуатації.
Понад 3/4 компаній, які послуговуються обробкою природної мови, планують нарощувати обсяги інвестицій у такі проєкти впродовж наступних
Artificial intelligence is permeating business at last
Технологи десятиліттями стверджували, що штучний інтелект здійснить переворот у бізнесі й надасть величезні переваги компаніям та їхнім клієнтам. Зрештою, цей процес уже розпочався і не припиняє набирати обертів. Наприклад, минулого року 50% фірм по цілому світу спробували застосувати штучний інтелект у той чи інший спосіб, а в недалекому
AWS names 6 key trends driving machine learning innovation and adoption
Братін Саха — віцепрезидент і генеральний менеджер AI/ML в Amazon — виділяє 6 трендів, які матимуть сприятливий вплив на інновації та впровадження штучного інтелекту й машинного навчання. У цьому переліку — щодалі більша витонченість моделей, зростання даних, цілеорієнтовані
Top 5 edge AI trends to watch in 2023
Свій список трендів склала і Аманда Сондерс — одна з фахівців, відповідальних за AI product marketing у компанії Nvidia. На її погляд, цього року ми спостерігатимемо фокус на високорентабельних варіантах використання штучного інтелекту, посилення людино-машинної взаємодії, нові застосування AI задля функціональної безпеки, зосередженість на кібербезпеці та зміцнення ролі цифрових двійників.
AI regulation in the U.S.: What’s coming, and what companies need to do in 2023
У цій статті розповідається про норми та правила щодо штучного інтелекту, яких варто очікувати цьогоріч у США. Стосуватимуться вони широкого спектру явищ: права споживачів з приводу AI-powered рішень, прозорість AI, управління штучним інтелектом за допомогою оцінки впливу тощо. Також розписано, яких заходів компаніям варто вжити, щоб бути готовими до юридичного регулювання AI.
11 essential explainers to keep you in the know in 2023
Nvidia пропонує добірку власних матеріалів, які допоможуть початківцям у світі AI залишатися в курсі подій 2023 року. Якщо ви, скажімо, бажаєте дізнатися, що таке попередньо навчені моделі штучного інтелекту, зрозуміти особливості графових нейромереж, розібратися в знешумленні й трасуванні шляху або ж відкрити для себе поняття зелених інформаційних технологій — це саме те, що треба.
Інфлюенсери
Надійний спосіб тримати руку на пульсі новин з індустрії AI/ML та відслідковувати тенденції — це стежити за людьми, які перебувають на фронтирі змін, а часто і самі їх здійснюють. Тому в розділі з трендами я вирішив перелічити інфлюенсерів, яких варто фоловити. Серед них ви знайдете й інвесторів, і засновників компаній, і науковців, і спікерів. Сам підписався, і вам рекомендую.
Доктор Кірк Борн — фахівець у сфері data science, головний науковий співробітник компанії DataPrime і засновник Data Leadership Group. Раніше Кірк провів цілих 12 років своєї професійної карʼєри в стінах Університету Джорджа Мейсона.
Рональд є засновником та головним виконавчим директором освітнього маркетплейсу Intelligent World, а також членом консультативного комітету в Simplilearn. Також він часто виступає в ролі спікера в тематиці AI, IoT, big data і т. д.
Ендрю Нґ — всесвітньо визнаний лідер у царині штучного інтелекту, засновник Landing AI і DeepLearning.ai, співзасновник Coursera та адʼюнкт-професор Стенфорду, який фігурував серед найкращих 100 інфлюенсерів планети від журналу Time.
Французький інформатик Янн ле Кун спеціалізується головним чином на машинному навчанні, компʼютерному баченні, мобільній робототехніці та обчислювальній нейронауці, а ще працює в Meta і Нью-Йоркському університеті.
Бернард Марр — автор багатьох бестселерів, спікер, футурист і стратегічний консультант із бізнесу й технологій, який допомагає організаціям, проливаючи світло на вплив штучного інтелекту, блокчейну та інших новітніх відкриттів.
Ще один лідер у світі штучного інтелекту: Еллі К. Міллер. Донедавна Еллі обіймала посаду Global Head of Machine Learning Business Development в Amazon, де вона консультувала провідних дослідників та фаундерів у галузі машинного навчання.
Дата-науковець Стів Нурі бере участь у розробці міжнародних стандартів для покращення етики штучного інтелекту. Крім того, він є фундатором AI4Diversity — неприбуткової освітньої ініціативи, яку реалізують тисячі волонтерів з усього світу.
Маючи досвід директорства в одній з команд Tesla Autopilot і наукового співробітництва в OpenAI, Андрей Карпати володіє експертизою в штучному інтелекті, Deep Learning, компʼютерному баченні, а зараз є незалежним дослідником.
***
Товариство, дякую за прочитання дайджесту.
До слова, нагадаю: у перервах між створенням дайджесту для вас — ми з командою реалізовуємо різноманітні цікаві й складні речі в Xenoss.
Робота з високонавантаженими системами та вирішення проблем, пов’язаних з інтенсивною обробкою даних, вимагає унікального технічного світогляду, який трапляється в одного серед ста інженерів.
Розуміючи це, ми адаптували remote-first філософію керування членами команд, які перебувають на трьох континентах. Як результат, у нас є колеги з 14 країн світу, здатні ефективно справлятися з дедалі більшою складністю домену AdTech/MarTech.
Якщо ви в пошуках нових кар’єрних можливостей, раджу переглянути наші актуальні вакансії.
Стежте за останніми новинами Xenoss у наших соцмережах: LinkedIn та Facebook. А щоб точно не пропустити новий випуск мого дайджесту, пропоную натиснути «Підписатися на автора» відразу під текстом.
Ваші лайки, поширення і коментарі до дайджесту додають наснаги творити далі, тому не стримуйтесь) До нових випусків!
Слава Україні!
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів