Big Data, Machine Learning, Data Science Digest #35: Firefly від Adobe, інтерв’ю з CEO Nvidia, реліз PyTorch 2.0, бенчмарк MuAViC від Meta, регулювання ШІ в ЄС

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Спільното, вітання! З вами на зв’язку Вова Кириченко і черговий випуск нашого дайджесту новин, досліджень та останніх трендів зі світів Data Science, Machine Learning та Artificial Intelligence.

Одна з найзнаковіших подій цього випуску трапилась тоді, коли я майже завершив роботу над ним, або як кажуть журналісти — «поки верстався номер» :) Зараз я маю на увазі відкритий лист Возняка, Маска, та ще понад тисячі осіб із закликом тимчасово призупинити розробки в сфері ШІ.

Що ж, слідкуючи за цією індустрією вже доволі тривалий час, зазначу, що дискусії щодо етики та регулювання в галузі тривали уже давно, тому думаю, що цей тренд посилюватиметься і надалі, зводячи багато речей світу ШІ у юридичну площину.

Гаразд, досить з припущеннями і міркуваннями, пропоную перейти до самого дайджесту — ось деякі цікаві матеріали, котрі я підібрав для вас сьогодні:

  • Презентовано креативний тул Firefly від Adobe;
  • PyTorch 2.0 став доступним широкому загалу;
  • Велике інтерв’ю з CEO Nvidia;
  • Новий науковий здобуток Meta — бенчмарк MuAViC;
  • Відповідальний штучний інтелект та регулювання ШІ в ЄС;
  • Як штучний інтелект може вкрасти наш голос;
  • добірка цікавих та інформативних відео та подкастів.

І поки ви не занурились в читання, нагадаю — шерити і коментувати дайджест не тільки можна, але і треба ;) Якщо ви проґавили попередній випуск — не проблема, його можна переглянути ось тут. Гайда читати!

Статті про AI/ML

Elon Musk, Steve Wozniak and other tech leaders warn «out-of-control» AI poses «profound risks»

Зважаючи на небезпеку, яку потенційно може становити штучний інтелект, — Ілон Маск, співзасновник Apple Стів Возняк і ще понад 1000 осіб, в тому числі науковці, професори й технічні директори, підписали відкритого листа із закликом до шестимісячної паузи в розробці ШІ-систем і посилення державного контролю над ними. У листі міститься заклик до лабораторій штучного інтелекту зупинити навчання ШІ-систем, потужніших за GPT-4.

Adobe launches Firefly generative AI, which lets users type to edit images

Adobe виходить на ринок генеративного штучного інтелекту і запускає креативний інструмент Firefly, який буде інтегрований в існуючий пакет продуктів. Новий інструмент генеруватиме варіації зображень, а також потенційно трансформуватиме фотографії та відео на основі підказок користувача. Firefly вийде у вигляді публічної бета-версії, а першою доступною моделлю стануть інструменти для роботи з текстовими ефектами.

AWS and Nvidia collaborate on next-generation infrastructure for training large machine learning models and building generative AI applications

Понад 12 років AWS і Nvidia спільно працюють над рішеннями на базі графічних процесорів для ШІ, машинного навчання, графіки, ігор та високопродуктивних обчислень. Тепер компанії оголосили про багатостороннє співробітництво, мета якого — найбільш масштабована у світі ШІ-інфраструктура, оптимізована для навчання дедалі складніших великих мовних моделей і розробки додатків на основі генеративного штучного інтелекту.

PyTorch 2.0 brings new fire to open-source machine learning

Після кількамісячної бета-стадії — PyTorch 2.0 зрештою став загальнодоступним. Нагадаємо, що open-source проєкт PyTorch — це одна з найпопулярніших технологій для машинного навчання, і її першу версію розробила компанія Facebook у 2018-му. Минулого ж року була заснована PyTorch Foundation задля відкритішого управління і заохочення співпраці та внесків. Як результат, до розвитку PyTorch 2.0 доклалися 428 контрибʼюторів.

OpenAI’s GPT-4 shows the competitive advantage of AI safety

OpenAI випустив наступника ChatGPT — модель GPT-4, яка виділяється покращеною продуктивністю в міркуваннях, запамʼятовуванні, а особливо в безпеці. Згідно з технічним звітом OpenAI, під час розробки GPT-4 компанія витратила 6 місяців на дослідження безпеки, оцінку ризиків та ітерації. Внаслідок цього GPT-4 на 82% рідше відповідає на запити, повʼязані із забороненим контентом, і на 40% частіше дає фактичні відповіді.

Microsoft and Google unveil AI tools for businesses

Microsoft інтегрує у своє програмне забезпечення ШІ-асистентів Copilot, які спираються на дані бізнес-клієнтів, а завдяки новій функції Business Chat можна дізнаватися апдейти клієнтів на основі просканованих даних з усіх інструментів. Google своєю чергою вбудує ШІ в Gmail і Docs, щоб можна було створювати тексти з простих письмових підказок. Також компанія дебютувала з Generative AI App Builder — інструментом для розробки чат-ботів.

NVIDIA brings generative AI to world’s enterprises with cloud services for creating large language and visual models

Nvidia анонсує набір хмарних сервісів, які дозволять корпоративним клієнтам будувати, поліпшувати та експлуатувати кастомні великі мовні моделі та моделі генеративного ШІ, що навчатимуться на власних даних для виконання унікальних завдань у конкретній галузі. Getty Images, Morningstar, Quantiphi та Shutterstock є одними з компаній, які в такий спосіб створюватимуть і використовуватимуть моделі штучного інтелекту, застосунки й сервіси.

LinkedIn expands its generative AI assistant to recruitment ads and writing profiles

LinkedIn впроваджує письмові пропозиції на основі штучного інтелекту, які спочатку пропонуватимуться юзерам для покращення їхніх профілів, а також рекрутерам, що працюють над описами вакантних місць. Для персоналізованих профілів — LinkedIn використовує GPT-4, а для вакансій — GPT-3.5. Щобільше, компанія обʼєднала 100 курсів на тему штучного інтелекту в LinkedIn Learning і додала ще 20 курсів з генеративного ШІ.

AI-imager Midjourney v5 stuns with photorealistic images — and 5-fingered hands

Midjourney сповістила про випуск 5 версії свого сервісу із синтезу фотореалістичних зображень на базі штучного інтелекту. Поки що ним можна скористатися у вигляді альфа-тесту — зробити це можуть клієнти, які підписалися на сервіс Midjourney, що доступний через Discord. «Зараз MJ v5 — це мов надягнути врешті-решт окуляри після того, як ви надто довго ігнорували поганий зір», — розповідає графічна дизайнерка Джулі Віланд.

Microsoft’s Bing chatbot now lets you create images via OpenAI’s DALL-E

Пошукову систему Bing доповнили ШІ-інструментом для створення зображень. Bing Image Creator функціонуватиме на основі вдосконаленої версії моделі DALL-E від OpenAI і дасть юзерам можливість генерувати зображення з письмових запитів. Юсуф Мехді, керівник зі споживчого маркетингу в Microsoft, уточнив: «Для тих, хто користується попередньою версією Bing, Image Creator буде повністю інтегрований у чат, спочатку в режимі Creative».

Наукові видання

Universal Speech Model (USM): State-of-the-art speech AI for 100+ languages

Дослідники з Google презентують Universal Speech Model (USM) — сімейство новітніх мовних моделей з 2B-параметрами, навчених на 12 мільйонах годин мовлення та 28 мільярдах речень тексту більш ніж 300 мовами. USM призначена для використання в YouTube, наприклад для субтитрів, і вміє автоматично розпізнавати поширені мови на зразок англійської й мови з обмеженими ресурсами: амхарську, азербайджанську тощо.

MuAViC: The first audio-video speech translation benchmark

Новий науковий здобуток Meta AI: MuAViC (Multilingual Audio-Visual Corpus) — перший бенчмарк, який дає змогу використовувати аудіовізуальне навчання для високоточного перекладу мовлення. Дослідники застосували MuAViC, навчаючи самоконтрольований фреймворк, що також є напрацюванням Meta AI, — AV-HuBERT, створений для перекладу мовлення в обставинах, у яких присутній фоновий шум, де він перевершує інші моделі.

Navigating the grey area: Expressions of overconfidence and uncertainty in language models

Науковці зі Стенфорду дослідили здатність мовних моделей інтерпретувати й генерувати вирази невизначеності. В різноманітних ситуаціях — від прогнозу погоди до меддіагностики — інформація часто неоднозначна, а всі прояви невизначеності створюють нюанси, які допомагають у рішеннях. Вчені зʼясували, що навчаючи моделі саме виразів невизначеності, замість визначеності, можна покращити їх калібрування, при цьому не жертвуючи точністю.

Approximate, adapt, anonymize (3A): A framework for privacy preserving training data release for machine learning

У сферах, де присутня конфіденційна інформація, складно релізити висококорисні дані для машинного навчання, які б захищали індивідуальну приватність. Тому дослідники з Amazon представили фреймворк для релізу даних під назвою 3A (Approximate, Adapt, Anonymize), щоб максимізувати корисність даних, при цьому зберігаючи диференційну приватність завдяки анонімізації, реалізованої за допомогою механізму додавання шуму.

PaLM-E: An embodied multimodal language model

Google розробив PaLM-E, велику мовну модель для роботів, яка вирішує проблему нестачі масштабних датасетів шляхом перенесення знань у робототехнічну систему. На відміну від своєї попередниці — PaLM, ця модель доповнена даними з сенсорів роботизованого агента. Щоб не покладатися лише на текстовий інпут, PaLM-E здатна сприймати сирі дані безпосередньо з сенсорів, а це своєю чергою збільшує ефективність навчання роботів.

High-resolution image reconstruction with latent diffusion models from human brain activity

У цій статті вчені з Японії пропонують новий метод для реконструкції зображень на основі активності людського мозку, отриманих з фМРТ. Він базується на моделі латентної дифузії Stable Diffusion, що дозволяє зменшувати обчислювальні витрати, водночас зберігаючи високу продуктивність моделі, й реконструювати зображення у високій роздільній здатності без додаткового навчання чи тонкого налаштування складних deep learning моделей.

Відео

Nvidia CEO Jensen Huang on how his big bet on AI is finally paying off

У цьому інтервʼю засновник та головний виконавчий директор Nvidia Дженсен Хуан розкаже про шлях, який пройшла його компанія: від старту до лідерства на ринку графічних процесорів, ігор, а тепер і штучного інтелекту. Окрім того, Дженсен дасть зрозуміти, як корпорація справлялася з експортним контролем, накладеним на Китай, і геополітичною напруженістю навколо Тайваню, де виробляється більшість чипів Nvidia.

The race to build AI that can read your emotions

Письменниця і математик Ганна Фрай досліджує технології розпізнавання емоцій, починаючи від шотландської свиноферми, де вчені аналізують міміку тварин, і закінчуючи Кремнієвою долиною. Ганна спробує зʼясувати, до яких непередбачуваних наслідків можуть призвести такі інновації, чи зробить нас штучний інтелект вразливішими через зниження рівня конфіденційності, а, можливо, таким чином він убезпечить суспільство?

What are generative AI models?

Генеративний штучний інтелект не припиняє вражати своєю здатністю створювати реалістичні зображення, код і діалоги. Та чи задумувалися ви, у чому ж полягає така здібність? Кейт Соул — старша менеджерка команди Exploratory AI Research у корпорації IBM — розтлумачує принцип роботи однієї з форм генеративного ШІ, а саме великих мовних моделей, а також яку потенційну цінність для підприємств вони становлять.

Microsoft #TechTalk: Responsible AI

Наташа Крамптон — директорка з питань відповідального штучного інтелекту в Microsoft — ділиться підходом корпорації стосовно ШІ, який ґрунтується на 6 принципах: справедливість; надійність і безпека; конфіденційність і секʼюрність; інклюзивність; прозорість; підзвітність. До того ж Наташа виокремлює очевидну потребу в запобіжниках, які допоможуть уберегти цю технологію від зловживань та шкідливої експлуатації.

AI, metaverse and new tech: How might the EU regulate it?

Під час цьогорічного Mobile World Congress у Барселоні техколумністка з Wall Street Journal Джоанна Стерн зустрілася з Карме Артіґас, держсекретаркою Іспанії з питань диджиталізації та штучного інтелекту. Розмова торкнулася, зокрема, стурбованості європейських урядовців щодо регулювання ШІ на тлі його нових можливостей; сфер, на яких зосереджена Іспанія в розвитку штучного інтелекту; і правил ЄС, що стосуються ШІ.

AI art: How artists are using and confronting machine learning

Художники Кейт Крофорд, Тревор Паґлен і Рефік Анадол розʼяснять, як штучний інтелект та алгоритми машинного навчання вимагають нових підходів до творення мистецтва, а історичного контексту додадуть Паола Антонеллі та Мішель Куо. У цьому відео ви почуєте думки про те, куди мистецтво може привести розвиток штучного інтелекту і як художники реагують на прориви в галузі ШІ та використовують штучний інтелект у мистецьких цілях.

Ultra-realistic AI voice changer

Кевін Стратверт — колишній продакт-менеджер у Microsoft — продемонструє, як змінити свій голос на більш ніж 10 000 різних варіантів завдяки штучному інтелекту. За допомогою Voice.ai ви можете звучати голосами тисяч знаменитостей і навіть завантажувати власні. Можна спершу записати свій голос, а потім змінити його, або ж говорити і змінювати голос у режимі реального часу, щоб використовувати його в програмах, як-от Discord або Skype.

Подкасти

GPT-4 is here, more LLMs released, Microsoft and Google integrate AI in products

OpenAI анонсує GPT-4 — мовну модель наступного покоління. Своєю чергою дослідники зі Стенфордського університету презентують instruction-following модель Alpaca на основі нещодавно випущеної LLaMA від Meta. Тим часом Google і Microsoft оголошують про реліз продуктів, які безпосередньо інтегруватимуть технологію великих мовних моделей у їхні існуючі розробки, наприклад Microsoft Teams та Office, Gmail i Google Workspace тощо.

Slack, Salesforce, OpenAI, Grammarly, AI21, and more

Брет Кінселла, головний виконавчий директор Voicebot.ai, та його співробітник, продюсер подкастів Ерік Шварц, поспілкуються з Брендоном Капланом, засновником компанії Skilled Creative, що спеціалізується на побудові голосових програм. З огляду на безперервний бум у розвитку чат-ботів, темою цього випуску стануть SlackGPT, Einstein GPT від Salesforce, штучний інтелект у Grammarly, конкурент OpenAI під назвою AI21 Labs та інші новини.

Why Google is behind in the AI race

Попри те, що корпорація Google була першопрохідцем в галузі штучного інтелекту, останнім часом вона поступається своїми позиціями в цій сфері. Майлз Круппа, репортер у Wall Street Journal, пояснює, чому цей технологічний гігант став обережніше ставитися до чат-ботів і що стоїть на кону тепер, після того, як компанія Microsoft випередила його на ринку. Майлз пригадає фіаско, яким обернувся реліз бота Bard, та назагал історію компанії.

When AI steals your voice

Ґрунтуючись на матеріалах, які людина публікує в соціальних мережах, сучасний генеративний штучний інтелект здатен створити «маріонеткову версію» її голосу. У такий самий спосіб можна імітувати голоси державних службовців і завдяки цьому генерувати правдоподібні діпфейки. Про штучний інтелект як засіб у руках зловмисників поговорить ведуча подкасту Ліззі ОʼЛірі разом з Праншу Вермою, техрепортером у Washington Post.

At CU Anschutz, the future of AI is here

Експерт з обчислювальної біології і штучного інтелекту Кейсі Ґрін поміркує про етичні проблеми навколо ШІ, розвиток біобанків, персоналізовану медицину, використання технологій для кращого догляду за пацієнтами й загальний скептицизм стосовно ефективності штучного інтелекту в медицині. І на додачу відповість на екстравагантне питання: «У чому звʼязок між чихуахуа й чорничними мафінами і до чого тут ШІ?»

How The Hijinks Collective is using AI for good

Тамрін Керр — креативна директорка новоствореної рекламної агенції The Hijinks Collective. Нещодавно її компанія застосувала штучний інтелект для генерації зображень потенційного землетрусу в Британії, щоб допомогти в підтримці новинного висвітлення подій з Туреччини й Сирії і зборі коштів для ООН. У цьому випуску мова піде про те, як ШІ в руках креативних фахівців може стати інструментом для досягнення благих цілей.

***

Хух, сьогодні вийшло багато всього, але сподіваюся, що було цікаво. Дякую за ознайомлення з моїм дайджестом!

Ще нагадаю коротко про себе — я працюю CTO у компанії Xenoss, де ми з командою реалізовуємо різноманітні цікаві й складні проєкти. Тому якщо ви прагнете професійного зростання та знаходитесь у пошуку «своєї» компанії — долучайтеся до Xenoss!

З нас — робота у колі однодумців над складними та довготривалими data-centric проєктами. Реалізація цих проєктів вимагає унікального технічного світогляду, який трапляється в одного серед ста інженерів. Наші клієнти — провідні SaaS-компанії, всесвітньо відомі підприємства та стартапи, що активно розвиваються. А серед переваг Xenoss — цікавезні проєкти, гнучкий графік та повний ремоут.

Запрошую переглянути наші актуальні вакансії. А найактуальніші новини від Xenoss ви завжди можете дізнаватись, підписавшись на наші соцмережі: LinkedIn та Facebook.

До нових випусків!

👍ПодобаєтьсяСподобалось7
До обраногоВ обраному2
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі