Data Science Digest #36: роль ШІ в healthcare, мовна модель від Stability AI, новини від AWS, що таке PRESTO та чат-бот Koala

Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!

Друзі, привіт! З вами знову на зв’язку Вова Кириченко з Xenoss, а отже, це означає, що найновіша порція корисностей та цікавинок зі світу великих даних уже зібрана мною в черговому випуску Big Data, ML & Data Science дайджесту, 36 випуск якого ви зараз і матимете змогу прочитати.

Що ж, погляньмо лише на декілька тем, про які серед інших ітиме мова в цьому дайджесті:

  • Stability AI анонсувала мовну модель з відкритим вихідним кодом;
  • Руйнівник Twitter-а Маск запускає компанію для роботи над генеративним ШІ;
  • новини від AWS — анонс Amazon Bedrock, оновлення CodeWhisperer;
  • роль ШІ у впровадженні кліматичних рішень, пошуку позаземних форм життя та покращенні сфери охорони здоров’я;
  • Google запускає багатомовний набір даних PRESTO;
  • цікаві та різнопланові розробки та дослідження;
  • добірка цікавих та інформативних відео й подкастів.

І поки ви не занурились у читання, нагадаю — шерити і коментувати дайджест не тільки можна, але й треба ;) Якщо ви проґавили попередній випуск — не проблема, його можна переглянути ось тут. Гайда читати!

Статті про AI/ML

Stability AI announces new open-source large language model

Компанія Stability AI, яка розробила ШІ-генератор зображень Stable Diffusion, випустила набір великих мовних моделей з відкритим вихідним кодом під назвою StableLM. Тепер її моделі будуть доступні для використання та адаптації розробниками на GitHub. StableLM призначена для генерації тексту й коду і навчається на більшій версії open source датасету Pile, який охоплює інформацію з різних джерел, як-от Wikipedia, Stack Exchange і PubMed.

Elon Musk has had a wild week. Now he wants to start an AI company

Ілон Маск розповів про свої плани щодо TruthGPT — продукту на базі штучного інтелекту, який він планує розгорнути, щоб конкурувати з Microsoft і Google. Окрім того, Ілон запускає нову компанію X.AI, яку він заснував минулого місяця. Наразі мало що відомо про цей проєкт, однак Маск визнав, що він уже нагромаджує потужне компʼютерне обладнання для роботи над генеративним ШІ — галуззю, котра лежить в основі чат-ботів, як-от ChatGPT.

OpenAI surprises open-source community, unveils Consistency Models

Після тривалої критики через так звану «політику закритих дверей» ШІ-лабораторія OpenAI намагається перейти на шлях відкритого коду, адже тепер її технологія Consistency Models буде доступна в open-source. Матеріал про новий клас генеративних моделей вийшов ще місяць тому, і це може ознаменувати наступний крок у мистецтвотворчих перегонах штучного інтелекту, в якій DALL-E (розробка цієї ж компанії) зможе виділитися з-поміж конкурентів.

Amazon AWS expands generative AI efforts with Bedrock and CodeWhisperer updates

А зараз трохи апдейтів зі світу генеративного штучного інтелекту від Amazon Web Services (AWS). Наприклад, новий хмарний сервіс Amazon Bedrock. Серед його початкового набору підтримуваних моделей — AI21, Anthropic і Stability AI, а ще свіжий сет моделей, відомий як Amazon Titan. При нагоді згадаємо й сервіс для розробки коду Amazon CodeWhisperer, який став загальнодоступним, а до того ж безкоштовним для індивідуальних девелоперів.

Synthesis AI debuts high-resolution text-to-3D capabilities with synthesis labs

Synthesis AI — стартап, що спеціалізується на технологіях синтетичних даних, — розробив новий спосіб створення реалістичних тривимірних моделей людей з текстових запитів. Для перетворення тексту в 3D використовується генеративний штучний інтелект і конвеєри візуальних ефектів, щоб продукувати високороздільні моделі з кінематографічною якістю і застосовувати їх у сферах, як-от ігрова індустрія, віртуальна реальність, кіно та симуляція.

Atlassian taps OpenAI to make its collaboration software smarter

Atlassian користуватиметься технологією OpenAI, щоб додавати функції штучного інтелекту до різноманітного колаборативного програмного забезпечення. Зокрема, завдяки GPT-4 — Jira оброблятиме запити співробітників на техпідтримку в Slack, а в Confluence можна буде отримувати згенеровані пояснення термінів, знайдених у документах, або ж автоматичні відповіді на питання, що ґрунтуватимуться на інформації з цих документів.

Microsoft reportedly working on its own AI chips that may rival Nvidia’s

Повідомляється, що Microsoft працює над власними чипами штучного інтелекту, які будуть придатні для навчання великих мовних моделей і дозволять уникнути коштовної залежності від Nvidia. Згідно з інформацією видання The Information, корпорація таємно розробляє чипи з 2019 року, і деякі співробітники Microsoft і OpenAI вже мають доступ до них для перевірки їхньої сумісності з новітніми великими мовними моделями, як-от GPT-4.

European parliament prepares tough measures over use of AI

Європарламент готує заходи щодо експлуатації ШІ на кшталт зобовʼязання розробників чат-ботів інформувати, чи використовують вони матеріали, захищені авторством, що дозволить креаторам вимагати оплату. Також пропонується покладати відповідальність за зловживання на розробників, а не на менші компанії, які юзають продукт. Є і суперечливі ідеї, як-от заборонити розпізнавання облич у громадських місцях за будь-яких обставин.

Наукові видання

TaskMatrix.AI: Completing tasks by connecting foundation models with millions of APIs

Дослідники з Microsoft представляють TaskMatrix.AI — концепцію ШІ-екосистеми, яка єднатиме фундаментальні моделі з мільйонами API для виконання різних завдань як у цифровій, так і в фізичній сфері. У цій науковій роботі вчені пояснюють, як вони бачать побудову такої системи, тлумачать кожен з її ключових компонентів, а також ілюструють реалістичність цього бачення та основні виклики, з якими потрібно буде надалі впоратися.

Learning to grow machine-learning models

У Массачусетському технологічному інституті розробили техніку машинного навчання під назвою Linear Growth Operator (LiGO). По-перше, за допомогою цього data-driven методу можна нарощувати ширину і глибину більшої нейромережі на основі параметрів меншої. По-друге, LiGO заощаджує близько 50% обчислювальних витрат, необхідних для навчання зорових і мовних моделей-трансформерів, при цьому часто підвищуючи продуктивність.

PRESTO — a multilingual dataset for parsing realistic task-oriented dialogues

Google запускає PRESTO — багатомовний набір даних для аналізу реалістичних задачно орієнтованих діалогів, до якого входить з півмільйона правдоподібних розмов між людьми та віртуальними асистентами. Цей датасет охоплює шість мов і містить у собі мовленнєві процеси, які відбуваються під час роботи з асистентом. Тегування цих явищ своєю чергою дозволяє створювати тестові набори, щоб окремо аналізувати продуктивність моделі.

Koala: A dialogue model for academic research

Нове дослідження від ШІ-лабораторії Університету Каліфорнії в Берклі присвячене чат-боту Koala, навченому шляхом тонкого налаштування моделі Meta’s LLaMA на основі діалогів, зібраних з інтернету. Результати свідчать, що Koala здатна ефективно реагувати на різноманітні запити користувачів, генеруючи відповіді, які часто виграють порівняно зі Stanford’s Alpaca і щонайменше в половині випадків можуть зрівнятися із ChatGPT.

How Amazon Chime SDK’s voice tone analysis works

Команда Amazon Chime SDK випустила модель аналізу тональності голосу, яка використовує машинне навчання для оцінки сентименту, ґрунтуючись на мовленнєвому сигналі. Архітектура глибинної нейронної мережі аналізує як лексичну, так і акустичну інформацію, а висновки виконуються в реальному часі на коротких сегментах сигналу й повертають набір імовірностей позитивного, нейтрального або негативного сентименту.

Introducing Segment Anything: Working toward the first foundation model for image segmentation

Подвійний реліз від ШІ-лабораторії Meta — Segment Anything Model (SAM) і Segment Anything 1-Billion mask dataset (SA-1B), найбільший в історії набір даних сегментації. Очікується, що це уможливить широкий спектр застосувань і посприяє подальшому вивченню foundation моделей компʼютерного бачення. Датасет SA-1B буде доступний для дослідницьких цілей, а модель SAM — на умовах вільної відкритої ліцензії (Apache 2.0).

Відео

The AI revolution: Google’s developers on the future of artificial intelligence

Про теперішній та майбутній розвиток штучного інтелекту журналіст Скотт Пеллі довідався з перших уст від передовиків галузі, коли завітав до Google, щоб поспілкуватися із CEO корпорації Сундаром Пічаї, віцепрезидентами Сіссі Сяо й Джеймсом Маньїкою і науковцем Вінсентом Вангуке. Окрім того, Скотт відвідав ШІ-лабораторію DeepMind, якою володіє Google, де зустрівся з її співзасновником Демісом Гассабісом і дослідницею Раєю Гадселл.

AI vs machine learning

Штучний інтелект і машинне навчання — терміни, до яких ми вже давно призвичаїлися. Однак чи задумувалися ви, у чому полягає їхня різниця? В цьому відео інженер та архітектор з кібербезпеки Джефф Крум, який обіймає посаду технічного директора в IBM Security Americas, детально пояснює відмінності та взаємозвʼязок між цими двома поняттями, а також яким чином вони стосуються тем на зразок глибинного навчання.

Hello world: Meet generative AI | Amazon Web Services

Вернер Фоґельс, технічний директор корпорації Amazon, і Свамі Сівасубраманіан — віцепрезидент з баз даних, аналітики та машинного навчання в дочірній компанії, Amazon Web Services, обміняються судженнями стосовно широкого спектру генеративного штучного інтелекту, розтлумачать нам, чому це питання не належить до «хайпових» тем, і розкажуть, як AWS демократизує доступ до великих мовних і foundation моделей.

Bill Gates on AI and the rapidly evolving future of computing

Оскільки до розвитку штучного інтелекту має стосунок і Microsoft — зі своїм фреймворком Azure AI, співпрацею з OpenAI та новою версією Bing — погляд на цей унікальний момент в історії компʼютингу висловить співзасновник компанії Білл Ґейтс. Зокрема, він приділить увагу останнім дослідженням, віддзеркаленню попередніх технологічних революцій у поточному стані речей та впливові штучного інтелекту на його благодійну діяльність.

Unveiling AI’s illusions: With Gary Marcus and Michael Wooldridge

Професори Ґері Маркус та Майкл Вулдрідж розкривають правду про можливості, обмеження та майбутнє штучного інтелекту. Переглянувши цей ролик, ви отримаєте цінні інсайти про сучасний стан моделей ШІ, як-от GPT-4, їхні відмінності від людського розуму, різницю між «інтелектом» і «розумінням», потенційну роль штучного інтелекту в формуванні майбутніх технологій, інтенсифікацію й розширення розуміння в мовних моделях тощо.

AI and the digital climate revolution

Одне з питань, які зараз на порядку денному, — це значення штучного інтелекту й діджитал-технологій у впровадженні кліматичних рішень для енергосистеми та управління викидами вуглецю. Співзасновниця Climate Change AI Прія Донті, кофаундерка Buoyant Ventures Емі Франсетік та головний виконавчий директор Energy Web Джессі Моріс дослідять розвиток ШІ й розглянуть реалістичні кейси, здатні трансформувати енергетику.

Подкасти

Anthropic vs OpenAI, AutoGPT, RL at scale, AI safety, memeworthy AI videos

ШІ-стартап Anthropic має намір зібрати до $5 млрд протягом наступних двох років, щоб перевершити свого конкурента — OpenAI. Тим часом розробники намагаються створити «автономну» систему, поєднавши декілька інстансів моделі GPT. Дослідники з Google і собі пропонують систему глибинного навчання роботів для сортування відходів в офісних будівлях. І це лише частина новин з актуального дайджесту від Last Week in AI.

Peter Ma on using AI to find promising signals of alien life

Студент та дослідник Пітер Ма разом зі своїми колегами використав штучний інтелект, щоб проаналізувати величезний набір даних радіосигналів, зібраних у рамках проєкту SETI Breakthrough Listen, і виявив 8 сигналів, які можуть бути техносигнатурами або ж ознаками інопланетних технологій. У цьому випуску NVIDIA AI Podcast Пітер розповідає, як він розробив ШІ-алгоритм, що перевершив традиційні методи пошуку позаземного розуму.

Google CEO Sundar Pichai on how AI could change search

Корпорація Google відома своїми великими мовними моделями, наприклад чат-ботами, але ще не скористалася цією технологією, щоб впливати на свій пошуковий функціонал. Репортер із The Wall Street Journal Майлз Крупа, зацікавившись цим ще не реалізованим потенціалом Google, дізнався від головного виконавчого директора Сундара Пічаї, яким чином новий штучний інтелект може мати значний вплив на бізнес-діяльність компанії.

AI for health and the future of research with Peter Lee

Пітер Лі — керівник відділу досліджень Microsoft і один зі співробітників, котрі отримали ранній доступ до GPT-4 для оцінки та експериментів. Дослідницька філософія Лі полягає в тому, щоб насамперед розглядати речі, які неминуче відбудуться у майбутньому, а вже потім — те, що ми маємо зараз. У цьому епізоді подкасту він також розмірковує про чинники, які здатні посприяти інтеграції сучасних досягнень штучного інтелекту в охорону здоровʼя.

Charities and ChatGPT

Джонатан Шевальє, головний виконавчий директор неприбуткової організації Charity Digital, та Анґус Ґреґорі, CEO IT-компанії Biomni, поговорять про нові можливості для волонтерського сектору, котрі зʼявилися завдяки штучному інтелекту, і як ChatGPT може допомогти благодійним організаціям надавати послуги швидше та дешевше: від покращення кампаній зі збору коштів до створення контенту й поширення інформації.

ChatGPT gets banned, deepfakes get provenance, Bing chat gets ads, Meta, Canva & more

Думками щодо назрілих питань зі світу штучного інтелекту поділяться Ніна Шик, авторка книги Deepfakes, та Ерік Шварц, головний райтер з Voicebot<span>.</span>ai: обговорять блокування ChatGPT в Італії та дії інших держав стосовно цієї розробки OpenAI, порівняють її з іншими винаходами галузі, торкнуться способів боротьби з дипфейками, згадають нову модель генеративного ШІ від Meta, Segment Anything, і зачеплять інші не менш важливі теми.

***

На сьогодні це всі новини, друзі!

Дякую вам за ознайомлення з дайджестом. Щоб не втрачати зв’язок та не пропустити мій наступний дайджест, клікайте «Підписатися на автора» одразу під текстом. Також ваші лайки, поширення і коментарі додають наснаги творити нові випуски, тому не скупіться на них ;)

Ще коротко розкажу про себе — у повсякденному житті я обіймаю посаду CTO в компанії Xenoss, де ми з командою реалізовуємо різноманітні цікаві й складні речі. Ми працюємо з високонавантаженими системами та вирішуємо проблеми, що пов’язані з інтенсивною обробкою даних.

Реалізація цих проєктів вимагає унікального технічного світогляду, який трапляється в одного серед 100 інженерів. Розуміючи це, ми адаптували remote-first філософію керування членами команд, які перебувають на трьох континентах. Як результат, у нас є колеги з 14 країн світу, здатні ефективно справлятися з дедалі більшою складністю домену AdTech/MarTech.

Якщо ви в пошуках нових кар’єрних можливостей, запрошую переглянути наші актуальні вакансії. А найактуальніші новини від Xenoss ви завжди можете дізнаватись, підписавшись на наші соцмережі: LinkedIn та Facebook.

До нових випусків!

Слава Україні!

👍ПодобаєтьсяСподобалось6
До обраногоВ обраному2
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі