Data Science Digest #34: нова LLaMA від Meta, API для ChatGPT, AI-війни Google та Microsoft, CEO Palantir про ШІ у військовій сфері
Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!
Друзі, привіт! З вами Вова Кириченко, і я не міг залишити вас без новин зі світу Data Science, тому тримайте
Готуючи цей випуск, я намагався дати ширшу перспективу того, що відбувається в індустрії і зменшити кількість згадувань про ChatGPT, наскільки це можливо, адже і без дітища OpenAI ця сфера переживає зараз справжній бум :)
Цього разу ділюся з вами такими новинами:
- Meta презентувала мовну модель LLaMA;
- реліз API для ChatGPT;
- як за допомогою машинного навчання і методів послідовної вибірки можна передбачати пандемії та землетруси;
- представлено Microsoft Dynamics 365 Copilot для CRM та ERP-систем;
- AI-війни: Microsoft проти Google;
- Алекс Карп, CEO Palantir, ділиться думками стосовно відповідального штучного інтелекту у військовій сфері;
- добірка цікавих та інформативних відео та подкастів.
Якщо ви проґавили мій попередній дайджест — не проблема, його можна переглянути ось тут. Як завжди, фідбек та коментарі вітаються.
Статті про AI/ML
OpenAI launches an API for ChatGPT, plus dedicated capacity for enterprise customers
OpenAI випустила API для ChatGPT, що дасть змогу компаніям інтегрувати цю технологію у свої застосунки, вебсайти, продукти й сервіси. За словами президента OpenAI Ґреґа Брокмана, API базується на так званій «gpt-3.5-turbo» — тій же моделі штучного інтелекту, що і сам ChatGPT. Новинка коштує $0.002 за 1000 токенів (близько 750 слів) і, як стверджує Брокман, застосовна в різноманітних сферах, зокрема й нечатових застосунках.
Meta unveils a new large language model that can run on a single GPU
LLaMA-13B — велика мовна модель на основі штучного інтелекту від Meta, яка претендує на конкуренцію з GPT-3 від OpenAI, і є при тому вдесятеро меншою. Такі моделі можуть привести в дію мовних асистентів зразка ChatGPT на девайсах, як-от смартфони і ПК. Для їх навчання Meta використовувала загальнодоступні набори даних на кшталт Common Crawl, Wikipedia і C4, тож імовірно, що модель та ваги випустять у форматі open source.
How AI is transforming genomics
Джордж Вацек, всесвітній голова альянсів з геноміки в Nvidia, вважає досягнення в повногеномному секвенуванні рушієм революції в галузі цифрової біології. Щоб зчитувати й розуміти дані стосовно секвенування геному, необхідні прискорені обчислення, data science i штучний інтелект, а потреба знизити вартість аналізу цих даних та підвищити пропускну здатність і точність зчитування створює попит на нові обчислювальні підходи.
Spotify debuts a new AI DJ, right in your pocket
У Spotify зʼявилася бета-версія нової функції під назвою AI DJ, яка є поєднанням технологій персоналізації, генеративного штучного інтелекту і синтезу мовлення. Тепер користувачі мають можливість отримувати музичні добірки разом зі штучно озвученими коментарями до треків та виконавців, які Spotify вважає відповідними до вподобань юзерів. Вибір може ґрунтуватися як на свіжих, так і на давніх прослуховуваннях.
Blender can now use AI to create images and effects from text descriptions
Новий інструмент від Stability AI дозволяє програмному забезпеченню Blender використовувати штучний інтелект, щоб створювати зображення, текстуру, ефекти та анімацію згідно з текстовими запитами або власними візуалізаціями користувача. Stability for Blender потребує API-ключа та інтернет-зʼєднання, однак не є платним продуктом і не вимагає жодних програмних залежностей чи спеціального графічного процесора.
Microsoft анонсував нове покоління оновлень продуктів, базованих на штучному інтелекті, у своєму портфоліо бізнес-застосунків. Зокрема, сюди входить Microsoft Dynamics 365 Copilot, який надає інтерактивну допомогу для різних бізнес-функцій. Наприклад, у межах програм Sales and Viva Sales він скоротить час, виділений на канцелярські завдання, а в Business Central — спростить формування списків товарів для онлайн-комерції.
Resistant AI makes document verification solutions available on Google Cloud
Resistant AI — постачальник рішень для боротьби з фінансовими злочинами — у партнерстві з Google Cloud Marketplace пропонує сервіс цифрової автентифікації документів, Document Forensics. За його допомогою користувачі кваліфікуватимуть, категоризуватимуть і валідуватимуть документи, які верифікують особу клієнта, — до їх переліку належать підтвердження адреси, посвідчення особи та банківські виписки.
Salesforce plans to incorporate generative AI across the platform
Під час девелоперської конференції TrailblazerDX компанія Salesforce оголосила про намір запровадити генеративний штучний інтелект, а саме — технологію Einstein GPT, яка додасть платформі функцій, подібних до можливостей ChatGPT. Нововведення не лише здатне полегшити створення контенту, але й зможе підключатися до Flow, корпоративного інструменту для автоматизації робочих процесів, і список на цьому не завершується.
Наукові видання
On detecting whether text was generated by a human or an AI language model
Хто автор тексту — людина чи мовна модель штучного інтелекту? Професор Інституту Санта-Фе Мелані Мітчелл дослідила підходи, завдяки яким це можна визначати. Перший метод полягає в тому, щоб дізнатися, чи уривок згенерований за допомогою конкретної великої мовної моделі. Другий спосіб — вставити цифровий «водяний знак» у рамках процесу генерації тексту, надавши юзерам можливість легко перевіряти його наявність.
Дослідники з Массачусетського технологічного інституту та IBM Research розробили стратегію, згідно з якою модель машинного навчання зможе ефективніше виконувати кількісну оцінку невизначеності, використовуючи меншу потужність обробки, і не задіюючи додаткових даних, на відміну від попередніх підходів. Цей метод здатен адаптуватися до різноманітних застосувань, оскільки модель не потрібно перенавчати чи прилаштовувати.
Study shows how machine learning could predict rare disastrous events, like earthquakes or pandemics
Поєднавши вдосконалену систему машинного навчання і методи послідовної вибірки, можна обійтись без великих датасетів у прогнозуванні надзвичайних ситуацій — вважають учені зі згаданого Массачусетського технологічного інституту і Браунського університету. Йдеться про статистичні алгоритми, що вимагають менше даних для передбачень, і метод машинного навчання, який функціонує всупереч нестачі історичної інформації про події.
Solving a machine-learning mystery
Результати цього дослідження свідчать про те, що великі мовні моделі на кшталт GPT-3 можуть опановувати нові завдання, базуючись лише на декількох взірцях, — без потреби в нових навчальних даних. Це явище має назву «навчання в контексті». Для прикладу, на основі отриманої низки речень та вказаної тональності (позитивної чи негативної) модель зможе самостійно і до того ж коректно зʼясувати тональність наступного речення.
Using large language models (LLMs) to synthesize training data
Розмір та обчислювальні витрати великих мовних моделей не підходять для середовищ виконання, що вимагають низької латентності й підтримують великі обсяги трафіку. Щоб активувати легкі моделі, дослідники пропонують «навчання за даними» (teaching via data): модель «вчителя» на базі LLM генеруватиме синтетичні навчальні дані для конкретного завдання, а потім використовуватиме їх для тонкого налаштування меншої моделі «учня».
Can the AI driving ChatGPT help to detect early signs of Alzheimerʼs disease?
У Дрексельському університеті дійшли висновку, що алгоритми штучного інтелекту, які стоять за ботом ChatGPT, мають потенціал стати допоміжним засобом для виявлення хвороби Альцгеймера на її ранніх стадіях. Напрацювання з нещодавнього дослідження продемонстрували, що GPT-3 спроможна ідентифікувати з-посеред спонтанного мовлення підказки, які містять у собі передбачення початкових етапів деменції з точністю 80%.
Відео
Yes, we are at a tipping point: ChatGPT is just the beginning of how AI will soon change everything
Старший технологічний репортер у Forbes Кенрік Кай разом з асистенткою головного редактора Даєн Брейді обговорює власну статтю на тему того, як генеративний штучний інтелект змінить світ загалом та економіку зокрема. Кенрік розповість про OpenAI та інших перспективних гравців на цьому ринку, висловиться про екзистенційну занепокоєність у звʼязку з розвитком ШІ та оцінить інноваційність США в цьому плані порівняно з Китаєм.
Palantir CEO Alex Karp on responsible AI in warfare
Алекс Карп — співзасновник та головний виконавчий директор компанії Palantir Technologies — взяв участь у саміті REAIM 2023, що присвячений відповідальному штучному інтелектові у військовій сфері. Алекс поміркував про дедалі більший інтерес до споживчого ШІ, зазначив, яку роль Palantir Technologies відіграє на полі бою, і поділився думкою щодо питання, як навчати й використовувати алгоритми в контексті війни.
Про штучний інтелект у юридичному аспекті розкаже Девін Стоун — судовий адвокат, адʼюнкт-професор права Джорджтаунського університету і ведучий ютуб-каналу LegalEagle. Чи може ШІ володіти авторським правом? Наскільки легально та етично навчати штучний інтелект за допомогою робіт, захищених авторським правом? Хто відповідає за порушення авторських прав? Девін розкриє кожну з цих невизначеностей.
Microsoft vs Google: AI war explained
Автор відеоблогу Joma Tech, Джонатан Ма, згадає апдейти корпорацій Google (запуск чат-бота Bard) i її конкурента Microsoft (запровадження функції AI copilot у Microsoft Edge). Також Джонатан розбере тонкощі змагань у галузі штучного інтелекту, де, крім цих технологічних гігантів, задіяні стартапи, як-от DeepMind, Anthropic та OpenAI; пояснить взаємозвʼязок між цими компаніями; та окреслить історію Yahoo! і її поразку на ринку.
Investing in AI, with care | World Economic Forum 2023
У рамках Всесвітнього економічного форуму топпосадовці різних компаній та неприбуткових організацій обмінялися поглядами на штучний інтелект та його етичну площину; розмірковували над роллю інвесторів та очікуваннями від них; обговорили вкладницькі можливості й водночас речі, які слід враховувати, оцінюючи інвестиційну привабливість AI-стартапів, і пункти, про які варто запитувати впродовж цього процесу.
A conversation on the state of AI | Melanie Kambadur, Meta & Gideon Mann, Bloomberg
Мелані Камбадур — менеджер з досліджень у Meta AI, де вона працювала над проєктами, як-от BlenderBot. Ґідеон Манн — керівник з продуктів і досліджень машинного навчання в Bloomberg LP, який відповідає за побудову інфраструктури ШІ та інкубацію нових технологій. Завітавши до студії Метта Турка, вони провели розмову стосовно великих мовних моделей, перешкод на шляху їхнього розвитку, подальшого прогресу і не тільки.
AI technology that will change the world (again)
Ютубер і подкастер Метт Вулф опише свої методи організації даних та розуміння складних понять, повʼязаних зі штучним інтелектом. Щонайголовніше — він покаже, як завдяки штучному інтелекту можна автоматизувати користування соцмережею LinkedIn, тлумачити зображення, створювати нові шрифти і навіть читати думки. Також Метт зробить огляд PaLM-E — великої мовної моделі від Google, яка автономізує керування роботами.
Qualcomm CEO: AI and VR are the future of business
Крістіано Амон, головний виконавчий директор корпорації Qualcomm, вважає, що штучний інтелект і віртуальна реальність — це майбутнє бізнесу. Зі старшим персональним технологічним колумністом Wall Street Journal Джоанною Стерн він поспілкувався про уповільнення продажів смартфонів, подальший стан цього ринку, наміри компанії щодо віртуальної реальності і рішення, які Qualcomm може забезпечити для автовиробників.
How Nvidia grew from gaming to AI giant, now powering ChatGPT
Зараз ставка на штучний інтелект приносить корпорації Nvidia значні плоди: чипи A100 швидко стали бажаними рушіями для навчання ChatGPT та інших взірців генеративного ШІ. Але оскільки ці чипи виробляються в Тайвані, компанія вразлива до торговельної напруги між США та Китаєм. Медійники із CNBC вирушили до Кремнієвої долини, щоб зазирнути за лаштунки Nvidia і зустрітися з її президентом Дженсеном Хуаном.
Подкасти
Protecting your ML from phishing and hackers
Кевін Домінік Корте — стратег з інновацій та розвитку інформаційних технологій, стартап-ментор у Newchip Accelerator і президент компанії Univention, яка виробляє IT-інфраструктурну продукцію. У цьому подкасті Кевін ознайомить слухачів з Univention та її діяльністю, поговорить з ведучими про персональну безпеку, заглибиться в тему протидії фішинговим та хакерським атакам, а також приділить увагу актуальним стартап-трендам.
Machine learning approaches: Supervised learning, unsupervised learning, reinforcement learning
Цього разу Кетлін Вальх та Рон Шмельцер торкнуться підходів до машинного навчання. По-перше, вони розтлумачать терміни, як-от «навчання з учителем», «навчання без учителя» та «навчання з підкріпленням». По-друге, Кетлін і Рон висвітлять взаємозвʼязок між методами машинного навчання та штучним інтелектом. До того ж нам дадуть зрозуміти, чому машинне навчання поділяється на цілих три типи, і в чому їхня важливість.
Bing chat antics, Bio and Mario GPT, stopping an AI apocalypse, stolen voices
Чат-бот Bing втрапив у скандал, давши погрозливі відповіді одному з користувачів. Дослідники з Копенгагенського ІТ-університету презентували MarioGPT, який генерує рівні для гри Super Mario на основі текстових описів. Microsoft випустив BioGPT, навчену на мільйонах біомедичних статей. А в спільноті акторів озвучки — стурбованість дедалі частішими запитами на право використовувати їхні голоси для синтезу штучних.
Bing Boomerang, OpenAI Foundry, GitHub Copilot, Roblox and more
Через негатив, який виник після компрометуючої поведінки чат-бота Bing, Microsoft ввів ліміти, щоб уберегти юзерів від невідповідного контенту, проте невдоволення користувачів змусило компанію переглянути це рішення. Тим часом OpenAI представив розробницьку платформу Foundry для високонавантаженого запуску своїх
AI: Ethics and the public sector
Співробітники австралійської юридичної фірми Hall & Wilcox — Ліза Ціґерт і Джуліан Гаммонд — розмовлятимуть з приводу етичних питань, що стосуються штучного інтелекту й можливостей та ризиків, які він створює для державного сектору. Ще одна тема, яку Ліза і Джуліан покриють у ході своєї бесіди, — потенційні способи того, як можна регулювати функціонування цього новітнього типу технології в згаданій сфері громадського життя.
How AI and project management fit together
Гість випуску Білл Реймонд, який, між іншим, є ведучим іншого подкасту, Agile in Action, озвучить свою думку стосовно того, чому проджект-менеджерам варто тримати штучний інтелект у полі зору, де існують точки дотику між штучним інтелектом та Agile і яким чином ШІ вписується в проджект-менеджментний простір — починаючи з управління проєктами, в яких присутній штучний інтелект, і закінчуючи посиленням ролі проджект-менеджера.
***
Наразі це все, дякую вам за ознайомлення з моїм дайджестом!
Користуючись можливістю нагадаю: у повсякденному житті я працюю як CTO у компанії Xenoss, де ми з командою реалізовуємо різноманітні цікаві й складні речі. Тому якщо ви прагнете професійного зростання та знаходитесь у пошуку «своєї» компанії — долучайтеся до Xenoss!
З нас — робота у колі однодумців над складними та довготривалими data-centric проєктами. Реалізація цих проєктів вимагає унікального технічного світогляду, який трапляється в одного серед ста інженерів. Наші клієнти — провідні SaaS-компанії, всесвітньо відомі підприємства та стартапи, що активно розвиваються. А серед переваг Xenoss — цікавезні проєкти, гнучкий графік та повний ремоут.
Запрошую переглянути наші актуальні вакансії. А найактуальніші новини від Xenoss ви завжди можете дізнаватись, підписавшись на наші соцмережі: LinkedIn та Facebook.
Ваші лайки, поширення і коментарі до дайджесту додають наснаги творити далі, тому лайк, шер та коментар — ваш спосіб надихнути мене на нові випуски дайджесту! :)
До нових випусків!
Слава Україні!
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів