AI News Digest #2: Claude 4.5, Sora 2, Atlas та інші новинки у світі АІ

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Всім привіт! На звʼязку Андрій Белас, Director, Data & AI в SPD Technology, і це наш другий АІ-дайджест. Жовтень був дуже багатий на новини зі світу АІ, й саме час ними ділитися!

🔸 Thinking Machines Lab запускає Tinker

Команда Міри Мураті, у яку увійшли ключові колишні фахівці OpenAI, представила свій перший продукт — Tinker, інструмент для автоматизації fine-tuning передових AI-моделей через API. Стартап уже залучив $2 млрд seed-інвестицій при оцінці $12 млрд, ще до офіційного релізу. Tinker обіцяє демократизувати процес налаштування AI-моделей, який раніше вимагав великих GPU-кластерів і спеціальної експертизи. Бета-тестери відзначають, що продукт вдало балансує між простотою використання та контролем.

🔸 Claude Sonnet 4.5 — новий рівень від Anthropic

Anthropic випустила Claude Sonnet 4.5 — модель, яку у релізі назвали найкращою для програмування. Вона показує 77.2% на SWE-bench Verified, обходить решту моделей і здатна підтримувати фокус понад 30 годин на багатоступінчастих завданнях. Модель дуже швидка і приємна у використанні.

Claude Code оновлено до 2.0.0, тож тепер за замовчуванням увімкнено Sonnet 4.5, а режим міркувань активується натисканням tab. З’явилася команда usage, яка показує тижневі ліміти — тепер можна бачити, скільки ресурсу залишилось. Варто пам’ятати, що Opus споживає його найбільше, тож 4.5 — чудовий вибір: перформанс на рівні (а подекуди й кращий) і значно вигідніші ліміти.

Розширення для VS Code стало нативним, а у Claude Code додали checkpoints — точки, до яких можна повернутися разом зі змінами коду. Зручно, якщо все буде працювати стабільно, хоча як завжди — краще підстраховуватись git-ом і новими гілками для AI-експериментів.

🔸 Anthropic представила Claude Haiku 4.5

Anthropic випустила Claude Haiku 4.5 — компактну, але потужну модель, яка майже не поступається Sonnet 4 у продуктивності, зате працює вдвічі швидше та коштує утричі дешевше.

Ще недавно Haiku майже не використовували, а тепер вона стала гарним доповненням Sonnet, особливо для щоденних задач. У новому Claude Code Haiku автоматично залучає Sonnet для планування, а потім виконує таски самостійно.

Тим часом Opus 4.1 зник із графіків — імовірно, тимчасово, поки Anthropic вирішує питання його подальшої долі.

🔸 Claude Code — тепер прямо у браузері

Anthropic відкрила Claude Code on the Web — вебверсію інструмента для розробників, який працює як Codex Cloud чи Jules від Google. Підключаєш репозиторій, ставиш задачу і отримуєш pull request із результатом. Хмарні сесії ділять ліміти з рештою Claude Code, тож зловживати не вийде. Формат теж інший: замість діалогу з моделлю — чітке технічне ТЗ і очікування результату.

🔸 Anthropic запускає Agent Skills — модульні навички для Claude

Тепер Claude може «підтягувати» готові інструкції, скрипти чи навіть код саме тоді, коли вони потрібні. Система Agent Skills дає змогу працювати з точністю, якої часто бракує генеративним моделям. Skills уже доступні у Claude, Claude Code і через API.

Серед готових — робота з Excel, PowerPoint, Word і PDF, а нові можна створювати через endpoint /v1/skills. Це, по суті, еволюція концепції агентів і водночас альтернатива MCP: модель економить контекст, не генерує зайвого й діє під повним контролем користувача. Нарешті Claude може просто «дістати» готовий приклад, замість витрачати токени на його вигадування.

🔸 OpenAI запустила Sora 2

Оновлена модель генерує до 10 секунд відео зі звуком — голосами, ефектами та шумами. У компанії це називають «GPT-3.5-моментом для відео».

OpenAI також випускає Sora App для iOS — соціальну мережу для AI-відео, схожу на TikTok. Обіцяють покращену фізику, якісну модерацію та «безпечний формат», хоча продукт явно має соціальний ухил.

🔸 OpenAI DevDay: ключові анонси та нові інструменти для розробників

Завершилася презентація, яка відкривала OpenAI DevDay, і компанія представила низку важливих оновлень.

  • Codex (Cloud) став загальнодоступним, відкриваючи можливості для розробників без обмеженого доступу.
  • Представлено AgentKit для створення AI-агентів, ChatKit для вбудовування чатів у додатки та App SDK для інтеграції сторонніх сервісів, таких як Spotify, Coursera та Canva прямо в ChatGPT.
  • Особливу увагу привернув AgentKit із модулем Agent Builder — інтерфейсом для створення агентів прямо у браузері, використовуючи готові блоки та функції.
  • В API тепер з’явиться доступ до GPT-5 Pro та Sora 2.

🔸 Pulse від OpenAI — наступний крок у розвитку ChatGPT Pro

Pulse — це система проактивних оновлень, яка має зробити ChatGPT вашим справжнім персональним асистентом. Вона щоночі аналізує ваші чати та підключені сервіси (як-от Gmail), щоб вранці показувати релевантні інсайти та рекомендації. Ідея нагадує персоналізовані стрічки Google чи старий добрий Yahoo Home. Але навіть штучному інтелекту потрібен мінімальний контекст, щоб зрозуміти вас по-справжньому.

🔸 OpenAI представила Atlas, власний браузер на базі ШІ

OpenAI представила Atlas — новий браузер, який компанія називає «інтерфейсом до інтернету у вигляді чату». В основі Chromium, але з трьома ключовими нововведеннями:

  • Пошук через ChatGPT, який знаходить інформацію не лише за заголовками сторінок, а й за змістом, навіть якщо користувач пам’ятає щось нечітко.
  • Пам’ять ChatGPT використовується для персоналізації: підказки, відповіді та інтерфейс швидко адаптуються під користувача.
  • На кожному сайті з’являється кнопка «Ask ChatGPT», що дозволяє викликати агента, запитати про зміст сторінки або ввімкнути режим автозаповнення.

Багато з цих ідей уже реалізували інші — від Brave до Claude for Chrome, але головна перевага Atlas у масштабі: OpenAI має аудиторію, яка масово встановить і почне користуватися браузером.

🔸 OpenAI запускає покупки просто в ChatGPT

Тепер ChatGPT можна використовувати не лише для порад чи генерації текстів, а й для покупок. OpenAI представила Instant Checkout — функцію, яка дозволяє купувати товари прямо в чаті. Поки доступна лише інтеграція з Etsy (США), але скоро додадуть Shopify із понад мільйоном продавців. Підтримуються лише single-item покупки, та вже планують кошики й розширені можливості. OpenAI братиме комісію з кожної транзакції — подробиці поки не розкривають. Звучить як великий крок до повноцінного AI-commerce.

🔸 Google представив Gemini 2.5 Computer Use

Google випустив Gemini 2.5 Computer Use — нову модель на базі Gemini 2.5 Pro, яка може буквально «керувати комп’ютером»: натискати, друкувати, скролити й навіть заповнювати форми. Модель уже доступна через API у Google AI Studio та Vertex AI (режим Preview). За словами компанії, вона швидша за аналоги від Claude і ChatGPT та показує вищі результати у тестах. Усередині Google її вже активно використовують, а безпеку обіцяють надійно забезпечити.

🔸 Google Veo 3.1

Google представив Veo 3.1 — оновлену модель для генерації відео з покращеним рендерингом руху, освітлення та камерної динаміки. Також з’явилися нові інструменти для творчості в Gemini API, орієнтовані на відео- та контент-креаторів.

🔸 Google AI Studio Apps

Google запустив AI Studio Apps — новий vibe-code продукт для створення AI-застосунків, схожий за концепцією на Bolt чи Lovable. Простий інтерфейс дозволяє швидко будувати, тестувати та публікувати власні AI-рішення.

🔸 DeepSeek представила революційну систему оптичного розпізнавання символів (OCR)

DeepSeek представила OCR-модель, яка стискає текст із зображень у 10 разів із збереженням 97% інформації — лише 64–800 токенів на сторінку проти тисяч у конкурентів. Працює на базі малої моделі DeepSeek3B-MoE, обробляючи до 200 тис. сторінок на день на одному Nvidia A100.
Простими словами: це, з одного боку, дуже крута OCR-модель для тих, хто займається цим напрямом. А з іншого боку, вона використовує новий підхід до завантаження токенів у LLM — тепер замість слів можна передавати шматочки зображення. Менше ресурсів, без втрати якості. І те, що це взагалі працює — просто вау.

🔸 Андрій Карпатий зарелізив Nanochat

Андрій Карпатий представив Nanochat — мінімалістичний, повний стек для тренування та інференсу власного ChatGPT-клону з нуля. Усе вміщується в ~8 тис. рядків коду без зайвих залежностей. Модель можна натренувати приблизно за 4 години на хмарному GPU і вже говорити з нею у вебінтерфейсі ChatGPT-стилю.

Проєкт охоплює всі етапи: від токенайзера й попереднього тренування до SFT, RL і простого inference-движка. Карпатий називає Nanochat «капстоун-проєктом» для курсу LLM101n, а також потенційною базою для експериментів і досліджень, як колись NanoGPT.

🔸 Професійні поради від грандмайстрів Kaggle з NVIDIA

Грандмайстри Kaggle з NVIDIA поділилися 7 перевіреними техніками для моделювання табличних даних — від feature engineering до ensemble-методів і оптимізації.

🔸 Як LLM може трансформувати традиційний маркетинг

LLM і традиційний маркетинг — несподіване, але вдале поєднання. Дослідники з PyMC Labs і Colgate-Palmolive показали, що LLM може замінити дорогі опитування споживачів у FMCG. Замість тисяч респондентів — скрипт, який ставить питання моделі, аналізує відповіді та відтворює результати з точністю до 90%.

Моделі (GPT-4o, Gemini Flash 2.0) реагують по-різному залежно від заданих демографічних параметрів: вік, дохід, категорія продукту. Найкраще метод працює для близьких до референсних продуктів, наприклад, шампунів чи дезодорантів.

Цікаво, чи вже хтось пробує цей метод у соціології чи політиці — тестування передвиборчих програм на моделях звучить як золота жила для розробників.

Корисні ресурси

Курси:

  • Google AI Agents Intensive (2025) — інтенсив від Google про створення та інтеграцію AI-агентів у продукти.
  • Поєднайте з Kaggle: 5-Day Generative AI Challenge — короткий гайд-курс із практичними вправами для роботи з генеративними моделями.

Відео:

  • AI Gold Rush — документальна серія про наймасштабніший хакатон у світі, змагання компаній у гонці за штучним інтелектом, історії засновників і технологічні прориви, що змінюють індустрію.
  • Best Practices for AI Evaluations — технічне відео про розробку якісних систем оцінювання моделей і метрик у ваших AI-проєктах.

На сьогодні це все. Дякую усім за увагу до дайджесту. Побачимось у наступному випуску вже за місяць — чекаємо на новини листопада.

Дізнатися більше про культуру і роботу в SPD Technology ви можете, підписуючись на наші акаунти в соцмережах: LinkedIn, Instagram, Facebook. А якщо ви в пошуках нових карʼєрних можливостей, запрошую переглянути наші відкриті ролі.

Подобається дайджест? Підписуйтесь акаунт автора вгорі сторінки, щоб отримувати сповіщення про нові випуски на пошту.

👍ПодобаєтьсяСподобалось8
До обраногоВ обраному4
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі