“Citius, Sapientius, Melius”: Anthropic представила нову флагмантську модель Claude Opus 4.6
Компанія Anthropic випустила оновлення своєї флагманської моделі — Claude Opus 4.6.
Нова модель навчилася довше тримати фокус на складних агентних задачах і краще орієнтується у великих кодових базах. Також вперше для Opus-моделей з’явилося контекстне вікно на 1 мільйон токенів (в бета-режимі).
Модель ретельніше планує свої дії, частіше переглядає власні міркування перед фінальною відповіддю і краще ловить помилки під час рев’ю та дебагінгу. Внутрішні тести Anthropic показали, що Opus 4.6 стабільніше поводиться у довгих сесіях і не так швидко втрачає нитку розмови, як попередні версії.

За результатами бенчмарків модель одразу показала найкращий результат у Terminal-Bench 2.0 — тесті на агентне програмування, та очолила Humanity’s Last Exam, складний міждисциплінарний іспит на міркування. В Anthropic також кажуть, що на GDPval-AA, який оцінює продуктивність у фінансах, праві та інших сферах економічно цінної інтелектуальної праці, Opus 4.6 випереджає найближчого конкурента (GPT-5.2 від OpenAI) приблизно на 144 Elo.

Важливі зміни торкнулися і API. З’явилася функція Context Compaction, яка дозволяє моделі самостійно резюмувати історію діалогу, відкидаючи несуттєві деталі. На думку творців це має вирішити проблему лімітів у довгих сесіях та зекономити токени. Також розробники отримали більше контролю над поведінкою моделі через новий параметр effort. Тепер можна регулювати, наскільки глибоко модель має задумуватися над завданням, обираючи між швидкістю виконання та якістю міркувань залежно від складності запиту.
Також до 16 лютого Claude вирішили подарувати всім тим, в кого є підписка, по $50.

Вам просто треба зайти у «usage dashboard» та натиснути «claim».
Модель вже доступна для використання через веб-інтерфейс та API. Базова вартість токенів залишилася на рівні попередників ($5 за мільйон вхідних та $25 за мільйон вихідних), проте для промптів, що перевищують 200 тисяч токенів, діятиме підвищений тариф.
9 коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарівОпус хорош только для тех ... за кого оплачивают доступ. Для работ типа самому попробовать очень дорого выходит
Уффффффф. Это как повысить процент сахара в кока-коле.
да, да, мы помним, еще3-6 месяцев и все, руками код никто трогать не будет.
мы вот на неделе попробовали с помощью Gemini Pro и коммерческой версии ChatGPT простую диаграмку на четыре кубика нарисовать.
весь этаж от смеха катался.
Ну намалювати діаграмку та згенерувати код — це ж зовсім різні речі. Не скажу, що ідеально, але Gemini Pro зараз дуже непогано працює в аспекті розробки. Та й в плані створення візуалів він мені подобається, але є нюанс, що візуали, які мені треба — це ніяк не діаграми. Зазвичай на них немає тексту і там не треба сувора точність
ну конечно, нарисовать четыре кубика сильно сложнее, чем написать правильный код по требованиям.
подумаешь — код написать... каждая кухарка сможет.
Не скажу, що для людей код написати легше, аніж 4 кубика накалякати. Але для ШІшки так, легше. У кода є чітка структура, усталені практики, алгоритми, тому для них це значно легше, ніж візуалізувати картинку
Claude Code + Opus — це як синьор. Інші — як джуни під наглядом.
Вже тестую
Розкажете потім чи відчуваєте покращення)