«Оновлений токенізатор, режим xhigh та ultrareview»: Anthropic представили Claude Opus 4.7

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Anthropic презентувала оновлену модель свого флагманського ШІ — Claude Opus 4.7.

Нова версія вже доступна для всіх бажаючих, а ціни залишилися на тому ж рівні, що і раніше.

Що змінилося

Найкраща модель для кодування (знову)

Традиційно, як заявляють розробники, модель стала значно кращою в розробці і запевняють, що тепер їй можна довіряти найнуднішу та найскладнішу роботу.

Також нова модель навчилася більш чітко слідувати промптам, аніж її попередник Opus 4.6.

Покращення машинного зору

Модельку також серйозно прокачали в аспекті розпізнання зображень. Тепер вона з легкістю може аналізувати картинки, до 2576 пікселів по довгій стороні, що десь втричі більше, аніж могли її попередники. Але через це модель їсть більше токенів, тому, якщо вам навпаки не потрібна деталізація, то стискайте картинку перед відправкою.

Також, як показують бенчмарки, у моделі покращили показники довготривалої пам’яті та мислення.

Безпека та кіберзахист

Як відомо, Anthropic нещодавно запустила проєкт Glasswing, який присвячений ризикам ШІ в кібербезпеці. Claude Opus 4.7 виступила в ролі полігона для тестування нових захисних фільтрів. Її хакерські здібності навмисно трохи приглушили, в порівнянні з Mythos Preview — моделю, яка настільки потужна, що її «ні в якому разі нікому не можна показувати на загал» :)

Але, якщо ви white hat або фахівець з кіббезу, то для вас створили окрему програму верифікації, щоб ви могли використовувати ШІ для легітимних тестів.

Нові інструменти та нюанси з токенами

У нову модельку вбудували нову команду — /ultrareview. Вона дозволяє виконати глибоке рев’ю проєкту, але зі значними обмеженнями — до трьох безкоштовних сесій і лише для тарифів Pro та Max. Крім того, компанія розширила автоматичний режим для користувачів Max.

Також, щоб ви могли краще керувати тим, як ШІ думає, в модель додали новий рівень зусиль — xhigh. Це типу золотої середини між high та max для складних завдань, коли потрібно, щоб модель добре подумала, але і не зависала занадто довго.

Але, як в одному старому і смішному анекдоті, є один нюанс. Через оновлений токенізатор і звичку моделі глибше копати на високих рівнях складності, вона споживає десь на 10–35% більше токенів за той самий обсяг тексту. У компанії правда кажуть, що загалом це все одно вигідніше, бо ШІ робить усе якісніше з першого разу, але перевірите це на практиці і скажете як вам :)

Через ці зміни Anthropic написали гайд по міграції, тому можете ознайомитися з ним перед тим, як повноцінно починати використовувати нову модель.

Детальніше про оновлення можете почитати на офіційному сайті Anthropic: www.anthropic.com/news/claude-opus-4-7.

Нагадаємо, що раніше користувачі почали масово скаржитися на погіршення якості відповідей Claude 4.6.

👍ПодобаєтьсяСподобалось5
До обраногоВ обраному0
LinkedIn
Ctrl + Enter
Ctrl + Enter

в ASCII диаграммах научился прямые линии рисовать? не? разбудите меня через 10 лет

Думаю чутки про деградацію нової моделі можуть бути правдивими, але я б дав трохи часу їм. На релізі воно завжди таке собі.

Скопіювати сюди релігія не дозволяє?

вибачте, пане Senior, не знав що у вас погодинна оплата за кожен клік мишкою. Куди скинути номер карти, щоб оплатити вам цей титанічний перехід за посиланням?

у мене ВПН, на реддіт не впускає

а отак одразу написати рiвень токсичностi не дозволяє?

TL;DR of the discussion generated automatically after 400 comments.

The community is overwhelmingly skeptical, believing Opus 4.7 is just the pre-nerfed version of 4.6 being re-released at a higher effective cost. You’ll likely burn through your weekly usage limit just reading this post, as that’s the number one complaint in this thread.

Here’s the breakdown of the drama:

Usage Limits & Cost: The new tokenizer uses up to 35% more tokens for the same input, which everyone sees as a stealth price hike. Users on all plans are reporting hitting their 5-hour and weekly limits after just a handful of prompts.

Major Regression: A highly-upvoted comment points out that long-context retrieval (MRCR benchmark) has tanked from 78.3% in 4.6 to just 32.2% in 4.7. An Anthropic dev explained they’re phasing out this benchmark, but users who rely on long context are seriously concerned.

Claude Code is Busted: Multiple users report that 4.7 is on a hair trigger, constantly flagging benign, simple code as “malware” and refusing to perform edits.

Downgraded Features: The “Extended Thinking” toggle in the web app has been removed and replaced with “Adaptive Thinking,” which you can’t control.

The Mythos Tease: People are getting really tired of Anthropic including the unreleased “god model” Mythos in benchmark charts, seeing it as a way to distract from 4.7’s regressions and inferiority to competitors like GPT-5.4 in some areas.

TL;DR of the discussion generated automatically after 400 comments.

The community is overwhelmingly skeptical, believing Opus 4.7 is just the pre-nerfed version of 4.6 being re-released at a higher effective cost. You’ll likely burn through your weekly usage limit just reading this post, as that’s the number one complaint in this thread.

Here’s the breakdown of the drama:

Usage Limits & Cost: The new tokenizer uses up to 35% more tokens for the same input, which everyone sees as a stealth price hike. Users on all plans are reporting hitting their 5-hour and weekly limits after just a handful of prompts.

Major Regression: A highly-upvoted comment points out that long-context retrieval (MRCR benchmark) has tanked from 78.3% in 4.6 to just 32.2% in 4.7. An Anthropic dev explained they’re phasing out this benchmark, but users who rely on long context are seriously concerned.

Claude Code is Busted: Multiple users report that 4.7 is on a hair trigger, constantly flagging benign, simple code as “malware” and refusing to perform edits.

Downgraded Features: The “Extended Thinking” toggle in the web app has been removed and replaced with “Adaptive Thinking,” which you can’t control.

The Mythos Tease: People are getting really tired of Anthropic including the unreleased “god model” Mythos in benchmark charts, seeing it as a way to distract from 4.7’s regressions and inferiority to competitors like GPT-5.4 in some areas.

Задачу про мийку машини 4.7 провалив. А 4.6 її вже вивчив.

Підписатись на коментарі