OpenAI запустила GPT-5.2
Невдовзі після того, як Сем Альтман оголосив «код червоний» в середині OpenAI через швидкий ріст конкурентів, компанія представила GPT-5.2 — нове покоління моделей ChatGPT.

Три нові моделі GPT-5.2
Серія GPT-5.2 складається з трьох різних режимів, оптимізованих під різні стилі роботи.
GPT-5.2 Instant — це найшвидша модель у лінійці, орієнтована на діалоги, короткі запити, оперативну аналітику та легкі кроки в агентах.
GPT-5.2 Thinking — це версія, яка дає найкращий баланс між швидкістю, глибиною мислення та можливістю розв’язувати задачі з багатьма проміжними кроками. Це модель, яка аналізує довгі документи, пише складні звіти, розбирається в юридичних чи фінансових текстах і керує інструментами послідовно та обґрунтовано.
GPT-5.2 Pro — топова версія з підвищеним міркуванням, оптимізована для найскладніших кейсів, таких як побудови моделей, розробки програмного забезпечення, складної математики, фінансових задач, академічних тестів та автономних агентів. Вона має доступ до максимального reasoning-режиму xhigh, що дозволяє моделі глибше розкладати задачі й стабільніше виконувати довгі ланцюжки міркувань.
У ChatGPT всі три моделі з’являються поступово. У API їх назви стандартизовані:
- gpt-5.2-chat-latest (Instant)
- gpt-5.2 (Thinking)
- gpt-5.2-pro (Pro)
Що кажуть бенчмарки
У внутрішніх і незалежних тестах GPT-5.2 демонструє ріст майже на всіх ключових векторах.
Професійні завдання
У комплексному бенчмарку GDPval, який моделює завдання з 40+ реальних професій, GPT-5.2 Thinking показує 70.9% перемог / нічиїх проти експертів.

Версія Pro показує ще вищі результати, особливо у сценаріях, де важливе структуроване мислення, наприклад фінмоделі, складні аналітичні таблиці, реляційні залежності між даними.
GPT-5.2 демонструє найкращі на ринку показники в SWE-Bench Verified (80.0%) та SWE-Lancer (74.6%).

У режимі з пошуком GPT-5.2 дає правильні відповіді у 93.9% випадків. Без пошуку — 88.0%.

GPT-5.2 значно краще читає графіки, складні візуальні структури, UI-скріншоти, наукові діаграми і PDF. Особливо помітне покращення в CharXiv reasoning, де модель показує +15 пунктів порівняно з GPT-5.1.
GPT-5.2 демонструє непогані результати на MRCRv2 у діапазоні до 256k токенів.
Наприклад:
- при 4—8k — 98.2%
- при 128k — 85.6%
- при 256k — 77.0%

OpenAI також робить окремий акцент на тому, що GPT-5.2 не просто краще пише тексти, вона краще виконує кроки. Модель стала стабільнішою у:
- виклику API,
- побудові послідовних планів,
- роботі з браузером у режимі Browse,
- використанні Python для обчислень,
- роботі з файловими даними та документами.
На Toolathlon та MCP-Atlas, завданнях, де моделі мають діяти як агенти, GPT-5.2 перевершує GPT-5.1 на десятки відсотків.

Окремо варто зазначити, що GPT-5.2 Thinking у бенчмарку ARC-AGI-2 («тест на людяність»), який є одним з найскладніших тестів на абстрактне мислення, показав 52.9%, в той час, як люди з нормальними розумовими здібностями, набирають ±60% в цьому тесті.
Ціни та економіка використання
У API ціни зросли, але загальна вартість досягнення результату — потенційно нижча.
GPT-5.2 (Thinking / Instant):
- $1.75 за 1M input токенів
- $14 за 1M output
- 90% знижка на кешовані токени
GPT-5.2 Pro:
- $21 за 1M input
- $168 за 1M output
- без кеш-знижки
Незважаючи на це, OpenAI заявляє, що завдяки підвищеній ефективності загальна вартість часто нижча, ніж у GPT-5.1.
Всі платні плани ChatGPT отримають GPT-5.2 поступово, а GPT-5.1 залишиться в режимі legacy ще на кілька місяців.

26 коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів