OpenAI запускає o1 — модель, що пише код гри «Змійка», вирішує складні рівняння за 30 секунд та мислить, як людина
Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!
OpenAI випускає нову модель під назвою o1, яка стане першою у серії моделей, тренованих на тому, щоб відповідати на складні запитання швидше, ніж це може зробити людина. Разом з нею випускається й o1-mini — менша та дешевша версія.
Для OpenAI модель o1 — це крок до штучного інтелекту, який нагадуватиме людину. Але практично це ще й покращений код та розв’язання багатоступеневих задач порівняно з попередніми моделями. Проте вона й дорожча, і повільніша у використанні, ніж GPT-4o. OpenAI називає цей випуск o1 «попереднім переглядом», щоб підкреслити, наскільки все ще нова ця штука.
Користувачі ChatGPT Plus і Team можуть скористатися як o1-preview, так і o1-mini вже сьогодні, а для Enterprise та Edu доступ відкриється наступного тижня. В OpenAI також планують дати доступ до o1-mini безкоштовним користувачам ChatGPT, але точну дату ще не визначили. Для розробників о1 буде дорогою радістю: в API o1-preview коштує $15 за 1 мільйон вхідних токенів і $60 за 1 мільйон вихідних токенів. Для порівняння, GPT-4o коштує $5 за вхідні і $15 за вихідні токени.
Навчання o1 кардинально відрізняється від попередників, каже головний дослідник OpenAI Джеррі Творек. Модель тренували на новому алгоритмі оптимізації та нових даних, створених спеціально для неї.
Раніше GPT моделі тренували на копіюванні патернів з даних. Але o1 навчили вирішувати задачі самостійно за допомогою навчання з підкріпленням (це коли система отримує нагороди або покарання). Вона також використовує «ланцюжок думок», схожий на те, як люди обробляють проблеми, проходячи їх крок за кроком.
Завдяки новому підходу модель має бути точнішою. «Ми помітили, що ця модель менше галюцинує,» каже Творек, хоча ця проблема все ще є. «Ми не можемо сказати, що вирішили проблему галюцинацій.»
Основна відмінність цієї моделі від GPT-4o в тому, що вона краще справляється зі складними завданнями, як-от програмування та математика, і при цьому пояснює свої думки.
«Модель точно краще вирішує тест з математики для старшокласників, ніж я,» — каже головний дослідник OpenAI Боб МакГрю. OpenAI також протестувала o1 на відбірковому іспиті для Міжнародної олімпіади з математики, і якщо GPT-4o вирішив лише 13% завдань, то o1 справився з 83%.
На змаганнях з програмування Codeforces ця модель досягла
Проте o1 ще не така крута, як GPT-4o в багатьох сферах. Вона гірше знає факти про світ і не може переглядати веб чи працювати з файлами та зображеннями. Але OpenAI вважає, що це новий клас можливостей. Модель назвали o1, щоб показати «перезавантаження лічильника на 1».
На демонстрації мені показали, як модель вирішує таку задачу:
"Принцеса такого віку, як принц буде, коли принцеса стане вдвічі старшою за принца, коли принцеса була наполовину старша від суми їхніх теперішніх віків. Скільки років принцу і принцесі?"
Модель думала 30 секунд і потім видала правильну відповідь. В OpenAI створили інтерфейс, що показує кроки міркування моделі під час вирішення. Мене здивувало не те, що модель «показала роботу», — GPT-4o теж може це зробити, якщо його спитати. Але o1 імітує думки людини так детально, що навіть використовує фрази на кшталт «мені цікаво», «я думаю» або «гаразд, давай подивимось» 🤔.
OpenAI каже, що не прирівнює «думки» моделей до людських думок. Але інтерфейс має показувати, як модель витрачає більше часу на глибоке оброблення та вирішення проблем. «Є моменти, коли вона здається більш людською, ніж попередні моделі,» — каже Творек.
Теперішні великі мовні моделі не такі вже й «розумні». Вони просто передбачають послідовності слів, щоб дати відповідь. Наприклад, ChatGPT часто помиляється, коли говорить, що в слові «strawberry» є лише дві «r», бо модель не розбирає слово правильно. Але нова модель o1 таки відповіла правильно.
79 коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів