«Роздумує» швидко: Google релізнули Flash Thinking і вона вже отримала симпатії від користувачів

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

«Думає», але швидко

Google випустив у реліз нову модель — Gemini 2.0 Flash Thinking. Разом із нею вийшли «Про» версія (тільки для платних підписників) та прискорена Flash. Усіма нейромережами вже можна скористатися у браузері та у додатку.

Flash Thinking можливо не така потужна, як Gemini 2.0 Pro, але у неї є свої переваги: вона водночас вміє «думати» та вона швидка.

Не бенчмарками єдиними

На багатьох тестах модель показала себе просто гарно. Не вийшла в лідери, але із флагманами порівнялась:

  • На науковому екзамені GPQA-Diamond вона досягла 74.2%, перевершивши DeepSeek-R1 (71.5%), але поступившись o1 (77.3%).
  • На математичному тесті AIME 2024 модель набрала 73.3% Вона відстає від DeepSeek-R1 (79.8%) та o1 (74.4%). Наче і не дуже круто, але минула Flash версія мала лише 35.5%, тому прогрес суттєвий.
  • На тесті з розуміння візуальної та мультимедійної інформації MMMU вона досягла 75.4%, перевершивши попередню версію (70.7%), але поступившись o1 (78.2%).

Але, попри бенчмарки, на LMArena Gemini 2.0 Flash вийшла переможцем. Це свідчить про те, що користувачі віддали їй перевагу перед o1 та DeepSeek-R1 — принаймні для звичайних, щоденних запитів.

Додатково: у таблиці вказана експериментальна ітерація моделі, яка була буквально перед релізом.

Ще одна цікава особливість моделі — вона має контекстне вікно у мільйон токенів. У поєднанні із здібністю"роздумувати" це дозволяє обробляти, наприклад, увесь код у проєкті одночасно.

На відміну від o1, яка приховує ланцюжок думок, нейромережа від Google включає свої роздуми у відповідь. Але, у модель о3 від OpenAI вже додали цю особливість — вона показує свій хід думок користувачу.

👍ПодобаєтьсяСподобалось3
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі