«Роздумує» швидко: Google релізнули Flash Thinking і вона вже отримала симпатії від користувачів
«Думає», але швидко
Google випустив у реліз нову модель — Gemini 2.0 Flash Thinking. Разом із нею вийшли «Про» версія (тільки для платних підписників) та прискорена Flash. Усіма нейромережами вже можна скористатися у браузері та у додатку.
Flash Thinking можливо не така потужна, як Gemini 2.0 Pro, але у неї є свої переваги: вона водночас вміє «думати» та вона швидка.
Не бенчмарками єдиними
На багатьох тестах модель показала себе просто гарно. Не вийшла в лідери, але із флагманами порівнялась:
- На науковому екзамені GPQA-Diamond вона досягла 74.2%, перевершивши DeepSeek-R1 (71.5%), але поступившись o1 (77.3%).
- На математичному тесті AIME 2024 модель набрала 73.3% Вона відстає від DeepSeek-R1 (79.8%) та o1 (74.4%). Наче і не дуже круто, але минула Flash версія мала лише 35.5%, тому прогрес суттєвий.
- На тесті з розуміння візуальної та мультимедійної інформації MMMU вона досягла 75.4%, перевершивши попередню версію (70.7%), але поступившись o1 (78.2%).
Але, попри бенчмарки, на LMArena Gemini 2.0 Flash вийшла переможцем. Це свідчить про те, що користувачі віддали їй перевагу перед o1 та DeepSeek-R1 — принаймні для звичайних, щоденних запитів.
Додатково: у таблиці вказана експериментальна ітерація моделі, яка була буквально перед релізом.
Ще одна цікава особливість моделі — вона має контекстне вікно у мільйон токенів. У поєднанні із здібністю"роздумувати" це дозволяє обробляти, наприклад, увесь код у проєкті одночасно.
На відміну від o1, яка приховує ланцюжок думок, нейромережа від Google включає свої роздуми у відповідь. Але, у модель о3 від OpenAI вже додали цю особливість — вона показує свій хід думок користувачу.
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів