Google представила Gemini 3

Google офіційно представила Gemini 3 — найінтелектуальнішу модель в історії компанії, яка робить роботу з ШІ ближчою до творчої співпраці з людиною, ніж будь-коли раніше.

Акцент не на кількості токенів, а на глибині розуміння

У Google наголошують, що головна зміна — це не швидкість чи обсяг параметрів, а глибина розуміння. Gemini 3 навчається з урахуванням інструкцій, усвідомлює типи користувачів і адаптується до різних професійних ролей. Модель не просто генерує текст, а утримує багаторівневий контекст, пам’ятає про мету користувача та може працювати довгими сесіями без втрати логіки.

На практиці це означає, що інженерам більше не потрібно повторювати вимоги, продактам — розжовувати деталі, а аналітикам — уточнювати кожен крок. Gemini 3 відстежує стан задачі так само, як це робить колега в команді.

Нові режими

Google презентувала кілька ключових режимів:

  • Creator Mode — для митців, авторів, дизайнерів та маркетологів. Генерує сценарії, мультфільми, музику, контент для соцмереж у цілісному стилі.
  • Engineer Mode — найамбітніший режим: інструмент для програмістів, який може проєктувати архітектури, створювати цілі застосунки та проводити рефакторинг на рівні середньої інженерної команди.
  • Smart Query — інструмент для швидкого аналізу великих обсягів інформації, який відповідає не просто за ключовими словами, а через реальне розуміння змісту.
  • Personal Mode — адаптивний режим, що вивчає стиль, професію та потреби користувача.

Разом вони формують платформу, яка охоплює всі етапи роботи від ідеї до створення продукту.

Найбільший прорив Gemini 3 — це Engineer Mode. Google заявляє, що модель може генерувати проєкти з нуля, пропонує оптимізовані рішення, розуміє контекст кількох файлів і взаємодію компонентів, працює з великими репозиторіями без обмежень на довжину контексту, тестує, деплоїть, генерує документацію та навіть проводить аудит безпеки.

Покращена пам’ять та увага

Попередні покоління моделей страждали від втрати довготривалої пам’яті, але Gemini 3 отримав нову систему контекстного управління, яка поєднує короткочасну робочу пам’ять із довготривалими вбудованими векторами, використовує персональні профілі користувача та вміє зберігати стан задачі між сесіями.

Gemini 3 може працювати одночасно з текстом, зображеннями, відео, структурованими даними, кодом, файлами великого обсягу.

Модель може аналізувати відеозаписи лекцій, креслення, фінансові таблиці, Git-репозиторії та складні документи. Вона будує зв’язки між медіа так само природно, як людина.

Google інтегрує Gemini 3 у Workspace, Android та ChromeOS. Модель може дописувати листи з урахуванням корпоративних правил, генерувати аналітику у Sheets, створювати презентації з даних, пояснювати матеріал в реальному часі та адаптивно допомагати студентам і викладачам.

Оновлені стандарти безпеки та нові інструменти для розробників

Gemini 3 отримала оновлену систему AI Safety, що включає розширене фільтрування небезпечних інструкцій, нові механізми відстеження галюцинацій, контроль суб’єктивних тверджень і перевірку технічної коректності під час генерації коду, при цьому Google підкреслює, що модель може пропонувати ідеї, але не ухвалює рішень за користувача в критичних областях.

Компанія також відкрила Gemini 3 API, орієнтовані SkillPath-завдання для постановки моделі довготривалих цілей, підтримку довгих сесій через Memory API та контекстні агенти для командної роботи.

На фоні цих новин акції Google вже пішли вгору.

Бенчмарки

Gemini 3 Pro демонструє шикарні результати на численних AI-бенчмарках. Вона перевершує Gemini 2.5 Pro за всіма ключовими показниками, зокрема очолює LMArena Leaderboard із рекордним рейтингом 1501 Elo.

Модель показує PhD-рівень міркування з результатом 37,5% на Humanity’s Last Exam без використання будь-яких інструментів та 91,9% на GPQA Diamond.

У математиці Gemini 3 встановлює новий стандарт на MathArena Apex із результатом 23,4%.

Щодо мультимодального мислення, модель досягає 81% на MMMU-Pro та 87,6% на Video-MMMU, а також демонструє 72,1% на SimpleQA Verified, що підтверджує високий рівень фактичної точності.

Для кодування та агентних завдань Gemini 3 показує 1487 Elo на WebDev Arena, 54,2% на Terminal-Bench 2.0 та 76,2% на SWE-bench Verified, демонструючи виняткову здатність працювати з інструментами та складними промптами.

Режим Gemini 3 Deep Think ще більше підвищує продуктивність, досягаючи 41,0% на Humanity’s Last Exam, 93,8% на GPQA Diamond та 45,1% на ARC-AGI-2 з виконанням коду, демонструючи здатність вирішувати нові складні завдання.

Відеопрезентацію Gemini 3 від Google можете переглянути за цим посиланням 👇

👍ПодобаєтьсяСподобалось7
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Не Gemini3 але ChatGPT несподівано згодився для швидкого задуплення, одного відомого когута Олександра Орловського та якогось його підкогуття.
python + якась кацапська база
prnt.sc/P8k09mCPWdyR (на скріні не Орловський)

Дуже перенавчана, що, напевно, добре для більшості з типовими задачами, але погано для нетипових. Проявляється у тому, що якщо ти просиш робити щось нетипове, вона зробить типове, і скаже, що це тут краще. І на мати не реагує, точніше швидко забуває.

Таке враження що вона робить те що вміє, а не те, що попросили.
По-ходу натаскали щоб бенчмарки проходила, а не реальні задачі вирішувала.

Погрався сьогодні трохи на своїх задачах. Gemini стала юзабельною в агентському режимі, но, якось туго слідує інструкціям. Короче можна використовувати в парі з іншими моделями, но не як основну.

Думав потрібно буде доплачувати зі її використання, а ні, вони просто замінили нею версію 2.5

О щойно з’явилась ця версія в мене, буду сьогодні тестити :)

Розкажеш потім як воно в порівнянні з попередніми версіями)

За півдня можу сказати, що набагато більше подобаються відповіді, якщо до цього якісніше мені відповідав гпт, хоча у мене була про версія джеміні, то зараз може і трошки краще джеміні. Буду далі дивитись :)

Насправді в джеміні є одна кілер фіча, про яку мало хто говорить — можливість переказувати суть відео на ютуб. Це штука, яка реально економить багато часу.

На цю тему є ще класне розширення для гугл — glasp youtube summary, в налаштуваннях можна задати свій промпт і потім з відео на ютуб одною кнопкою одразу перейти в гпт, джеміні чи інші і воно автоматично закине туди транскрипцію відео із промптом ( наприклад ключові поінти тільки), кілька секунд і готово)

Транскрипцією я і раніше користувався, але якщо вставити посилання на відео в промпт Gemini, то воно схоже якщо і не аналізує саме відео повністю, то дивиться ключові кадри і в короткому описі враховує саме відео і також метадату. До того ж схоже краще ніж по транскрипції розуміє, яка людина говорить певну репліку.

Так що там пересказувати? Там по АРІ можна отримати транскріпт будь-якого відео і закинути його в будь-яку ллмку. Чи в тому плані що чат інтерфейс нейтівно це підтримує?

Я на вайбкодив бота який «дивиться» канали (грузить транскріпти) по сток маркету, чистить контент з допомогою ллм-ок, екстрактить аттрибути, індексує, потім це все підключається до агентів які можуть по ним відповідати, пересказувати, робити ресьорч. Короче не треба тратити час і дивитися кілька десятків каналів.

Вона хитро працює насправді, вона не відео читає пететворюючи його на текст і потім пересказуючи, а бере знегенровані субтитри (якщо вони є) і потім по ним пересказує. Якщо ж такого тексту до відео нема то ця фіча не працює

А пам’ятаєте як чатжпт 5 зробив революцію і став проривом в ШІ? Отут так само буде!

Судячи з всього це гугловський варіант GPT 5 і Sonnet 4.5. Надіюсь буде більш близький до кокнурентів ніж джеміні 2.5 до гпт 4.5 і соннет 4

Ну бомба, хай запускають скоріше, бо мені на git pull приходить помилка 500.

Підписатись на коментарі