Відбулась презентація Google I/O: огляд найцікавіших новинок

Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!

Друга ніч поспіль майже без сну на капітанському містку. Щоправда, якщо вчора Капітан мало спав через перезбудження справді шикарною презентацією від OpenAI, то сьогодні я не сплю тільки тому, що намагаюся хоч якось видавити щось цікаве з нудної презентації Google I/O.

Це було дуже погано, чесно. Google і Сундар Пічаі ніколи не вміли в презентації, і я не пам’ятаю жодної цікавої Google I/O останнім часом, але сьогодні, на контрасті з OpenAI, це виглядало ще гірше. Давайте по черзі.

➖ Анонсували Gemini 1.5 Pro. Контекстне вікно підняли з 1М до 2М токенів (Це правда круто! Моя повага, тут є чим пишатися, знімаю капелюха!). Показали, як модель може працювати з Gmail, написати чернетку, читати вкладення й так далі.

➖ Анонсували Gemini 1.5 Flash. Як випливає з назви, націлена на мінімальну затримку відповіді. Сумнівно, але припустимо.

Агенти! Ось це функціональність, ось це круто, згадую 2018... Ну пам’ятаєте, як Google обіцяли, що ось ще пів року і можна буде в автоматичному режимі вирішувати побутові проблеми? Записатися в перукарню, оформити повернення товару?

Так ось... Так, нам показали практично те саме і теж пообіцяли, що колись це буде працювати. Побалакаємо про це ще років через 5.

➖ Показали кілька демок з телефонів про роботу Gemini Live ака Project Astra та вже згадені агенти — мультимодальна ШI, яка працює у зв’язці з камерою. Вміє давати відповіді на запитання про те, що зараз бачить, вирішувати технічні і не тільки задачки, визначати предмети у realtime, шукати їх, надавати додаткові деталі, спілкуватися з вами тощо.

І ніби як цікаво, але все це показали в OpenAI вчора, тільки краще, швидше, цікавіше. Віддам належне Google, у них подібна штука буде ще вбудована в окуляри. Ідея чудова, чесно, користуючись нагодою, передаю привіт Google Glass.

➖ Показали Imagen 3 — модель для генерації картинок. Справді непогано: фотореалізм, уміння генерувати текст на картинці, детальки — все на місці. Мені сподобалось.

Veo — модель для генерації відео, конкурент SORA. Робить FullHD відоси, може довжиною понад 60 секунд, щоправда, чомусь багато відеоприкладів усього по 8 секунд, але є і по 80. На перший погляд, прикольно, але без вау-ефекту, як було з SORA свого часу.

Gemini App, як ChatGPT з GPTs, тільки Gemini з Gems. Там навіть UI майже такий самий.

➖ Показали нове залізо — TPU 6th gen Trillium. Усе як завжди — потужніший, сильніший і ефективніший. Кажуть, про приріст у чотири рази. Своє залізо для ШI — це лайк 👍

Зі смішного — сказали, що в них теж аудіо асистент на все реагує, щоправда, от не показали цього ніде. Ставлю $1, що просто додали після OpenAI, ну мов не гірше, ви головне повірте, якось потім покажемо.


Загалом, на фото видно реакцію глядачів, а у Капітана вона була ще гіршою. На презентації реально були моменти, коли працівники Google чекали оплесків, а зал просто позіхав.

Gemini обіцяють запхати в усі дірки, ну аби був, навіть не розуміючи, а чи потрібен він там реально. Водночас, правда, обіцяють це зробити «колись вже скоро, ось-ось, сподіваємося цього року, а може наступного, але дуже скоро».

Ще у мене склалося враження, що OpenAI з Apple будуть тепер представляти Siri, яка буде співставлена з Gemini на Android. І таке змагання — це цікаво, бо конкуренція завжди на користь користувачам.

Але ось питання: як це все буде працювати з точки зору приватності та обробки даних? Бо виглядає, що для багатьох функцій подібні асистенти повинні будуть слухати вас постійно. Поки не ясно.

Ще туз в рукаві Google — це те, що Gemini, по суті, безкоштовний, і буде вбудований в усі наші повсякденні продукти — Chrome, Gmail, Drive тощо. Як казав Патрік і Планктон у Спанч Бобі: «Якщо хочеш здатися розумним, потрібно кричати голосно».


До речі, якщо вам цікаво читати подібні новини, огляди та просто корисну інформацію зі світу IT та High-Tech щодня, то приєднуйся до телеграм-каналу автора під назвою «Затишна Галера», там лампово і багато цікавого.


А якщо ви хочете написати огляд, блог або техстаттю на якусь з фіч, пишіть на [email protected].

👍ПодобаєтьсяСподобалось3
До обраногоВ обраному1
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Дякую за огляд.
Спочатку жалкував, що цього року пропустив захід. Тепер не жалкую )

Жалкувати там 100% нема чого :)

Але ось питання: як це все буде працювати з точки зору приватності та обробки даних? Бо виглядає, що для багатьох функцій подібні асистенти повинні будуть слухати вас постійно. Поки не ясно.

А це відповідь тим, хто в сусідньому топіку жаліється що в айпад сильно потужний чіп поставили, що планшетам і телефонам такі чіпи не треба. Якраз треба щоб можна було локально моделі крутити а не на сервера свої дані слати для обробки. І до цього чіпам ще рости і рости.

Підписатись на коментарі