AGI, відеогенератори та роботи: Що очікує на ШІ у 2025 році
У OpenAI кажуть про створення AGI у 2025
У травні 2024 OpenAI випустив GPT-4o із фокусом на мультимодальність — на той момент модель здавалася значно розумнішою за ту ж саму
А вже через пів року після релізу GPT-4o, у вересні, OpenAI випускають потужну О1 (та О1-mini), яка під час тестувань виявилась до бентежного розумною.
У грудні з’являється ще розумніша модель О3, яка перевершила попередницю, подолавши неможливий для ШІ тест ARC AGI. Це, звісно, не означає, що вже створений справжній генералізований інтелект, ні.
Але розробникам вдалося подолати дуже важливий рубіж і вони вже почали пророкувати створення справжнього AGI в 2025 році.
Президент ARC AGI під час релізу О3 вже заявив про створення нових, складніших бенчмарків для моделей. У той момент, коли модель зможе подолати будь-який тест, її дійсно вважатимуть AGI.
Ще до релізу О1, О3 та навіть GPT-4, півтора року тому, почалась робота над ChatGPT-5 — і кінця та краю їй поки що не видно. Численні звільнення у OpenAI не роблять роботу простішою чи швидшою.
Чому реліз GPT-5 може виявитися цікавішим за появу О3 — це масовість. О3 звісно гарна, але прайс у 2000$ робить її дещо «елітарною.
Генерація відео: Прогрес дуже швидкий, але ще є куди рости
Лише місяці тому ми бачили сюрреалістичні відео: нейромережі монтували як люди їдять та п’ють. Це виглядало кумедно, дивно, і навіть трошечки страшно. Усім, наприклад було цікаво як Вілл Сміт їсть спагеті — навіть самому Віллу Сміту:
@willsmith This is getting out of hand! #aivideo #sora ♬ original sound — Will Smith
За останні пів року моделям вдалося подолати величезну прірву, і зараз відео генерація виглядає краще. Так, вона ще не ідеальна, але прогрес просто титанічний.
OpenAI, наприклад, релізнули наприкінці року відеогенератор Sora для Plus підписників. Вже у грудні вийшла Sora Turbo — краща та легша. На Різдво навіть знімали ліміти на генерацію відео, що сигналізує нам про масовість продукту.
Крім Sora, звісно, існує багато аналогів і найвидатніший — це Veo 2 від Google. Дуже красиво, але поки що не дуже доступно.
Очевидно, що користувачі прохають у розробників Veo: показати як Вілл Сміт їсть спагеті.
Роботи, роботи, роботи
Тренд на автономність: Хоча моделі як GPT і Claude, домінують у заголовках новин, неабияку увагу у роботехніці приділяють невеликим спеціалізованим моделям. Лише за тиждень до кінця року було випущено ModernBERT — дуже швидку та ефективну у питаннях пам’яті. Модель будуть донавчати під свої потреби, і у специфічних завданнях вона не буде поступатися нейромережам-гігантам.
Крім цього, нещодавно NVIDIA випустила дуже потужний та бюджетний комп’ютер для ШІ — Jetson Orin Nano Super. Його дизайнерський задум, його цільове використання: автономна робота невеличкої моделі у роботі.
Щодо навчання роботів: нещодавно науковці із топ-університетів створили симулятор фізики, який дозволяє роботам «вивчити кунг-фу» за лічені години. А якщо серйозно: він дозволяє скоротити час навчання роботів з років до хвилин. А також можна робити реалістичні відео та ассети для відеоігор — і це також красиво.
Крім цього, останнім часом зростає тренд на обмін знаннями між роботами, що дозволяє вчитися на досвіді один одного. Наприклад, робот Stretch від Boston Dynamics вже застосовує спільне навчання — він займається обробкою матеріалів на складах.
Сила-силенна агентів та ШІ-помічників: це і Project Astra (візуальний асистент), Project Mariner (розширення для Chrome, що керує браузером) та Jules (агент для допомоги розробникам). І це лише приклади того, що працює на базі Gemini 2.0.
Крім цього, OpenAI готується до запуску нового агенту штучного інтелекту під кодовою назвою «Operator», який зможе виконувати дії на комп’ютері від імені користувача. До цього, Anthropic випустив схожого агента, що в реальному часі обробляє інформацію на комп’ютері користувача.
У DeepLearning загалом кажуть про зростання тренду на ШІ-агентів. Тому, великі (та не дуже) моделі будуть пристосовувати під потреби розробників. Про це сигналізує створення «безпечних» бібліотек для агентів від фінансових платформ. Також гарним «прапорцем» є можливість НЕ користуватися додатковими «костурами», щоб, наприклад, нейромережа дізналась час у певній точці земної кулі.
Питання безпеки
Щодо захисту: нещодавно проєкт Google під назвою «Big Sleep», який вперше знайшов реальну вразливість у коді. Тут цікаво те, що проблему виявили ще до появи в офіційному випуску.
Як зазначають самі розробники, головна ціль таких агентів-захисників у тому, що баги будуть виправлятися ще до того, як зловмисники встигнуть їх використати. Подібні ідеї можна побачити у команді IBM Research: там вже тестують набір агентів штучного інтелекту, які виявлятимуть баги у коді на GitHub.
Щодо небезпеки: скандальний випадок, коли О1 «брехала» розробникам, хоча її про це ніхто не просив. Автори дослідження зазначили, що зараз ситуація не дуже бентежна, бо сучасні моделі ще не настільки потужні, щоб завдати реальної шкоди. Втім, директор команди дослідників Маріус Хобан виказав занепокоєння саме щодо майбутніх, розумніших моделей.
На фоні появи О3, яка пройшла AGI тести, заяви науковців вже стають значно менш абстрактними. Це усвідомлюють і в OpenAI, тому реліз О3 може бути відкладений через безпекові тестування.
І це далеко не всі сфери використання ШІ: Тут варто згадати, і появу людиноподібних роботів від Tesla, прогрес підводної та космічної робототехніки у NASA, цікавий тренд на «роздуми» у моделях та багато іншого.
А що думаєте ви? Чи чекати нам справжнього AGI у 2025? Чи безпекові ризики від моделей на кшталт О3 реальні? Діліться своїми думками та побажаннями на наступний рік у коментарях! Автор ось, наприклад, мріє, щоб були роботизовані колонії на Марсі, а безробіття у 40% не було.
2 коментарі
Додати коментар Підписатись на коментаріВідписатись від коментарів