Відмова від «чатів» та кінець епохи «німого кіно»: Прогноз на 2025 рік від ШІ-спеціалістів
Кінець епохи «німого кіно»
Наприкінці 2024 року багато компаній, у тому числі техногіганти як Google та OpenAI випустили свої відеогенеративні моделі. Побачила реліз Sora, яка на Різдво отримала необмежені ліміти на генерацію. Дійсно вразив Veo-2 від Google, відео якого вже дійсно важко відрізнити від реальних кадрів.
Про якість можна сперечатись, виділяти фаворитів, та шукати «нішеві» зони використання моделей. Однак, усі генеративні відео-нейромережі мають одну спільну рису — вони «німі».
Паралельно, чималий розвиток пройшли аудіо моделі — і ці технології, можуть і будуть використані у комбінації із відеогенераторами.
«У наступному році я з нетерпінням чекаю на моделі, які створюватимуть відеокліпи, доповнені звуковими доріжками, включаючи мову, музику та звукові ефекти. Я сподіваюся, що ці моделі започаткують нову еру кінематографічної творчості», — пише співзасновник Udio Девід Дінг.
За його словами, у певний момент може виявитись, що для генерації повнометражного фільму достатньо мати лише сценарій картини. На думку Дінга, хоча така перспектива може бути тривожною для митців, ефективність нових інструментів буде сильно залежати від майстерності автора:
«Мистецтво — це насамперед творчі рішення, які в нього вкладаються. І ви, і я можемо використовувати Midjourney, щоб створити зображення пейзажу, але якщо ви митець і маєте чітке уявлення про те, який пейзаж хочете побачити, ваш результат у Midjourney буде більш вражаючим, ніж мій», — зазначає співзасновник Udio.
Відмова від «чатових» моделей
Окремі спеціалісти висловлюють думку, що «чатовий» спосіб взаємодії із моделями буде потрохи заміщуватися. Одним із доволі визначних маркерів є орієнтир на мультимодальність — це те, на чому побудована GPT-4o, це одна із її найвизначніших особливостей — можливість працювати одразу у багатьох форматах (аудіо, зображення, текст).
«Сподіваюся побачити агентів ШІ, які працюють у фоновому режимі, непомітно допомагаючи нам із повсякденними завданнями. Вони підказуватимуть контекст, коли ми ухвалюватимемо рішення, і допомагатимуть вчитися в умовах змінюваного світу. Я чекаю на день, коли зможу впевнено відійти від клавіатури», — пише Джозеф Гонсалес, професор UC Berkeley.
Імовірно, цей тренд буде і надалі посилюватися — і розвиток відео генеративних моделей цьому чимало посприяє. Справді якісний тандем цих технологій ще попереду, і не факт, що «прорив» варто очікувати саме у 2025 році.
Вік «загального» ШІ
У Microsoft та OpenAI свої погляди на «суперінтелект»: коли ШІ почне заробляти стільки-то мільярдів долларів на рік, тоді ми будемо його вважати «суперрозумним». З одного боку це наче об’єктивна оцінка, а з іншого — відчувається, що цю метрику вигадала саме корпорація.
Професор Джозеф Гонсалес зазначає, що AGI вже давно існує, просто ми цього не помітили:
«Я розумію, що це спірно, але вважаю, що ми вже досягли AGI, принаймні з погляду визначення: наш ШІ тепер є загальним. Я залишаю довшу дискусію про свідомість і суперінтелект філософам, а сам зосереджуюся на ключовій інновації — загальності», — пише Гонсалес.
За його словами, в останнє десятиліття, ШІ часто перевершував людину — але у нішевих, дуже вузькоспеціалізованих завданнях (наприклад, розпізнаванні зображень чи рекомендації контенту). Це було дуже здорово, але нинішні моделі сильно відрізняються від своїх попередників. Тепер нейромережі можуть виконувати дуже широкий спектр завдань — на рівні людини, інколи краще.
Думку професора також сильно підтримують нещодавні пройдені AGI-тести моделі О3 — модель все ще не вважають справжнім AGI у ширшій аудиторії.
Автономність та спеціалізація
Також у 2025 році прогнозують тренд на малі, вузькоспеціалізовані моделі. Про це свідчать випуск ModernBERT та потужного комп’ютера для ШІ від NVIDIA — Jetson Orin Nano Super.
«Ми прогнозуємо значне зростання кількості менших, налаштованих моделей, створених для конкретних і часто дуже вузьких випадків використання та застосувань, аж до рівня окремих завдань. Саме тут розкриється справжній потенціал генеративного ШІ», — каже Ганно Бассе, технічний директор Stability AI.
За його словами, це найбезпечніший і найвідповідальніший спосіб впровадження генеративного ШІ у реальних проектах, бо він буде виконувати одну, специфічну функцію.
І це ще не всі прогнози щодо майбутнього ШІ у 2025 році. А що думаєте ви? Діліться своїми думками!
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів