Ми на порозі вибуху самовдосконалення ШІ?
Нещодавно три дослідницькі групи з Meta, Anthropic та OpenAI оприлюднили результати своїх досліджень, пов’язаних зі створенням самовдосконалюваних алгоритмів.
Meta та OpenAI досліджували методи самовдосконалення їхніх моделей LLM. Anthropic — можливості зміни моделями власних функцій винагороди під час навчання.
Результати у всіх цих дослідах виявили певні покращення, але зі значними обмеженнями.
Наприклад, у дослідженні Meta після трьох ітерацій продуктивність моделі почала знижуватися замість подальшого покращення. Схожі результати отримали й інші дослідницькі групи. Це вказує на обмеження поточних технологій самовдосконалюваного ШІ.
Якщо когось цікавить більше подробиць, у коментарях буде посилання на публікацію.
Але!
Наш скепсис щодо ШІ вже неодноразово був скомпрометований. Тож давайте уявимо, що їм це вдасться. Для цього повернімось у минуле.
У далекому 1965 році британський математик та криптограф І. Дж. Гуд (Irving John Good) у своєму есе висловив думку про «ультраінтелектуальні машини», які можуть бути «останнім винаходом людства».
На його думку, такі машини зможуть самостійно вдосконалюватися, причому робити це настільки швидко й ефективно, що перевершать інтелект людини.
У такому випадку людська винахідливість більше не буде потрібною, оскільки машини зможуть самостійно розробляти всі подальші інновації.
Цей сценарій він назвав «вибухом інтелекту», який може радикально змінити світ.
Це передбачення стало основою для сучасних дискусій про «сингулярність» та потенційний ризик створення неконтрольованих самовдосконалюваних ШІ-систем.
До речі, Джон Гуд також брав участь у відомому британському проєкті «Ultra», де в складі команди Алана Тюрінга займався розшифровкою кодів німецької шифрувальної машини Enigma під час Другої світової війни.
Але повернімося до самовдосконалення.
Згідно з вищезгаданою публікацією, одним із найперспективніших підходів до розв’язання задачі, навчання з глибоким підкріпленням (deep reinforcement learning).
Цей метод передбачає, що модель отримує винагороду за досягнення поставлених цілей, і це дозволяє їй самостійно покращувати свої дії.
Проте, щоб уникнути збою в системі винагород, дослідники працюють над створенням динамічних функцій винагороди, які змінюються залежно від поведінки моделі. Це повинно допомогти уникнути надмірної оптимізації одних параметрів на шкоду іншим.
Ще одним напрямком в цій сфері є розробка архітектур з адаптивною складністю, які дозволяють моделі самостійно змінювати свою структуру в процесі навчання.
Наприклад, сучасні моделі LLM (великі мовні моделі) вже можуть підлаштовувати кількість залучених параметрів залежно від складності завдань. Це допомагає розв’язувати проблему деградації продуктивності після кількох ітерацій вдосконалення.
Дослідники також працюють над інтеграцією алгоритмів, що дозволяють моделям виділяти нові підмоделі для спеціалізованих завдань, щоб уникати перевантаження головної моделі.
Тож якщо науковці дійсно зможуть подолати обмеження та створити самовдосконалюваний ШІ, ми можемо опинитися на порозі нової ери технологічного розвитку.
ШІ може стати рушієм прогресу в усіх сферах нашого життя — від медицини до космічних досліджень.
Що по суті означатиме перехід від епохи Інформаційного постмодерну та симбіозу людини й ШІ до епохи Сингулярності.
Згідно з передбаченням Джона Гуда, це буде «останній винахід людства». Що б це не означало...
23 коментарі
Додати коментар Підписатись на коментаріВідписатись від коментарів