Майже детективна історія про штучний інтелект
Ви ж в курсі, що є старий, новий та загальний штучні інтелекти?
Новий, це той, що з’явився 30 листопада 2022 року у вигляді чату-GPT й створений завдяки великим мовним моделям -LLM.
Зі старим теж все ясно. А от що таке Загальний Штучний Інтелект?
В англомовному середовищі це Artificial General Intelligence або AGI.
В теорії AGI це загальний штучний інтелект, здатний виконувати будь-яке завдання не гірше за людину. В реальності його ще не існує.
Про AGI багато говорять. Сем Альтман, наприклад, голова компанії, що створила чат-GPT, вважає що його дітищу ще далеко до AGI, але в майбутньому шанси є.
А що, якщо раптом це майбутнє вже настало?!
Саме так я подумав, коли знайшов в мережі один дуже цікавий проєкт! Деякі експерти позиціонували його навіть як втілення AGI!
Він акцентував увагу на тому, що розв’язав основні проблеми LLM моделей.
А саме! Зупинка у своєму розвитку на моменті закінчення навчання, тобто вони мають статичні знання про світ. Нездатність навчатися без спеціальних процедур тонкого тюнінгу. Ну і найголовніше, вони живуть в обмеженому вікні контексту. Тобто не мають довготривалої пам’яті та не здатні зберігати інформацію з минулих діалогів.
То що ж пропонує цей новий проєкт? Режим безперервного навчання — CLM (Continuous Learning Mode)! Який включає:
- відсутність обмеження знань;
- запам’ятовування вмісту розмов;
- вміння здобувати нові навички, без тонкого тюнінгу.
Тобто все те, чого не може LLM.
Звичайно, що в мене виникла купа питань, як до проєкту, так і до технологій, які тут використані. Бо згідно з описом — це фактично AGI. Але кому під силу зробити таку штуку? OpenAI, Microsoft, Meta, Amazon, Anthropic, Mask...?
Ви будете здивовані, але жодних копірайтів, а ні на сайті, а ні в документації я не знайшов. Зате знайшов хлопця з твітеру, який просував цей проєкт та назвався його автором. Що для одного розробника було дуже круто! Він же і поділився зі мною інформацією про технічну сторону проєкту.
В якості внутрішніх моделей він використовує Sonnet та 4o. А от для внутрішніх 405 та 70b. Іншими словами мова не йде про нову модель винайдену геніальним програмістом. Це архітектурна схема в якій використовуються найкращі моделі LLM, у яких «на підхваті» працюють спеціально адаптовані моделі, для кластеризації контексту.
Тож збудження деяких ШІ експертів було передчасним. Це не AGI. Але тема дуже цікава. Я навіть думаю, що за такою архітектурою майбутнє ШІ. Бо з нею можна дійсно організувати довготривалу пам’ять.
Єдине що бентежить, це маскування CLM під LLM. Бо, на перший погляд, начебто CLM це наступний цивілізаційний крок після LLM, хоча насправді мова всього лише про метод керування контекстом.
Тим не менш, думаю, що цей метод скоро буде широко задіяний в більшості комерційних систем штучного інтелекту!
У конкретно цього проєкту є інтернет-адреса, документація та платний доступ до API! Я дам посилання в коментах. Але попереджаю, що окрім тих, хто хвалять цей проєкт, я, мабуть, серед них, є й хейтери, та ті, хто звинувачують його у скамерстві.
Як на мене, там все більш менш пристойно, я користувався вебдемкою, все працює. Але я не користувався платним API.
Тому залишаю на ваш розсуд рішення чи спробувати користуватися цим проєктом, чи ні.
3 коментарі
Додати коментар Підписатись на коментаріВідписатись від коментарів