Скасовуємо захоплення світу ШІ: що насправді показала Anthropic

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Нещодавно Anthropic опублікувала статтю, яка показує, що ЛЛМки мають внутрішні стани, які можна інтерпретувати як «емоції». І ці стани, начебто, реально впливають на їхню поведінку, тобто в стані відчаю вони можуть вдаватися до маніпуляцій, а в стані ейфорії, безпідставно хвалити.

Вони навіть навели приклад, коли задали своїй моделі невирішувану задачу і потім, із садистською цікавістю, спостерігали, як вона прийшла в стан відчаю і намагалася маніпулювати умовами задачі.

Короче, купа популярних блогерів, політичних оглядачів і навіть військових експертів почали писати тексти про захоплення світу штучним інтелектом і висувати усілякі конспірологічні теорії на основі цієї статті.

У мене навіть склалася думка, що ніхто з них не читав оригінал. Я дам посилання (1) додаю нижче. Почитайте, якщо буде натхнення, цікавий матеріал!

По суті ж додам лише одне.

Мовна модель «живе» в рамках одного запиту і одного вікна контексту. Усе, що виглядає як довготривала логіка чи пам’ять, це вже обгортка навколо.

Тобто це роблять агенти: вони підвантажують додаткові дані, додають системні промпти. І все це, у свою чергу, пишуть люди... тобто всі прикладні стратегії для ЛЛМок походять від людей.

І ще одне...

Ще в березні я написав статтю про те, як за допомогою ЛЛМ-них фіч можна «передбачати майбутнє». З точки зору станів мовних моделей, використовується дуже схожа технологія.

Ідея була в тому, що новини, це не просто хаос, а сигнали, які формують загальний «стан» ситуації, щось типу «емоції» від Anthropic: напруга, страх, стабільність. Якщо дивитися не на окремі новини, а на цей стан, стає видно, куди все рухається. Я навіть там дещо передбачив про Трампа, Іран та Ізраіль! Посилання (2) додаю нижче.

На жаль, моя публікація такого фурору не створила. Образливо, знаєте))

Посилання:

👍ПодобаєтьсяСподобалось6
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі