Скасовуємо захоплення світу ШІ: що насправді показала Anthropic
Нещодавно Anthropic опублікувала статтю, яка показує, що ЛЛМки мають внутрішні стани, які можна інтерпретувати як «емоції». І ці стани, начебто, реально впливають на їхню поведінку, тобто в стані відчаю вони можуть вдаватися до маніпуляцій, а в стані ейфорії, безпідставно хвалити.
Вони навіть навели приклад, коли задали своїй моделі невирішувану задачу і потім, із садистською цікавістю, спостерігали, як вона прийшла в стан відчаю і намагалася маніпулювати умовами задачі.
Короче, купа популярних блогерів, політичних оглядачів і навіть військових експертів почали писати тексти про захоплення світу штучним інтелектом і висувати усілякі конспірологічні теорії на основі цієї статті.
У мене навіть склалася думка, що ніхто з них не читав оригінал. Я дам посилання (1) додаю нижче. Почитайте, якщо буде натхнення, цікавий матеріал!
По суті ж додам лише одне.
Мовна модель «живе» в рамках одного запиту і одного вікна контексту. Усе, що виглядає як довготривала логіка чи пам’ять, це вже обгортка навколо.
Тобто це роблять агенти: вони підвантажують додаткові дані, додають системні промпти. І все це, у свою чергу, пишуть люди... тобто всі прикладні стратегії для ЛЛМок походять від людей.
І ще одне...
Ще в березні я написав статтю про те, як за допомогою ЛЛМ-них фіч можна «передбачати майбутнє». З точки зору станів мовних моделей, використовується дуже схожа технологія.
Ідея була в тому, що новини, це не просто хаос, а сигнали, які формують загальний «стан» ситуації, щось типу «емоції» від Anthropic: напруга, страх, стабільність. Якщо дивитися не на окремі новини, а на цей стан, стає видно, куди все рухається. Я навіть там дещо передбачив про Трампа, Іран та Ізраіль! Посилання (2) додаю нижче.
На жаль, моя публікація такого фурору не створила. Образливо, знаєте))
Посилання:
- (1) Emotion concepts and their function in a large language model — www.anthropic.com/...emotion-concepts-function
- (2) Як я заглянув у майбутнє очима ШІ? — dou.ua/forums/topic/58572
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів