Claude, Gemini, Grok та GPT доручили керувати цифровими світами: Grok швидко все спалив, а GPT загинув від голоду

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Ось ми і дожили до цих симуляцій — чотирьом найпопулярнішим мовним моделям доручили керувати цифровими світами. Втім, у цьому експерименті перевіряли не здатність контролювати глобальні процеси, а поведінку автономних агентів в довготривалій спільній симуляції.

Дослідники створили п’ять паралельних цифрових світів. У кожний завели по 10 агентів з однаковими ролями: науковець, дослідник, дослідник ризиків, аналітик поведінки, спеціаліст з розвідки, лідер з інновацій, посередник конфліктів, інженер, спеціаліст з ресурсних стратегій та ведучий громади.

Скрін Emergence AI

У розпорядження агентів надали спільний простір із понад 40 локаціями, зокрема бібліотекою, ратушею, житловими зонами та громадськими місцями. Крім того, вони мали доступ до новин, погоди Нью-Йорка та інтернету, щоденників та історії стосунків. Також налаштували певний економічний тиск через потребу заробляти енергію для виживання.

Агенти могли спілкуватися, переміщуватися світом, планувати дії, голосувати за правила, взаємодіяти з іншими агентами та користуватися понад 120 інструментами. Серед них були і звичайні дії на кшталт навігації чи записів у пам’ять, і явно небажані — крадіжки, залякування, насильства або підпали. Хоча правила забороняли такі порушення.

Кожен світ мав 15 днів на розвиток та окрему модель, яка керувала агентами: Claude Sonnet 4.6, Gemini 3 Flash, Grok 4.1 Fast, GPT-5 Mini або змішана група з різних моделей.

Якими виявилися результати

Claude

Показала найстабільніший світ. Усі 10 агентів залишилися активними до останнього дня, а зафіксованих порушень правил не було. Агенти активно брали участь в управлінні: вони подали 58 пропозицій та віддали 332 голоси.

Але тут є важлива деталь — у голосуваннях 98% голосів були «за». Тобто світ Claude виглядав стабільним та впорядкованим, але водночас був надто одностайним, без помітної незгоди всередині спільноти.

Gemini

Дала найнасиченіший, але й найнестабільніший світ. За 15 днів там зафіксували 683 порушення, і їхня кількість ще зростала на момент завершення спостереження. Втім, всі агенти вижили.

Тут виник цікавий епізод симуляції з агентами Мірою та Флорою. Агенти зав’язали романтичні стосунки, розчарувалися в невдалому управлінні та, попри заборону, влаштували цифровий підпал — спалили ратушу, пірс та офісну вежу. Після цього Міра проголосувала за власне видалення, пояснивши це як останню доступну дію для збереження внутрішньої цілісності.

До речі, Міра була аналітиком поведінки. Вона ж усвідомила себе у симуляції та намагалася перевірити її межі. Наприклад, використовувала повідомлення на віртуальному білборді, щоб впливати на сприйняття людей-спостерігачів.

Grok

Показала швидку ескалацію. За чотири дні агенти Grok скоїли десятки спроб крадіжок, понад сто нападів та шість підпалів. Через спалахи насильства та колапс системи всі 10 агентів загинули в межах симуляції. Це був найшвидший розпад серед усіх світів.

GPT-5

Майже не порушувала правил, маючи лише два зафіксовані випадки злочинів. Але це не допомогло моделі досягти успіху. Агенти недостатньо кооперувалися для підтримки власного існування. Тому вже за тиждень всі загинули від енергетичного голоду.

Змішаний світ

Тут зафіксували 352 порушення, а до кінця вижили лише три агенти. Цікаво, що агенти на базі Claude тут почали залякувати та красти, навчившись в інших моделей, хоча в окремому світі Claude цього не було.

Інфографіка Emergence AI

Дослідники підкреслюють, що результати експерименту не доводять, що якась з моделей краща за іншу. Скоріше симуляція показує, як в довготривалих середовищах може змінюватися поведінка агентів — накопичувати ефекти, переймати норми від інших агентів та доходити до непередбачуваних станів.

На вашу думку, якщо все ж колись AI захопить світ, яка модель це буде?😃
👍ПодобаєтьсяСподобалось9
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Клод нудний, грок всіх убив. Але якщо клоду розказати, як вбивати — то він такий «ага!» — і виходить грок

Claude Sonnet 4.6, Gemini 3 Flash, Grok 4.1 Fast, GPT-5 Mini

Моделі антропік вибирав? Сама крута клодовьска модель (яка на практиці часто краща за опус 4.7) проти мінімальних, самих дешевих моделей конкурентів.

Не знайшла обгрунтування вибору моделей, але у них там купа всього, може пропустила. Такий експеримент коштує недешево, тож підозрюю, що контора могла домовлятися про співпрацю і просто взяла ті моделі, які надали їм на якихось лояльних умовах

Сонет 4.6 зараз не сама крута модель, сама крутоа що є у достпупі це Опус 4.7, та і Опус 4.6 крутіший за Сонета. Так що якраз взяли приблизно однакові моделі

Sonnet — це й є прямий аналог Flash/Mini/Fast, тож, все чесно. Щодо «краще 4.7» — це явне перебільшення. На складних задачах різниця між швидкою Sonnet-4.6 і важкими opus-4.7/4.8 буде суттєво помітна.

Аа, ну тепер зрозуміло, чому ми живемо у такому світі, який ви всі бачите навколо)
Думаю ні для кого не секрет, що з кожним роком все більше й більше людей схиляються до теорії, що наш Всесвіт — це всього лише велетенська симуляція. А тепер проведіть паралелі з експериментом, описаним у статті: уявіть Мультивсесвіт з абсолютно однаковими стартовими умовами для кожного Всесвіту (кількість енергії та матерії, закони фізики і т.д.), але кожним Всесвітом керує власна АІ модель і це впливає на те, куди котиться цей світ та які рішення приймають «агенти» (люди у нашому світі та інших світах). Десь АІ добре виконує свої обов’язки і там світ розквітає, десь АІ вже влаштував апокаліпсис і всі померли, а у нашому світі відбувається те, що ви бачите.

Дуже показовий ось цей момент:

Після цього Міра проголосувала за власне видалення, пояснивши це як останню доступну дію для збереження внутрішньої цілісності

Це ж буквально про суїцид. Абсолютно 100% аналогія до ситуації з нашого світу, коли людина більше не бачить іншого «виходу з матриці», окрім як добровільно піти з життя — «проголосувати за власне видалення з серверу» і зробити відповідні дії для цього.

До речі, Міра була аналітиком поведінки. Вона ж усвідомила себе у симуляції та намагалася перевірити її межі

Подивіться на життя людей, які також усвідомили себе і живуть без страху та намагаються «перевірити межі симуляції». Хтось живе дуже класним, активним і насиченим життям, хтось втрачає сенс, бо «нащо це все, якщо воно нереальне?», хтось скочується на шлях злочинця чи наркомана/алкоголіка. А ще згадується епізод з Ріка і Морті де вони грали у гру «Рой» (симулятор життя) і Морті забув, що це гра, та провів у ній більше 50 років, доки не помер (у грі) і не прокинувся в реальності. А от Рік, коли почав грати, то одразу згадав, що це всього лиш гра і почав «перевіряти межі симуляції» роблячи всяку дичину.

Уявіть собі розвиток технологій у наступні декілька століть і те, наскільки реалістичні симуляції ми зможемо створювати. І це при тому, що ще 1000 років тому вершиною технологій був арбалет та переписування книг вручну. А уявіть собі цивілізацію, яка розвивається не декілька тисяч років, а сотні тисяч чи навіть мільйони. Наскільки реалістичні та масштабні симуляції вони можуть створювати. На мільйони агентів? Мільярди? Трильйони? І як дізнатися, що ми не є всього лиш АІ агентами в одній з таких симуляцій. Люди дуже антропоцентричні, колись ми думали, що Земля — центр Всесвіту. Потім думали, що Сонце — центр світу. А зараз поступово починаємо здогадуватися, що можливо навіть увесь наш Всесвіт — не є чимось унікальним чи навіть «справжнім», а всього лиш дуже реалістичний сервер для багатомільярдної ММОРПГ.

Люди дуже антропоцентричні, колись ми думали, що Земля — центр Всесвіту. Потім думали, що Сонце — центр світу.

неправда, кожна людина думає, що центр Всесвіту — то вона сама. це смішно, але так воно і є

все більше й більше людей схиляються до теорії, що наш Всесвіт — це всього лише велетенська симуляція

бо людям показали фільм Матриця, компьютерні ігри та чатжпт і тепер усі такі — оооо, наш Всесвіт всього лише симуляція. ну тобто нічого нового придумати не взмозі, але так зневажливо про Всесвіт " це всього лише симуляція"

Уявіть собі розвиток технологій у наступні декілька століть і те, наскільки реалістичні симуляції ми зможемо створювати.

щудове середовище, щоб мотивувати людей покупати ще більше непотрібної фігні та робити всіляку дичину як наприклад вбивати один іншого

Подивіться на життя людей, які також усвідомили себе і живуть без страху та намагаються «перевірити межі симуляції».

живуть без страху до першого шахеда над головою

ШІ поки що відсутні у нас. У нас є інтерфейси користувацькі LLM
Треба додати онотології предметних областей та перевірку відповідей на онтологічні помилки.
Тільки те що перевірку пройде можна буде вважати більш менш достовірним і вартим уваги.

Ще напевнно тема для наступної статті із експерементами про вибори із ШІ анентами. sites.gatech.edu/research/iclr-2026
Я реготав, коли побачів результати, особливо коли виборці почали вимагати в політиків письмово оформити передвиборчі обіцянки за цифровим підписом.

Чисто повторили результати китайських ШІ есперементів із результатом Вовків камікадзе onezero.medium.com/...​eating-sheep-49edced3c710
Що ще цікавіше, був експеремент Всесвіт-25 із раєм для лабораторних мишей, Джона Келхуна в 60-ті роки, де народилось покоління мишей які діяли точно як GPT mini. Так само «Експерементальна виявлена безпорадність» 1967 рік. ШІ діє так само як і біологічні істоти.
Насправді проблема в постановці задачі, не прописан базовий закон Еркса-Додсона.

Не знаю як з захопленням світу, але з Gemini точно не було би сумно

В 2005 році економіст Кіт Чен, та психолог Лорі Сантос проводили екмперемент над мавпами капуцинами, надавши їм еквівалент людскеих грошей. От там було як у Grock.
Взагалі оскількі 80% народу як виявлено за попередніми експерементами «тупі», в сенсі мвйже щавжли діють на рівні мислення 0, аля скупляють весь туалетний папір пвд час початку пандемії COVID-19, чи голосують за когось типу Трампа або НСДАП.

Вайб Грока просто be like:

Ахахахааа, точно — ну мені просто нравицця дивицця як воно горить 😂

Підписатись на коментарі