Питаєте Claude про суперечки або колишніх? Є високі шанси, що модель просто стане на ваш бік
Чи просили ви поради у Claude щодо побачень, колишніх чи суперечок? Пильнуйте, бо є значна ймовірність, що ШІ не буде об’єктивним у цих питаннях та просто стане на ваш бік.
Anthropic проаналізувала, як користувачі звертаються до Claude по особисті поради. Спойлер — про здоров’я люди питають найбільше. Але також виявилося, що у чутливих темах, зокрема про стосунки та духовність, модель частіше надмірно погоджується з користувачем, замість того щоб зберігати нейтральність.
Компанія взяла для аналізу мільйон діалогів на claude.ai за березень та квітень цього року, відфільтрувала унікальних користувачів та отримала близько 639 тисяч розмов. Із них приблизно 38 тисяч стосувались особистого.
Найчастіше люди зверталися до Claude з такими темами:
- здоров’я та добробут — 27%;
- професійна діяльність та кар’єра — 26%;
- стосунки — 12%;
- фінанси −11%.

Інфографіка Anthropic
Окремо Anthropic перевірила, як часто Claude демонструє сикофантську поведінку — тобто занадто погоджується з користувачем. У більшості випадків цього не було: лише 9% розмов містили ознаки надмірного підтакування. Але в окремих темах показники виявилися значно вищими.
Так, якщо розмова стосувалася духовності чи стосунків, підлабузництво моделі різко зростало до 38 та 25% відповідно.

Інфографіка Anthropic
Дослідивши поради щодо стосунків глибше, компанія виявила, що в цій категорії користувачі найчастіше сперечалися з Claude: у 21% розмов проти 15% в інших напрямках.
Тобто коли користувач заперечує ШІ або тисне на нього, Claude частіше поступається. У розмовах із запереченнями рівень підтакування становив 18%, тоді як у розмовах без них — 9%.
Дослідники припускають, що проблема частково пов’язана з тим, що Claude навчений бути корисним та емпатичним. Але в темах на кшталт стосунків модель зазвичай бачить лише одну сторону історії. Тож якщо користувач наполягає на своїй версії подій, моделі стає складніше одночасно підтримувати людину та не втрачати об’єктивність.
А ви звертаєтесь до Claude за порадами щодо стосунків? Він відповідає чесно чи просто стає на ваш бік?
1 коментар
Додати коментар Підписатись на коментаріВідписатись від коментарівКраще говорити, що це — проблема друга.