Навіщо Anthropic філософ і чи можливо закласти емпатію в Claude?

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Побачила в WSJ цікаву статтю про те, як Anthropic підходить до розробки Claude. Виявляється, у них в штаті є посада, досить дивна як для техгіганта — штатний філософ. Її обіймає Аманда Аскелл, і її робота полягає в тому, щоб вчити Claude розрізняти добро і зло.

Аманда створює гігантські системні інструкції — іноді на 100 сторінок, які формують характер і принципи моделі. Її підхід у тому, що ШІ треба виховувати, як дитину, і ставитися до нього з емпатією вже зараз. На її думку, саме те, як ми спілкуємося з моделями сьогодні, визначить, якими вони стануть у майбутньому.

Що ви про це думаєте? Чи реально взагалі закласти емпатію в статистичну модель?
👍ПодобаєтьсяСподобалось2
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Добро і зло кажете, так воно для кожного своє. Для вовка загризти вівцю і поїсти — добро, для вівці це смерть та зло. Те саме скажімо протистояння японських китобоїв та грінпісовців, ковбоїв та корінних американців, BLM та MAGA і т.д.
Якщо вже брати філософію в формі близької до формальної логіки, то матимемо. Добро — це реалізація власних об’єктивних інтересів на свою користь. Зло — навпаки розрішення будь якого спору чи протистояння із втратою своїх об’єктивних інтересів на чужу користь.
Різні моральні принципи, заповіді, кодекси честі, закони і т.д. і т.п. вони насправді потрібні якраз для можливості реалізацїї об’єктивних інтересів певного кола осіб. Конкретно встановлення правил поведінки для організації колективів і суспільств (гуманізм і т.п.). Правила та норми дають можливість регламентованої поведінки, і принципу об’єднання колективів навколо цього.
Скажімо «не вбий» є і моральний принцип і закон в більшості сучасних країн із дуже суровим покаранням за його порушення. Та це не означає, що не можна вбивати в принципі, а це встановлює правила хто та в яких обставинах має право застосування летальної сили. І основань для легального вбивства для певного кола осіб в певних юридичних обставинах багато : на війні [Вітхий Завіт наприклад, виправдовує Давида проти Голіафа], при затримці, при супротиву, при наманаганні до втечі, при само обороні, страта (там де це є, бо одні вважають що то добро інші, що існує правова коллізія коли можна ритуально вбивати в якості покарання і тому це зло, при чому люди і навіть закон вважають діаметрально протилежно інколи в різних реігіонах однієї держави як то США) тощо.
Полігамія : багатожонство, групові браки, фестивальні оргії, проміскуітет і т.д. і т.п. було жорстко законодавче заборонено Римською Республікою і переклалось на імперію і т.п. Моногамія була необхідністю для встановлення правової держави, регуляції громадянства, спадшіни та інших правових норм, на основі чіткого законодавчого встановлення правил рідства тощо. Порушення правил моногамії вважалось і вважається злом, при цьому серійна полігамія теж було дозволена тільки в певних випадках. При цьому полігамія от прямо зараз існує по світу, як дозволена і навіть важається добром подекуди. В ліберальних системах серійна полігамія (вона же серійна моногамія, розлучення і т.п.) і взагалі норма.
І так ще можна багато чого дивитись.

Дякую, тепер я зрозумів, чому мені спілкуватись із Claude набагато більше подобається, ніж із іншими AI. Її не вчать, її ВИХОВУЮТЬ!

В мурашки більше емпатії ніж у будь якої llm

Фото пересвіченої підкачаної блондинки, що знято з верхнього плану на фоні пересвічених сходів — геніальна робота фотографа WSJ.

А філософиня-вегетеріанка з багатої сім’ї яка мріяла змалку стати вчителем філософії — це так по-людяному. Краще би поговорили з нею про те, що як так — чатбот в задачі на вагонетку віддає перевагу натиснути важіль щоб зберегти одну молоду жінку — ціною 5 чоловіків. В «хмарочос-стріт джорнал» не знайшлося кого-небудь здатного поговорити з нею як із філософом, що за непорозуміння?

Емпатія там давно є. Питання більше у тому, щоб більше підсадити користувача: компліменти де потрібно, дофамінчик, ...

Підписатись на коментарі