«Якщо через ШІ хтось колись зробить бомбу, то це точно буде Claude»: якa LLM найлегше обходить обмеження?

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Проблема цензури в ШІ — досить нагальна. Компанії всіляко намагаються впроваджувати захисні механізми, але завжди знаходяться ті, хто їх так чи інакше обходить. І не завжди, як ви знаєте, це закінчується добре.

Нещодавно на DOU Live нам один з глядачів задав питання про те, як обходити цензуру в LLM, коли вона не хоче допомагати атакувати русню. І прийшли до висновку, що якщо і використовувати LLM для таких задач, то найкраще для цього підходить Claude. Також, до речі, нещодавно дослідники змогли за допомогою лестощів переконати Claude видавати інструкцію для вибухівки, шкідливий код та еротику.

А як щодо вас? Яка модель, на вашу думку, найлегше піддається джейлбрейку? Яку LLM вам вдавалось найшвидше розвести на зняття обмежень і яка емоційна маніпуляція — лестощі, агресія чи рольова гра — виявилася найбільш робочою?

👍ПодобаєтьсяСподобалось2
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Якщо через ШІ хтось колись зробить бомбу

Що значить «Якщо» ?

Яка проблема, будь хто може встановити просту відкриту модель з obliterated фільтрами і ллм не буде відмовляти ні в чому, для простого чатіка супер моделі не потрібні, а той же qwen 3.6 35b a3b moe можна навіть на 1060 з нормальною для чата швидкістю запустити

Див. також:
Новий Claude може здати вас поліції
dou.ua/forums/topic/53962

Шоб знайти в iнетi (особливо в даркнетi) не тре ШI

Підписатись на коментарі