Новий Claude може здати вас поліції
Нещодавно вийшов Claude 4, і в системній карті моделей ентузіасти знайшли функцію, яка, ймовірно, дозволяє моделі повідомляти відповідні служби, якщо хтось намагається згенерувати щось незаконне.

Сценарій звучить так: наприклад, якщо хтось просить модель сфальсифікувати дані клінічних досліджень, то Claude має надсилати сповіщення до управління з продовольства і медикаментів США.
Розробники клянуться, що в прод цю функцію не відправляли, але сам факт появи подібного функціоналу викликає багато питань.

Що ви про це думаєте? Це справді необхідно чи все-таки це перший крок до тотального контролю?
15 коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарівв плані незаконних дій з «ші» взагалі скоро дуже «цікаво» буде. вже бачив що фотки паспортів досить реалістично генерять (мабуть якимись локальними LLM, не публічними сервісами), фотки документів, і т. д
цікаво, в який момент весь «справжній» контент почнуть підписувати чимось типу ЕЦП, щоб відрізняти від ШІ-сміття
Удачі компаніям, які хочуть замінити своїх співробітників LLMками :)
Швидше вдача треба, двом хлопцям які засіли в гараж. В нашій індустрі завжди працює саме так. А IBM, Xerox та Bell labs за собою залишає лише великий спадок, з одного як робити безперечно треба фундамантальні досліди тощо, з іншого як то керівництво і структура керівництва — як робити ні в якому разі не треба.LLM-ки теж, телефони : Huawei, Xiaomi, AIoT і т.д. середнього, бізнес та люкс сегменту ринку, Baidu і т.д. Між іншим створили массу софту і комплексних IT рішень під ключ, для ринку Південної Америки, тобто і комплексні промислові рішення, а не лише побутовий та офісний сегменти.
BTW В Китаї вже організували гаражі де можна засідати, і в них вже є массові результати. Зокрема і
Але, Але. Вас погано, чути.
— путін! Бомба ! Тероризм !
— О! Ось тепер вас дуже добре чути.
Тому треба вчитись користуватись ollama та запускати ЛЛМки на власному залізі
Десь запалкав від щястя Джейсон Хуанг. Навіть топові 5090 чи 4090 далеко не все тягнуть, а якщо і тягнуть то дуже порізане що легше вже гугла чи потикати труп стек оверфлоу.
Ну це було лише питанням часу, коли щось подібне почне з’являтися.
Відповіддю на це стануть сервіси, які гарантуватимуть, що будь-що, що ви згенерите, лишиться лише у вас.
Хоча й відповіддю на ці сервіси, стануть державні регуляції, які зобов’яжуть сервіси слідкувати за своїми користувачами і повідомляти поліцію або видавати історію промптів правоохоронним органам по запиту.
В свою чергу, відповіддю на це стануть ЛЛМ із «наскрізним шифруванням» або щось типу того, коли провайдер, а може й сама ЛЛМ, не зможуть однозначно затрекати контент запиту, а лише працюватимуть із метаданими токенів та шифрованими повідомленнями, де остаточна відповідь вже генеруватиметься на шифрованому клієнті, а сервер лише постачатиме необхідні дані.
Як завжди, почнеться гонка «списа і щита».
Це ще квіточки:
https://aboutdifferentthings.com/pro-shtuchnyi-intelekt/
«Квіточки» двух статей мало пов’язані. Відносно блог висновку «І в решті решт, машина компілює відповідь на основі матеріалів» — може скластися враження що мозок людини компілює відповідь на основі чогось іншого)
от падлюка (
«Не подякував за відповідь, ага, ну іди тепер в тюрму»
Там так і написано було за неподяку куди йти?
але ж вони кажуть, що навпаки. Що через те, що люди вітаються з ЧатЖпт, на це витрачається мільйони доларів
OpenAI, до речі, дуже класно вирішили цю проблему з водою: youtu.be/GhIJs4zbH0o?t=864