Нові моделі OpenAI стали несподівано потужні у допомозі створення біологічних загроз
Моделі о3 та o4-mini сильно просунулись у порівнянні зі старішими версіями. Як кажуть в OpenAI, модель стала несподівано сильна у біології та значно краще відповідає на питання щодо створення певних типів біологічних загроз.
Компанія бачить у цьому вразливість, про що зазначила у своєму безпековому звіті.
Для запобігання експлуатації новітніх моделей поверх o3 та o4-mini встановили спеціальний монітор для фільтрування. Він шукає запити, пов’язані з біологічними та хімічними ризиками, і інструктує моделі відмовлятися надавати поради щодо цих тем.
На бенчмарках розробникам вдалося досягти відмов у 98,7% випадків. Існує багато методів обходження блокувань (як випадково зробити бомбу), тому система перший час частково буде підтримуватися людьми.
Читайте: Значно покращили пам’ять: ChatGPT тепер може посилатися на минулі діалоги
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів