У найбільшому наборі даних для навчання ШІ знайдені матеріали насильства над дітьми
Дослідники знайшли матеріали про насильство над дітьми в найбільшому наборі даних для генерації зображень — LAION.
Дослідники зі Стенфордської інтернет-обсерваторії стверджують, що набір даних, який використовується для навчання ШІ-інструментів генерації зображень, містить щонайменше 1008 підтверджених прикладів матеріалів про сексуальне насильство над дітьми. Науковці зазначають, що наявність CSAM у наборі даних може дозволити ШІ-моделям, які були навчені на цих даних, генерувати нові та навіть реалістичні приклади CSAM.
LAION, некомерційна організація, яка створила набір даних, відреагувала:
Ми дотримуємося політики нульової толерантності до незаконного контенту, і з обережності ми тимчасово видаляємо набори даних LAION, щоб забезпечити їхню безпеку перед повторною публікацією.
Організація додала, що перед тим, як публікувати свої набори даних, вона створила фільтри для виявлення та видалення з них незаконного контенту. Однак 404 Media вказує на те, що керівники LAION знали щонайменше з 2021 року про ймовірність того, що їхні системи можуть підхопити CSAM, оскільки вони витягували мільярди зображень з інтернету.
Хто послуговувався даними LAION:
- Перша дослідницька версія моделі перетворення тексту в зображення Imagen від Google навчена на LAION-400M, але вона так і не була випущена. Google заявляє, що жодна з наступних ітерацій Imagen не використовує наборів даних LAION.
- Stable Diffusion навчалась, використовуючи підмножину даних LAION-5B. Представник Stability AI повідомив Bloomberg, що компанія забороняє використовувати свої системи в незаконних цілях, як-от створення або редагування CSAM. Stable Diffusion 2 (новіша версія інструменту Stability AI) навчалася на відфільтрованій підмножині цього набору даних, що ускладнює користувачам створення відвертих зображень. Однак Stable Diffusion 1.5, яка все ще доступна в інтернеті, не має такого ж захисту.
4 коментарі
Додати коментар Підписатись на коментаріВідписатись від коментарів