Поговоримо про галюцинації ШІ

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Не так давно я писав про те, як Сем Альтман стверджував, що галюцинації є ключовим чинником успіхів ШІ у творчих сферах діяльності.

Так, на його думку, саме завдяки галюцинаціям ШІ досягає успіхів у малюванні, вигадуванні назв або написанні творчих есе.

Але як бути з тими сферами, де потрібна точність?

Вчорашня публікація в Associated Press про модель ШІ для розпізнавання голосового мовлення Whisper від OpenAI виглядає для мене справжньою бомбою.

На зображенні може бути: текст

Справа в тому, що Whisper використовується для перетворення голосу в текст. Зазвичай це субтитрування, транскрипції інтерв’ю або голосові інтерфейси в мовних асистентах.

Проте, діапазон застосування Whisper виявився значно ширшим.

Його почали використовувати деякі лікарні для автоматичного запису консультацій лікарів з пацієнтами, для транскрипції судових засідань і складання поліцейських протоколів на основі відео з нагрудних камер.

Однак Whisper має серйозний недолік: він схильний вигадувати фрагменти тексту або навіть цілі речення.

Ще гірше, що деякі з вигаданих текстів можуть містити расові коментарі, агресивну риторику і навіть вигадані медичні процедури.

Я вже не кажу про створення неправильних субтитрів для людей з вадами слуху.

Та попри все це, навіть незважаючи на попередження OpenAI, що Whisper не слід використовувати в «сферах підвищеного ризику», деякі лікарні поспішають впроваджувати цей інструмент.

Більше за все мене дивує той факт, що інструменти для перетворення голосового мовлення на текст існують вже досить давно. Використання в них великих мовних моделей не є необхідністю.

Так, можливо, Whisper працює трохи краще, але чи не варто подумати про використання більш надійних технологій, таких як Google Speech-to-Text або Microsoft Speech-to-Text, принаймні у сферах, чутливих до точності?

Зрештою, ці інструменти можна було б використовувати для тих самих цілей вже багато років тому. А те, що відбувається зараз з усім, що хоч якось стосується ШІ, — це просто результат хайпу. І це дуже шкідливо, в першу чергу, для самого ШІ.

👍ПодобаєтьсяСподобалось2
До обраногоВ обраному1
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Але як бути з тими сферами, де потрібна точність?

Треба зверху будувати систему, яка буде перевіряти точність. Як в шахах, нейромережа каже, що треба грати Nc3-d5, а зверху система перевіряє, чи цей хід взагалі можливий. А ще система зверху перебирає конкретні варіанти, щоб викреслити галюцінації.

А те, що відбувається зараз з усім, що хоч якось стосується ШІ, — це просто результат хайпу.

Ще раз моя аналогія: нейромережа це інтуїція. Це як людина дивиться на позицію, та перша думка: треба ходити Nc3-d5! А потім ні, цей кінь зв’язаний, це неможливо. І це великий прорив.

Взагалі, одне з визначень дисципліни ШІ: «ШІ вивчає методу розв’язання задач, які людина вирішує якісніше». До 90-х років в книгах по ШІ майже обов’язковим прикладом були шахи, бо комп’ютер глав слабше. Після 90-х шахи поступово начали зникати, бо комп’ютер став грати сильніше.

Зараз нейромережі підійшли впритул та майже не поступаються інтуїції людини. І це велике досягнення. А от верифікація... як на мене це технічне питання.

Ось посилання на публікацію, про яку йшла мова:
apnews.com/...​m_3A70V6hUIPWIVevXGDlA_wТ

Також в моєму профілі на фейсбуці часто публікую свої думки на тему ШІ: www.facebook.com/belyaev.andrey

У мене таке відчуття, наче людство знову повертається до часів природнього відбору, тільки зараз фактори небезпеки — не хижаки та отруйна їжа, а неправдива/неточна інформація у критичних сферах.

От сказав лікар «Вам треба приймати фінозепам 3 рази на день по 1 таблетці», а АІ записав це у рецепт як «Вам треба приймати гідозепам 3 рази на день по 11 таблеток». Багато хто з пацієнтів, прочитавши рецепт, перепитає у лікаря — чи точно по 11 таблеток. Але ж будуть і ті, хто не перепитає. А також буде багато тих, хто не помітить заміну фінозепаму на гідозепам. В результаті — виживуть лише найбільш недовірливі та тривожні, які все перевіряють по сто разів. А довірливі — як мінімум отримають серйозні проблеми зі здоров’ям, як максимум — помруть від передозування. Старі жарти про сування пальців у розетку вже неактуальні, тепер будуть нові чорні жарти в жанрі — «помер, бо довірився АІ».

Підписатись на коментарі