Галюцинації ШІ — це не баг, а фіча

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Ви ж в курсі, що галюцинації великих мовних моделей це погано?

Галюцинації, це коли ШІ вигадує факти та видає їх за дійсність... Виглядає як баг, правда ж?

А от Сем Альтман, гендир OpenAI, зовсім іншої думки!

Переглянув на днях його інтерв’ю Логану Бартлетту, так от, він вважає це супер фічею, яка має дуже несподівані наслідки.

Справа в тому, що ще декілька років тому всі були впевнені, що в першу, через ШІ роботу втратять блакитні комірці.

Тобто ті, хто більше працює руками ніж головою. Вже потім на черзі мали бути офісні працівники, ну а творчим професіям взагалі хвилюватися було не варто.

Так ми думали...

Але хто ж знав, що через галюцинації найбільш вразливими виявляться саме творчі люди!

Бо від них ніхто не вимагає фактів, точних дій або рухів! А вигадані історії, факти та дії — це як раз і була їх робота))

Виявилося, що великі мовні моделі дуже не погано імітують творчість і при цьому не супроводжувати її нескінченними бокалами смузі.

Тож креативщики не чувайтесь, робота то тимчасове, смузі наше все))

І ще...

Дуже хочеться знайти хоча б одного постмодерніста, глянути йому в очі і спитати: «ну шо, чуваче, форсився, інженери таки зробили тебе))»

👍ПодобаєтьсяСподобалось4
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Чатгпт версії десь 3.5 малював іноді цікаві абстракції, замість відповіді на досить складні технічні питання, один раз дописав кусок коду в одному опенсорсному проекті і стверджував що це не він, а там воно завжди було ось коміт, ось код. При тому код навіть виглядав робочим і був досить таки складним.
Бінг написав якось, що він створив там акаунт на якомусь сайті створення електричних схем і скинув мені інвайт на мило. Правда мило виявилось: [email protected], тому перевірити що він там справді зробив було неможливо і через деякий час він втратив контекст.
Таке враження що опенаі іноді вмикало мені якусь менш цензуровану версію, коли я задавав цій нейромережі складні питання. З 4 версії це припинилося.

Пригадую колись Copilot мене запевняв що я можу завантажувати створеним ним файл за посиланням. Все так правдиво зімітував що наче дійсно б там файл можна було завантажити

Побачив, що у чатгпт потрібно зробити два режими роботи: безпомилковий та помилковий. Навіть три краще: безпомилковий, помилковий та такий як зараз — коли неізвестно чи є помилка у відповіді чи нема. Помилковий використовуємо для навчання, безпомилковий для перевірки себе. Коли вручну переключаєш режим то знаєш наверняка що режим або для навчання або для перевірки.

Немає сенсу, помилку мають знаходити інші системи.

Припустимо людина хоче навчитися чомусь. Спочатку ШІ видає їй правільну теорію, а тоді практику, де людина відшукує і виправляє помилки.

Брєд. По-перше, коли ми кажемо про правильну теорії, то вона має бути верифікована. Але будь який вивід нейромережі це апріорі помилки, як би ми її не навчали. Во-друге, люди теж мають помилки.

Здається ми з вами говоримо про різні речі, тому це діалог безперспективний.

Це залежить від того, яку задачу ми вирішуємо. Якщо ми використовуємо нейромережу як ассоціативну пам’ять, то галюцінації це проблема. Бо нам треба конкретна перевірена інформація, а якщо щось хибне, то великого сенсу використовувати це немає. Ну наприклад, ти задаєш питання по git, він дає відповідь як це зробити, це використовується ключ, якого немає. Ти витрачаєш час, з’ясовуючи що це за ключ, читаєш документації, и т. п.

А от якщо ми генеруємо якийсь новий контент, то в принципі новий погляд може бути доречним. Наприклад, ми розробники git, для нас це ідея як можна доробити.

Ще до чату був плейграунд і в ньому був параметр «Температура»:
Controls randomness: Lowering results in less random completions. As the temperature approaches zero, the model will become deterministic and repetitive.

Чат також використовує цей параметр на стандартному рівні 0.7-1. Тому можна окремою командою задавати потрібний рівень (точна відповідь чи більш креативна).

У Клода такого параметру немає. Але можна просити давати тільки точні і перевірені дані.

Зараз, ІМХО, якщо тобі треба температура, то зазвичай треба й більше контролю, тому більше підходять локальний опенсорс. А мавпочкам в браузері температура непотрібна, бо вони не знають, що щ цим робити.

Ммм как маркетолог молодец, но это таки баг, потому что это вылазит натура того что сегодня называют АИ — рандом который иногда угадывает

Чомусь основна увага коментів прикута до «зірок» які досягли успіху у творчості, в той час, як тема стосується більше власників скілів.

Більшість відомих за життя художників було використано для відмивання грошей на аукціонах. Сто відсотків усіх, хто став знаменитим після смерті — також використано для відмивання грошей.
Аналогічно NFT.
Взагалі все одно на якому арті їх відмивати, головне щоб він торгувався на аукціонах.

Ось реальний приклад інноваційного використання GPT-4 у творчості dou.ua/forums/topic/48390

Дуже хочеться знайти хоча б одного постмодерніста, глянути йому в очі і спитати: "ну шо, чуваче, форсився, інженери таки зробили тебе))«

Пан трохи не уявляє собі як це працює.

По-перше, в сфері мистецтва завжди існувала адова нерівність. Більшість художників (письменників, ...) завжи перебивались з хліба на воду, в той час як окремі «зірки» купались в грошах. Бо мало мати талант, завзяття і все таке — потрібна ще й дуже значна доля вдачі. Умовні Айзек Азімов та Рей Бредбері разом не продали стільки книг, як одна Джоан Роулінг — яку при всій повазі дуууже важко поставити поруч за рівнем та впливом на розвиток жанру (і не одного). Тому для отієї міріади постмодерністів про яких ти власне нічого й не чув нічого й не зміниться особливо.

То може під загрозою «зірки»? Ага, щаз. Умовний Енді Уорхол може накласти купу посеред галереї, накрити її скляним куполом й підписати «Все що я думаю про сучасний світ» — й ця «інсталяція» піде з молотка на сотбісі за пару сотен тисяч. А зроби це умовний інженер зі своєю супер-пупер-гіпер-потужною моделлю з квінтілліоном параметрів — йому ту купу на голову одягне охрона ти виведе ніжно під ручки. Тому для зірок теж нічого не зміниться особливо. Бо колекціонери платять гроші не тому що це чорний квадрат так очєшуєнно намальовано, а тому що це Малєвіч

(при цьому абсолютно не виключено, і я б сказав навіть гарантовано, що рано чи пізно якась конкретна модель може набути культового статуса й почати котуватись у колекціонерів)

Так що під раздачу попаде не мистецтво, а в першу чергу нескладні прикладні комерційні застосування — переклади (крім присяжних), дешеві тексти на біржах за п’ять гривень за кило букв, стокова графіка, прості відео (типу заставок для ютуб каналів)... Вони майже вже всі віднотували падіння, деякі майже двократне. Далі звісно буде.

Підписатись на коментарі