Сучасна диджитал-освіта для дітей — безоплатне заняття в GoITeens ×
Mazda CX 5
×

Чим GPT-4 відрізняється від GPT-3. Тестуємо і обговорюємо

Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!

Чи чекали ви на вихід нової потужної моделі штучного інтелекту? Чому?

NYT склав короткий посібник із GPT-4.

GPT-4 точніший. Коли Кріс Ніколсон, експерт AI і партнер компанії венчурного капіталу Page One Ventures використовував GPT-4, він сказав боту, що англомовний і не знає іспанської. Також попросив навчальний план, який міг би навчити його основам, і бот надав його — докладний і добре організований. Він навіть надав широкий спектр технік для вивчення та запам’ятовування іспанських слів.

Ніколсон звернувся за подібною допомогою до попередньої версії ChatGPT, яка спиралася на GPT-3.5. Він також настав навчальний план, але його пропозиції були більш загальними та менш корисними.

«Нова версія містить більше фактів, і вони дуже часто точні», — каже Ніколсон.

Коли Орен Етціоні, дослідник AI, спробував нового бота, він поставив пряме запитання: «Які стосунки між Ореном Етціоні та Елі Етціоні?» Бот відповів правильно.

Відповідь попередньої версії ChatGPT на це запитання завжди була неправильною. Проте правильна відповідь означає, що новий чатбот має ширший діапазон знань.

Але GPT-4 все одно допускає помилки. Далі бот сказав: «Орен Етціоні — комп’ютерний науковець і генеральний директор Інституту штучного інтелекту Аллена (AI2), а Елі Етціоні — підприємець». Більшість із фактів є точними, але бот, чиє навчання було завершено в серпні, не зрозумів, що доктор Етціоні нещодавно залишив посаду виконавчого директора Інституту Аллена.

GPT-4 може описувати зображення з вражаючою деталізацією. GPT-4 має нову здатність реагувати як на зображення, так і на текст. Грег Брокман, президент і співзасновник OpenAI, продемонстрував, як система може детально описати зображення з космічного телескопа Хаббла. Опис продовжувався на абзаци.

Він також може відповісти на запитання про зображення. Якщо дати фотографію внутрішньої частини холодильника, вона може запропонувати кілька страв, які можна приготувати з того, що є під рукою.

OpenAI ще не оприлюднив цю частину технології, але компанія під назвою Be My Eyes вже використовує GPT-4 для створення сервісів, які могли б дати більш детальне уявлення про зображення, які зустрічаються в Інтернеті або зроблені в реальному світі.

GPT-4 має серйозну експертизу. Нещодавно ввечері Аніл Гехі, професор медицини та кардіолог Університету Північної Кароліни в Чапел-Хілл, описав чат-боту історію хвороби пацієнта, якого він бачив днем раніше, включаючи ускладнення, які у нього виникли після госпіталізований до лікарні. Опис містив кілька медичних термінів, які не впізнавали б обивателі.

Коли доктор Гехі запитав, як він мав лікувати пацієнта, чат-бот дав йому ідеальну відповідь. «Саме так ми поводилися з пацієнтом», — сказав він.

Коли він пробував інші сценарії, бот давав такі ж вражаючі відповіді.

GPT-4 отримує почуття гумору. Доктор Етціоні попросив нового бота розповісти «новий жарт про співачку Мадонну». Відповідь його вразила. Якщо ви знаєте найбільші хіти Мадонни, це може вразити і вас.

Новий бот все ще намагався написати щось, крім шаблонних жартів. Але він був трохи смішнішим за свого попередника.

GPT-4 може міркувати — до певної міри. Доктор Етціоні дав новому боту головоломку.

Здавалося, система відреагувала належним чином. Але у відповіді не враховувалась висота дверного отвору, через який також міг би не проїхати танк чи автомобіль.

Виконавчий директор OpenAI Сем Альтман сказав, що новий бот може «трохи міркувати». Але його навички міркування руйнуються в багатьох ситуаціях. Попередня версія ChatGPT впоралася з цим питанням трохи краще, оскільки визнавала, що висота та ширина мають значення.

GPT-4 може проходити стандартизовані тести. Відповідно до тестів, чатбот може набрати 1300 (з 1600) на SAT і п’ять (з п’яти) на іспитах Advanced Placement у середній школі з біології, математики, макроекономіки, психології, статистики та історії.

Попередні версії технології провалили Єдиний адвокатський іспит і не отримали таких високих балів на більшості тестів Advanced Placement.

Нещодавно, щоб продемонструвати навички тестування, містер Брокман надав новому боту запитання до іспиту про чоловіка, який керує бізнесом з ремонту дизельних вантажівок.

Відповідь була правильною, але сповненою юридичної лексики. Тож містер Брокман попросив бота пояснити відповідь простою англійською для неспеціаліста. Це теж вдалося.

Що далі. Хоча новий бот, здавалося, міркував про те, що вже сталося, він був менш вправним, коли його просили сформувати гіпотези про майбутнє. Здавалося, він спирався на те, що сказали інші, замість того, щоб створювати нові припущення.

Коли доктор Етціоні запитав нового бота: «Які важливі проблеми потрібно вирішити в NLP- дослідженнях протягом наступного десятиліття?» — посилаючись на своєрідне дослідження «обробки природної мови», яке спонукає до розробки таких систем, як ChatGPT, — воно не могло сформулювати абсолютно нові ідеї.

GPT-4 все ще щось вигадує. Проблема під назвою «галюцинація» переслідує всіх провідних чатботів. Оскільки системи не розуміють, що є правдою, а що ні, вони можуть створити текст, який є повністю хибним.

👍ПодобаєтьсяСподобалось5
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

GPT-4 тепер доступний через Bing, але якось обмежено.

Вже не можу залогінитись з мого акаунту)) Приходить помилка що chatGPT вже не доступний в моїй країні.

Здавалося, він спирався на те, що сказали інші, замість того, щоб створювати нові припущення.

Здавалося? :)

Підписатись на коментарі