Порівняння популярних ШІ-моделей: Gemini, GhatGPT, Bing Chat та Claude

Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!

Вітаю, мене звати В’ячеслав Юренко, я CEO IT-компанії 4limes. У цій статті я проведу порівняльний аналіз чотирьох популярних ШІ-моделей: Gemini, ChatGPT, Bing Chat та Claude. Розгляну їхні сильні та слабкі сторони, можливості та потенційні сфери застосування, щоб допомогти визначити, яка модель найкраще відповідає різним потребам.

Короткий опис кожної моделі

Gemini: Це велика мовна модель від Google AI, яка має доступ до величезного набору даних тексту та коду. Gemini може генерувати текст, перекладати мови, писати різні види творчого контенту та інформативно відповідати на ваші запитання.

ChatGPT: Це чат-бот на основі ШІ, розроблений OpenAI. ChatGPT може вести розмови, генерувати різні творчі текстові формати та інформативно відповідати на ваші запитання.

Bing Chat: Це чат-бот на основі ШІ, розроблений Microsoft. Bing Chat може вести розмови, відповідати на ваші запитання та допомагати вам виконувати різні завдання.

Claude: Це велика мовна модель від Anthropic, яка спеціально розроблена для генерування різних творчих текстових форматів, таких як вірші, код, сценарії, музичні твори, електронні листи, листи тощо.

У наступних далі детально розгляньмо кожну з цих моделей, порівняємо їхні можливості та функції, а також надамо рекомендації щодо того, яка модель найкраще підходить для різних завдань.

Gemini

Gemini є першою моделлю, яка перевершила експертів-людей за MMLU (розуміння мови для багатозадачної роботи) — це один із найбільш використовуваних методів, який перевіряє знання та здатність розв’язувати проблеми моделей ШІ.

Сфери компетенції Gemini AI включають:

  • комп’ютерне бачення (виявлення об’єктів, розуміння сцени та виявлення аномалій);
  • геопросторові науки (злиття даних із багатьох джерел, планування та розвідка, а також постійний моніторинг);
  • здоров’я людини (персоналізована медична допомога, інтеграція біосенсорів та профілактична медицина);
  • інтегровані технології (передача знань домену, об’єднання даних, розширене прийняття рішень і LLM).

Gemini доступний у трьох варіантах: Nano, Pro та Ultra. Nano призначений для швидких завдань на пристрої, тоді як Pro є універсальною версією, яка служить середнім рівнем. Ultra є найпотужнішою з трьох версій і буде доступна наступного року, оскільки вона проходить перевірку безпеки.

ChatGPT

ChatGPT — це дивовижний технологічний прогрес, в якому взаємодія «людина-людина» забезпечує креативність та емоційний дотик, який не може відтворити жодна машина. Ця програма обробки мови здатна розрізняти людську мову під час розмовного та письмового мовлення, дозволяючи розуміти інформацію, яку їй потрібно сприйняти й те, що видати, як результат. Користувач може ввести запитання, а нейромережа видасть зрозумілу відповідь у різноманітних форматах із точними умовами.

Можливості ChatGPT:

  • розмова: нейромережа може брати участь у людських розмовах, що робить його придатним для чат-ботів, віртуальних помічників і програм підтримки клієнтів;
  • генерація вмісту: він може створювати текстовий вміст, включаючи статті, есе, фрагменти коду тощо, на широкий спектр тем;
  • мовний переклад: Chat GPT може перекладати текст між різними мовами з високою точністю;
  • відповіді на запитання: він вправно надає відповіді на фактичні запитання, що робить його цінним ресурсом для швидкого пошуку інформації;
  • творче написання: ШІ може допомогти авторам, генеруючи творчі ідеї, сюжетні лінії та діалоги персонажів.

У сфері послуг Chat GPT використовується в основі чат-бота для підтримки клієнтів 24/7. У креативних і творчих напрямках ШІ допомагає створювати високоякісні статті, публікації в блогах, скрипти для відео і маркетингові матеріали.

У сфері освіти чат може стати репетитором, перекладачем, викладачем, тобто допомагає як створити навчальну програму, так і зробити домашні завдання. Дослідники використовують ChatGPT для аналізу та узагальнення великих обсягів текстових даних.

Bing Chat

Bing AI — це функція пошукової системи Bing від Microsoft, яка використовує штучний інтелект для забезпечення кращих результатів пошуку, повніших відповідей та можливості генерувати контент. У нього є результати індексації багатьох тисяч сайтів, і база для навчання ШІ актуалізується щодня.

Можливості Bing Chat:

  • пошук інформації — допомагає користувачам відразу написати відповіді на поставлені питання замість того, щоб переглядати інформацію на сайтах зі сторінками видачі;
  • SEO-рекомендації — чат вміє давати рекомендації щодо оптимізації сторінок та добору ключових слів;
  • створення текстового контенту — в комерційних і некомерційних цілях;
  • особистий помічник — допоможе скласти розклад завдань, достатньо вказати ваші справи та час. Або спланувати подорож. Також дає поради: допоможе розібратися з новим гаджетом, спланувати бюджет чи розповість, як надати першу медичну допомогу.

Майже до кожної згенерованої тези Bing ставить клікабельну цифру, а також наочно виносить адреси сайтів-джерел під віконце з відповіддю. У будь-якому з цих джерел можна перейти та перевірити точність висловлювання. На що варто звернути увагу: в основі пошукового бота — мовна модель Chat GPT 4, і безкоштовно!

Claude 3

Claude 3 має три найпотужніші моделі в модельному сімействі. Це Claude 3 Haiku, Claude 3 Sonnet і Claude 3 Opus (у порядку зростання можливостей).

Чому Claude 3 позиціює себе, як найкращим серед всіх інших ШІ:

  • краща продуктивність у тестах — найпотужніша модель Claude 3, Opus, перевершує найпоширеніші тести оцінки систем ШІ. Він працює краще, ніж GPT-4, GPT-3.5, Gemini 1.0 Ultra та Gemini 1.0 Pro;
  • модель Opus дає кращі експертні знання на рівні бакалавра (MMLU), експертне міркування на рівні магістра (GPQA), основи математики (GSM8K) тощо;
  • моделі Claude 3 здатні відповідати на живі чати клієнтів, виконувати завдання автоматичного завершення та вилучення даних. Вони дають результати швидко та в режимі реального часу. Особливо модель Claude 3 Haiku — він може прочитати наукову статтю, що містить багато інформації та даних, із графіками та діаграмами менш ніж за три секунди;
  • всі моделі вдосконалені з погляду можливостей розпізнавання зображень в порівнянні з іншими провідними моделями. Всі три Claude 3 можуть обробляти широкий діапазон діаграм, графіків і діаграм. Ви можете використовувати цю функцію для аналізу різноманітних даних у PDF-файлах, блок-схемах і слайдах презентацій.

Важливо зазначити, що навчання Claude 3 відбувалося на потужних обчислювальних ресурсах Amazon AWS та Google Cloud. Ці компанії, як відомо, інвестували в компанію-розробника Anthropic, що й пояснює доступ до таких значних обчислювальних потужностей.

Як працюють чотири ШІ та якого помічника обрати

Ознайомившись з чотирма нейромережами, давайте подивимось, як вони працюють та порівняємо їх. Зробимо це на прикладах рерайта та копірайтингу.

Пост в Телеграм-канал — рерайт

Gemini. Ми задаємо команду «Дій, як рерайтер. Зроби рерайт цієї статті». Що робить нейромережа — вона структурує матеріал, додає інформацію.

Chat GPT. Четверта версія після команди видає рерайт тексту з додаванням своєї думки. Зміст статті не структурований. Він дотримується кількості знаків та абзаців.

Bing Chat. Після команди, нейромережа видає посилання в пошуку, текст виходить неструктурованим, цільним. Але додає посилання і в тексті, тобто працює як фактчекер.

Claude 3. Одразу після команди видається текст на таку ж кількість знаків, неструктурований, але, на відміну від Bing Chat, він має пробіли між реченнями та абзаци.

В цьому тестуванні краще впорався Gemini. Проте в кожного сервісу є свої переваги.

Текст, що продає, для соцмереж на основі посилання

Gemini. Ця мережа перепросила і написала, що не може опрацьовувати посилання. Тому посту нема!

Chat GPT. Одразу після команди четверта версія чату починає опрацьовувати посилання, але не швидко. Поки він опрацьовував, інша мережа вже встигла отримати завдання і написати пост. А чат так і висів на стадії опрацювання. Коли відвис, з’явився згенерований текст, в стилі соцмереж разом с емодзі. Але чи то баг, чи що — в словах, де він поставив посилання (а це в кожному рядку) — зникли літери і словосполучення стали незрозумілими.

Bing Chat. Після команди, чат одразу опрацював таск і згенерував пост. Але такий, що візуально і за характеристиками продукту його треба ще редагувати.

Claude 3. Після команди видається згенерований рекламний текст, хоча під завданням написано було, що він не зміг прочитати посилання. Але зробив пост з характеристиками продукту. Оформлений в стилі соцмереж — структуровано та з емодзі.

В цьому тестуванні краще за всіх впорався Claude 3. Gemini взагалі не змогла виконати завдання на основі посилання.

Проаналізувати документ та написати коротку суть

Gemini. В цьому ШІ відсутня можливість завантажити файл, тільки зображення.

Chat GPT. Після того, як дали йому команду і завантажили файл, чат написав, що не бачить файл, хоча він висить завантаженим. З другої спроби все вдалося і нейромережа надала опис загальними реченнями, неструктуровано.

Bing Chat. В цій нейромережі відсутня можливість завантажити файл, тільки зображення.

Claude 3. Цей штучний інтелект одразу надав опис суті файлу після його завантаження. До того ж зробив це відповідно до змісту і написав текст структуровано.

В цьому тесті краще впорався Claude 3. В той час як Gemini та Bing Chat взагалі не змогли виконати завдання, бо не дозволяють завантажувати файли.

Отже, можна робити різні тести найпопулярніших нейромереж — розпізнавання картинки на зображенні, написання синопсиса на основі сценарію, статті з промптом, створення скрипта для відеоролика тощо. І дивитися, яка мовна модель краще впорається з таском.

В цій статті я намагався ознайомити вас з характерними рисами, перевагами та відмінностями ШІ-моделей. Потрібно пам’ятати: всі нейромережі недосконалі, і сподіватися, що ви одразу отримаєте ідеальний результат, я не рекомендую. До того ж сам результат ще залежить від правильно сформованого промпту та можливостей ШІ.

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

То є такий *Giga Facepalm*, що мені аж стало цікаво читати далі.

Пане В’ячеславе, я перепрошую і правда не хочу образити вас, але ця стаття просто докорінно дискредитує ваші інтелектуальні здібності, технічні компетенції та навички публіцистики.

Знайти м’ягші слова мені нажаль не вдалось.

Був дуже засмучений, адже радів би появі україномовних технічних статей на тему великих мовних моледей, але весь контент, що трапляється, нажаль підходить тільки для того щоб покрінжувати з некомпетентності авторів.

І це в той час, коли русня просто розриває своїми науковими публікаціями в цій сфері, топовими місцями на кеглі і opensource-моделями досить високої якості, в які вшито всі анти-українські наративи. Нажаль. Сумно це :(

По тонкому льоду ходите )

За подібні коментарі в різних українських тематичних телеграм / ютюб каналах та ресурсах (не тільки технічних), мене звинувачували що я любитель руського міра, і банили зі словами «вали на свої русняві ресурси раз українські не подобаються». І все це з матами і образами, які я не получав навіть на руснявих ресурсах де не приховував що я українець часто займався відвертим тролінгом (без примітивних образ типу «смерть русні»).

По факту, нажаль, український сегмент сильно поступається по кількості і якості російському майже по всім сферам. А за здорову критику і поради, без матів і образ, тебе х*ми закидують і записують в любителі руського міра.

По поводу статті, непогано але не для ДОУ і не для технарів, більше для домогосподарок.

По поводу власного досвіду, пробував різні моделі вбивці chatgpt, щоб в 100ий раз пересвідчитись, що там більше маркетингу ніж результатів і до chatgpt їм ще рости.

Підписатись на коментарі