Nvidia випустила AI-модель, яка перевершує GPT-4o та Claude 3.5 Sonnet — без гучного релізу, але з гучними результатами
Компанія Nvidia представила нову модель штучного інтелекту Llama-3.1-Nemotron-70B-Instruct, яка перевершує продукти OpenAI та Anthropic.
Модель з’явилася на популярній платформі Hugging Face і швидко привернула увагу завдяки високим результатам тестів — 85.0 на тесті Arena Hard, 57.6 на AlpacaEval 2 LC і 8.98 на GPT-4-Turbo MT-Bench, випереджаючи такі моделі, як GPT-4o та Claude 3.5 Sonnet.
Створення Llama-3.1-Nemotron-70B-Instruct включало вдосконалення відкритої моделі Llama 3.1 від Meta за допомогою методів навчання, таких як RLHF (навчання з підкріпленням від зворотного зв’язку людини). Це може сприяти більш природним і контекстуально відповідним відповідям.
Модель має потенціал стати економічно ефективною альтернативою для бізнесу завдяки здатності обробляти складні запити без додаткових підказок чи спеціалізованих токенів. Вона показала себе в демонстраціях, надаючи точні та детальні відповіді, підкреслюючи здатність до глибокого розуміння мови.
Nvidia робить модель доступною для бізнесу через платформу build.nvidia.com із сумісним API, що спрощує доступ до передових технологій AI для ширшого кола компаній. Це відображає тренд на створення кастомізованих моделей, які можна адаптувати до потреб, будь то обслуговування клієнтів або створення складних звітів.
Проте модель має обмеження: її не налаштовано для спеціалізованих сфер, таких як математика або юридичне мислення, де важлива точність. Тому варто використовувати її з відповідними заходами безпеки.
55 коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів