Mistral також випускає нові AI-моделі: Ministral 3B та 8B

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Mistral випустив дві нові передові моделі для обчислень на пристроях: Ministral 3B та Ministral 8B. Обидві моделі підтримують довжину контексту до 128k (зараз 32k на vLLM), а Ministral 8B має спеціальний інтерлінований патерн уваги з ковзним вікном для швидшого та більш ефективного використання пам’яті.

У поєднанні з більшими мовними моделями, такими як Mistral Large, Ministral також є ефективними посередниками для виклику функцій у багатоступеневих агентських робочих процесах. Вони можуть бути налаштовані для обробки введення, маршрутизації завдань і виклику API на основі намірів користувача в різних контекстах з надзвичайно низькою затримкою та вартістю.

Pretrained model comparison table

Pretrained model comparison graph

Обидві моделі доступні з сьогоднішнього дня.

Для використання на власних серверах потрібно зв’затись з компанією-розробником для отримання комерційних ліцензій. Вага моделі Ministral 8B Instruct доступна для дослідницького використання. Обидві моделі незабаром будуть доступні через хмарних партнерів.

👍ПодобаєтьсяСподобалось3
До обраногоВ обраному1
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі