Бета-тест національної LLM запустять навесні 2026 року. У січні почнеться голосування за назву

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Бета-тестування національної LLM почнеться навесні 2026 року. На сьогодні триває збір даних для навчання мовної моделі.

Про це повідомив Михайло Федоров.

За його словами, йдеться не лише про відкриті джерела з інтернету, а й про великі масиви інформації від державних органів, медіа, університетів та інших інституцій. Паралельно розробляють юридичну рамку, щоб робота з цими даними відповідала вимогам безпеки й законодавства.

Окремо формують систему перевірки якості моделі. Група незалежних експертів створюють бенчмарки, які будуть оцінювати технічну якість моделі, знання української мови, розуміння національного контексту, а також етичності та безпечності відповідей.

У січні команда планує підготувати першу навчальну базу текстів, удосконалити токенізатор для української мови та запустити власні тести якості. Після цього навесні модель відкриють для бета-тестування.

Назву для національної LLM обиратимуть самі українці — голосування планують провести через застосунок «Дія» також у січні.

📌 Контекст

4 лютого у межах стратегії інновацій WINWIN Мінцифри оголосило про запуск AI Center of Excellence. ШІ-центр має стати ядром національної ШІ-екосистеми. У лютому 2025 року команда анонсувала перші продукти та цілі. Серед них — створення національної мовної моделі.

Розробку LLM почали у червні 2025 року. За технічну частину відповідає «Київстар», а уряд відповідає за координацію розробки та створення органів, які стежитимуть за якістю, безпекою та етичністю цієї технології.

У Мінцифри розповідали DOU, що проєкт фінансується за кошти бізнесу, без витрат з державного бюджету. Після запуску модель буде доступна для тестування державними, науковими та громадськими організаціями, а згодом відкрита у форматі open source.

Через два місяці Мінцифри і Київстар представили експертну групу, відповідальну за різні аспекти створення LLM.

У вересні на DOU вийшло інтерв’ю з CTO WINWIN AI Center of Excellence при Мінцифри Дмитром Овчаренком, в якому він детально розповів, як вирішують питання із захистом персональних даних, що отримає «Київстар» за розробку національної LLM і інші аспекти її розробки.

А 1 грудня стало відомо, що українську модель розроблятимуть на базі Gemma 3.

Все про українське ІТ в телеграмі — підписуйтеся на канал DOU

👍ПодобаєтьсяСподобалось1
До обраногоВ обраному0
LinkedIn



1 коментар

Підписатись на коментаріВідписатись від коментарів Коментарі можуть залишати тільки користувачі з підтвердженими акаунтами.

Нарешті для Єдиного Марафету не треба буде живих людей!

Підписатись на коментарі