Бета-тест національної LLM запустять навесні 2026 року. У січні почнеться голосування за назву
Бета-тестування національної LLM почнеться навесні 2026 року. На сьогодні триває збір даних для навчання мовної моделі.
Про це повідомив Михайло Федоров.
За його словами, йдеться не лише про відкриті джерела з інтернету, а й про великі масиви інформації від державних органів, медіа, університетів та інших інституцій. Паралельно розробляють юридичну рамку, щоб робота з цими даними відповідала вимогам безпеки й законодавства.
Окремо формують систему перевірки якості моделі. Група незалежних експертів створюють бенчмарки, які будуть оцінювати технічну якість моделі, знання української мови, розуміння національного контексту, а також етичності та безпечності відповідей.
У січні команда планує підготувати першу навчальну базу текстів, удосконалити токенізатор для української мови та запустити власні тести якості. Після цього навесні модель відкриють для бета-тестування.
Назву для національної LLM обиратимуть самі українці — голосування планують провести через застосунок «Дія» також у січні.
📌 Контекст
4 лютого у межах стратегії інновацій WINWIN Мінцифри оголосило про запуск AI Center of Excellence. ШІ-центр має стати ядром національної ШІ-екосистеми. У лютому 2025 року команда анонсувала перші продукти та цілі. Серед них — створення національної мовної моделі.
Розробку LLM почали у червні 2025 року. За технічну частину відповідає «Київстар», а уряд відповідає за координацію розробки та створення органів, які стежитимуть за якістю, безпекою та етичністю цієї технології.
У Мінцифри розповідали DOU, що проєкт фінансується за кошти бізнесу, без витрат з державного бюджету. Після запуску модель буде доступна для тестування державними, науковими та громадськими організаціями, а згодом відкрита у форматі open source.
Через два місяці Мінцифри і Київстар представили експертну групу, відповідальну за різні аспекти створення LLM.
У вересні на DOU вийшло інтерв’ю з CTO WINWIN AI Center of Excellence при Мінцифри Дмитром Овчаренком, в якому він детально розповів, як вирішують питання із захистом персональних даних, що отримає «Київстар» за розробку національної LLM і інші аспекти її розробки.
А 1 грудня стало відомо, що українську модель розроблятимуть на базі Gemma 3.

1 коментар
Підписатись на коментаріВідписатись від коментарів Коментарі можуть залишати тільки користувачі з підтвердженими акаунтами.