Мінцифри і «Київстар» обрали AI-модель, на якій працюватиме національна LLM

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Мінцифри та «Київстар» визначили базову архітектуру, на якій будуватимуть українську велику мовну модель. Для національної LLM обрали Gemma 3 — відкриту модель Google, яку адаптуватимуть під українську мову та локальні завдання.

Про це DOU повідомили в Мінцифри.

Проєкт курує WINWIN AI Center of Excellence. Його керівник Данило Цьвок каже, що вибір робили з огляду на якість роботи Gemma з українськими текстами, можливість контрольованого навчання та мінімізацію лінгвістичних ризиків.

Директор з розробки диджитал-продуктів «Київстар» Михайло Нестор додав, що модель також обрали через баланс продуктивності та вимог до інфраструктури.

«Модель підтримує понад 140 мов, включно з українською, має до 128 тисяч токенів, мультимодальні можливості (робота із зображеннями) та гнучку архітектуру, що дозволяє адаптувати її під різні завдання», — каже Нестор.

Також модель має декілька розмірностей, що дозволяє легше адаптувати її під різні сфери застосування.

Тепер розробники адаптуватимуть під українську мову. Зокрема:

  • покращать токенайзер, щоб оптимізувати обчислювальні витрати і зробити національну LLM більш точною з українськими текстами;
  • додадуть великий корпус україномовних текстів, над якими працюють спеціалісти;
  • створять власні бенчмарки, щоб перевіряти точність.

Зазначимо, що модель Gemma вже використовують україномовні LLM — MamayLM та Lapa LLM.

Все про українське ІТ в телеграмі — підписуйтеся на канал DOU

👍ПодобаєтьсяСподобалось1
До обраногоВ обраному1
LinkedIn



5 коментарів

Підписатись на коментаріВідписатись від коментарів Коментарі можуть залишати тільки користувачі з підтвердженими акаунтами.

А навчальні датасети та датасети для оцінки будуть публікуватись? Чи це буде закрита модель?

Авжеж! Це ж йде під егідою Олексія Борнякова та Михайла Федорова. А їх підтримує сам пан президент Зеленський, який завжди за відкритість та прозорість!

То най буде

Посилання на MamayLM старе — ми зробили останню версію на базі Gemma 3
dou.ua/forums/topic/55834

Дякую! Виправив на актуальний допис

Підписатись на коментарі