Національна LLM за 9 місяців? Навіть ChatGPT сумнівається
Прочитав статтю, що Київстар, разом з державою має зробити національну LLM за 9 місяців і не просто дотренувати готову модель, а як каже Федоров створити технологію на якій будують LLM моделі.
ain.ua/...hho-ukrayini-llm-fedorov
Запитав ChatGPT і навіть він, попри своє підлабузництво до користувача, сумнівається:
Ось основні тези зі згаданої статті, які викликають певні сумніви, з поясненнями чому:
1. «Потрапити в топ‑3 країн світу за розвитком та інтеграцією AI до 2030 року»
Сумнів:
Рейтинг найрозвиненіших країн складається гігантами на кшталт США, Китаю та ЄС. Для досягнення топ‑3 Україні необхідно витратити величезні ресурси на R&D, інфраструктуру, талантів. На це потрібно
2. «Використання AI буде у
Сумнів:
Ця цифра звучить дуже узагальнено. Витрати на створення LLM включають:
- покупку обчислювальних потужностей (часто хмарних),
- оплату трафіку та енергії,
- виплати талантам і технічну підтримку.
Навіть із локальним хмарингом орієнтовна економія варіюватиметься залежно від масштабів, місця тренування і доступу до інфраструктури. Чіткої економічної моделі чи кейсів, на чому базується «2,5—3‑кратна економія», немає.
3. «Дані зберігатимуться в Україні — безпека для оборони й держсектору»
Сумнів:
Зберігання даних усередині країни — це лише частина кібербезпеки. Інша критична складова — архітектура, процеси, шифрування, аудит, SOC, відповіді на інциденти тощо. Наші супротивники мають потужні кіберздібності. Без комплексної системи захисту, просто локальне зберігання ніяк не гарантує реальну безпеку.
4. «Модель навчається на унікальних даних з поля бою»
Сумнів:
Ідея справді перспективна, але:
- дані із фронту часто неповні, неоднорідні, нерідко конфліктні;
- їх потрібно очищати, маркувати, структурувати;
- потрібні реальні нейронні застосунки для таких даних: ситуаційний аналіз, розпізнавання образів, мова—структуровані інтерфейси.
Тобто потреба в великих інвестиціях у дата‑інженерів, інтеграційні інструменти та навчання, щоб перетворити «унікальні дані» на цінний масив для LLM.
5. Терміни: запуск — до кінця 2025 року, дев’ять місяців реалізації
Сумнів:
Проєкт стартував у червні 2025, а завершення оголошене на грудень того ж року — це дуже стислі терміни для розробки повнофункціональної LLM. Створення, тренування, тестування, інтеграція — навіть із готовою архітектурою типу LLaMA чи Mistral потребує часу та ресурсів. Навіть великі корпорації закладали
6. «Київстар повністю покриває розробку моделі, без держкошті»
Сумнів:
Хай Київстар робить великий внесок, але тренування LLM — це дорогі GPU, хмарні ресурси, мережа доставки, підтримка. Без держфінансування є ризик, що проєкт або заморозять, або інвестують менше, ніж потрібно. Бізнес-інвестиції зазвичай повертаються довго, і вони, швидше за все, очікують комерційної віддачі або PR.
🔍 Думаю, варто уточнити:
- На чому саме базується економічна оцінка 2,5—3× дешевше?
- Які конкретно дані фронту використовуються та в якому форматі?
- Чи є попередні бенчмарки якості / продуктивності? (нативна українська, швидкість, точність)
- Чи заплановано зовнішній аудит кібербезпеки?
- Які резерви є, якщо приватні інвестиції недостатні?
Висновок:
Проєкт має стратегічне значення і може створити сильну базу для українського AI‑сектору. Але цілі (топ‑3 до 2030), оцінки вартості, масштабність і часові рамки — надто оптимістичні без деталізації. Їхня верифікація потребує чітких критеріїв, прозорої методології і проміжних результатів.
Я все ж вангую, що візьмуть щось готове і дотренують даними максимум. Але покажуть гарний інтерфейс і шо відповідає на наперед визначені питання про чий Крим.
Цікава думка експертів, хто з цим кожного дня працює, що скажете?
37 коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарівРешил расширить свой пост почему LLM это не всегда хорошё:
Она не умеет учиться на лету
После обучения LLM «замораживается» — она не может обновлять свои знания без полного переобучения.
Это устаревшая архитектурная особенность, особенно в мире, где информация обновляется ежеминутно.
Альтернатива: RAG (Retrieval-Augmented Generation) — добавляет доступ к внешним базам и позволяет получать свежие данные.
2. Память контекста ограничена
Большинство LLM работают с фиксированным контекстом (4k—200k токенов). Это значит, что они «забывают» прошлое или не могут держать большие документы в голове.
Решение: мемори-агенты, внешние базы знаний, архитектуры с постоянным состоянием.
3. Не понимает, а предсказывает
Модель не «понимает», а лишь угадывает следующий токен на основе статистики.
Иногда это приводит к галлюцинациям — уверенным, но ложным утверждениям.
Решения: мультимодальные модели, нейро-символьные подходы, механизмы верификации.
4. Нет reasoning по-настоящему
LLM не делает логических рассуждений в классическом смысле, она не использует цепочку доказательств (deduction/induction).
Хотя архитектуры типа Chain-of-Thought (CoT) делают это частично, они всё равно ограничены вероятностной природой модели.
Новое направление: LLM + Symbolic Reasoning, нейро-символьные гибриды.
5. Модели становятся «тупо» больше, а не умнее
Скачки в качестве моделей часто достигаются за счёт увеличения количества параметров, а не из-за интеллектуального прорыва.
Это дорого, медленно и неустойчиво в плане энергоэффективности и качества.
Куда нужно двигаться:
Efficient LLMs (tiny, low-latency, on-device)
Квантовые сети, квантовые вычисленя.
Specialized models для конкретных задач
Смарт системы.
Agentic LLMs: LLM как часть системы с памятью, восприятием, действиями
Что дальше: Post-LLM эпоха
LLM + RAG + Tools (toolformer)
LLM как исполнитель в мультиагентной архитектуре
LLM, подключённая к вебу, БД, API, памяти
LLM внутри гибридов с квантовыми вычислениями, символьной логикой, биомоделями
Вывод хлопцы можно сделать такой:
LLM не то что бы устарела, но её классическая форма — ограничена.
Сейчас ключевая цель — сделать LLM частью более интеллектуальной, адаптивной и контекстной системы.
Что скажите хлопцы? Критика приветствуется, возможно я что-то упустил? Админы не удаляйте мои посты, бо потом хочу заюзать для курсача!
LLM это вчерашний день, может кто-то может подсказать что, то почитать про квантовые сети, квантовые вычисления. Встречаются ли они уже сейчас на проектах?Например квантовые алгоритмы (например, Grover, QAOA) потенциально могут выполнять определённые вычисления в экспоненциально меньшие сроки, чем классические.
Область применение: криптография, оптимизация, генерация программ, симуляции (например, поведения частиц) для аи моушена. Кроме того хлопцы, как я понял они могут и вместе с LLM гарно робыть.
сьогодні АІ бурхливо розвивається, і явно вже показує свій потенціал, тобто значною мірою перейшов у доволі практичний розряд у свому розвитку
точно не фізик, питання треба було б ставити як quantum computing взагалі має працювати, незважаючи що вкладатися почали зовсім не сьогодні
експоненціально невідомо)
Неееет. Дело в том что, квантовые сети — это основа абсолютно защищённой передачи информации. Программисты, работающие в Web3, финтехе, блокчейне, уже сейчас пробуют юзатьQKD (quantum key distribution) и post-quantum cryptography.
Уже сейчас LLM могут использоваться как «интерфейс» между программистом и квантовым API. Например, вы описываете задачу на естественном языке(нлп) — LLM генерирует код на Qiskit (IBM) или PennyLane (Xanadu). Тута лучше юзать MAS с моей точки зрения
Вот пример:
вы пишите:
«Создай квантовую схему для телепортации кубита»
LLM генерирует рабочий код на Qiskit за секунды. И айда.
И еще, Связка LLM + квантовая симуляция позволяет автоматизировать генерацию, объяснение и отладку квантовых алгоритмов.
Это важно, потому что квантовые алгоритмы сложны, и LLM помогает программисту:
писать квантовый код
визуализировать схемы
объяснять, как работает суперпозиция или запутанность
Разработка в будущем будет включать гибридные приложения, где часть логики работает на классических машинах, а часть — на квантовых (через облачные API типа IBM Quantum, Xanadu, Amazon Braket).
... qubit teleportation — можна сказати що точно ШІ не позаздриш з формуліровками питань
в розділі «експоненціально невідомо» багато чого є
Читайте выше я уже про это писал, LLM → Qiskit. могу выложить пример кода с объяснениями
можно поконкретнее...
122-ая forever!
можна було би написати — ясно, аби хтось знав би щото такий за намбер в quantum контексті ...
Гаразд, схоже що є частина людей яка вважає що ці аргументи варті обговорення, давайте проаналізуємо.
Почнемо з загального формату відповідей. Формат можна звести до наступного:
твердження — Сумнів.
Загальний висновок.
Це наводить на думки що промпт звучав десь наступним чином — «Проаналізуй текст статті та знайди сумніви щодо тверджень, поданих в статті.»
Якщо він виглядав саме так, то це приклад свідомої або не свідомої маніпуляції. ChatGPT як і інші LLM натреновані виконувати запити користувача. Скажете знайти сумніви — знайде, скажете довести що 2+2=5 — доведе.
Кращий промпт звуав би наступним чином(і так, англійською один з параметрів краще):
«Take on a role of an expert in state governance wit clear, unyielding motivation to provide the best governance in the AI sphere. Do the following:
1. Read an article by minister of digital transformation of Ukraine.
2. Find claims and plans made in the article.
3. Analyse them, provide how realistic are them
4. Prove all your claims via search and referencing article which further prove your points.»
після чого
«Validate your latest response again, find points for improvement. Provide a new improved result»
Тепер по самим аргументам:
тільки от в оригінальній статті звучало це трішки інакше:
«У напрямі АІ ми поставили амбітну ціль — до 2030 року потрапити в топ-3 країни світу за розробкою й інтеграцією штучного інтелекту в публічний сектор» — нюанс про публічний сектор змінює дуже багато. Є сенс говорити далі?
в оригінальній статті на яку дали посилання немає такої інформації
"
"
в оригінальній статті на яку дали посилання немає такої інформації
в оригінальній статті на яку дали посилання немає такої інформації
в оригінальній статті на яку дали посилання немає такої інформації. Попередні статті говорили про бету до кінця 2025р.
ок, а де аргумент?
Виглядає що автор сам не читав аргументи ChatGPT і не порівнював з статтею.
А що це змінює? «Публичний сектор» це вода-водою, розумій як хочеш. Але далі що в статті?
О! це конкретні приклади, чи реально їх досягти?
чи ви погоджуєтесь з цим твердженням від ChatGPT? Чи це хибний аргумент? Як на мене логічний.
Ні, це дуже позитивна оцінка від ChatGPT, я не згоден. Ніколи у найближчому майбутньому більш точна. Доки не будуть зарплати на рівні Mistral AI та Open AI. Тому пустобрехи.
Публічний сектор це цілком стале твердження з конкретним визначення.
«Публічний сектор — це частина економіки, яка контролюється або фінансується державою (урядом) на різних рівнях: національному, регіональному чи місцевому.»
Змінює це дуже багато, ми починаємо конкурувати не з OpenAI чи Anthropic, а з урядами інших держав.
Чи реально досягти закладення фундаменту, що дасть нам змогу створювати інноваційні продукти на кшталт тих, які розробляє Mistral AI або OpenAI? Так, реально
Тут ж мова не про розробку ChatGPT а про закладення фундаменту. Це настільки політично-софістична фраза що навіть незнаю чому ви вирішили до неї докопатись, бо навіть створення освітньо-навчальної програми де викладають AI можна вважати закладенням фундаменту для цього.
А нащо ресурси на R&D якщо мова про проникнення в публічний сектор? І що таке величезні ресурси? І чому існуючих талантів недостатньо? Таке враження що цю тезу теж якийсь політик казав.
Незнаю що означає пустобрехи, але як я і стверджував спочатку — аргументи на які є сенс відповідати в топіку відсутні. І чому ви мені пишете щось про5-10 років незрозуміло.
За решту 5 з 6 аргументів ви згодні? Чи в них теж є якась цінність?
Ви серьозно думаєте, що цей проект — про LLM? Ні, як і все зеленій команді, цей проект — про розпіл бюджетного бабла на «національний LLM». Хомячкі досі не хочуть подивитись вгору.
это такая же глупая идея как в свое время попвтки создать национальную соцю сеть
Це туди же де мільйон дронів, чи кібрбезпека. При тому як той же Маск розповідає, з якими складностями стикається при побудуові датацентру в якому величезна ферма із відеокарт. Скількі на розбудову такого датацентру йде грошей, які сладності.
Віцепремьєр реально підіймає такі питання, коли в країні нестача боєприпасів, здійнюються атаки по 500 дронів та 120 ракет і т.д., смертників бусифікують в ями, 400 мільярдів гривнів дефіцит бюджету і кожен цент на рахунку тощо. Як то кажуть на росії : «Жизнь висит на нитке, а думает о прибытке.»
Обожнюю коли купка геніїв використовує відповіді ChatGPT як аргументацію/контраргументацію для прийнятого/неприйнятого рішення. Це в стилі «відставний генерал НАТО вважає що війна зайшла в критичну точку!! Дивитись все відео без реклами»
Яка різниця, звідки йдуть аргументи, якщо вони обґрунтовані? Так, можна написати ChatGPT дурний, не розуміє. Можна написати, що навіть дурний ChatGPT розуміє. Але чому б не критикувати самі аргументи, а не джерело?
Ні, не зовсім. Якщо так є «тому що», то так, але тоді немає сенсу звертати увагу на джерело, а більше на аргументи.
різниця в тому що факт походження з ChatGPT використовується як аргумент важливості та корисності аргументу: "
"
При тому що усіма LLM можна зманіпулювати так, щоб вони надали будь-які аргументи, за чи проти.
Тобто автор не займається вибудовуванням якісних аргументів за чи проти, а пропонує обговорювати відповіді згенеровані ChatGPT, так наче б то їх є сенс обговорювати відірвано від промпту і інших параметрів.
Бо обговорювати їх є сенс з першоджерелом. Доки автор не надав своїх думок та аргументації тут аргументів немає. А з ChatGPT я вже все обговорив, він вважає що ця ідея дуже прибуткова і принесе Україні мільйонні прибутки, і дозволить всім виплачувати пенсію 4000$.
Ні, тут скоріше навіть тупий ChatGPT може навести логічні аргументи
І що? То згенеруйте, будемо порівнювати аргументи. От, можна починати з першого:
Згенеруйте «за», обговоримо.
Ок, припустимо хтось написав елементарний доказ теореми Ферма, чи вічний двигун. Ти в принципі розумієш, що це малоймовірно. Але самому розбиратися ліньки, нехай це зробить ChatGPT. Якщо відповідь заслуговує на повагу, відповім. Не бачу нічого кримінального.
Чому, якщо код написав ChatGPT, та він працює, ти це можеш опублікувати навіть з посиланням на ChatGPT, і це сприймається нормально, а про національну LLM не можна?
Чому? Мені аргументи здалися заслуговуючими на повагу. Більшість коментаторів налаштовані ще критичніше.
В данному разі мені читати текст, який згенерував ChatGPT цікавіше, ніж те, що нагенерували ви, бо там є аргументи, а ви давите авторитетом.
не бачу сенсу витрачати свій час на аргументи, під якими навіть автор посту не готовий поставити штамп що він погоджується з аргументами. Це ок використовувати будь-які інструменти для формування думки, але вкидати щось в інфопростір з підписом дивіться що ChatGPT згенерував — ні. Якщо ви чи автор хочете дискусії виділіть аргументи свої, сформовані за допомогою ChatGPT чи ні, і тоді їх буде сенс обговорювати. Якщо немає навіть сміливості визначити власну думку і власні аргументи, то дискусія має ризик звестись до — «а от ChatGPT думає інакше»
можна, тільки треба приймати відповідальність за свій код і згенеровані речі.
Коли я чи мої інженери комітають код, то це моя і їхня відповідальність за робочість цього коду. Якщо інженер прийде до мене з згенерованим кодом в форматі типу — дивись що ChatGPT написав — то я його і дивитись не буду. Нехай провалідує код, скаже що він робить і що ні, а тоді вже буде сенс його обговорювати. Бо зараз автор хоче отримати валідацію згенерованих аргументів, особливо не описуючи власну позицію і не даючи оцінку аргументам.
Буду вдячний якщо вкажите де я давлю авторитетом. Я послідовно пропагую відповідальність та формування власних думок людиною, замість обговорення згенерованого тексту.
це до цього
Для мене є ентимема, що якщо людина постить аргументи, то вважає їх принаймні цікавими. Чи вам треба щоб кожен раз після цитати ChatGPT ставити (підписуюся під кожним словом)?
як варіант наводжу доведення 2+2 = 5
chatgpt.com/...caab88191a16eaf780d16550a
Цілком логічні аргументи як на мене
Звісно, що якщо прийняти аксіому, що a + 0 = a + 1, то можна довести 0 = 1.
Тут питання до набору аксіом.
прошу
dou.ua/...campaign=04072025#2983985
найцікавіше що самі аргументи детально прочитав лише перед аналізом, але моя попередня оцінка була абсолютно коректна — 0 якісних аргументів.
Мені це нагадує frost (first russian operation system)
Її випустили років 20 тому. Чи тільки хотіли випустити. В будь-якому випадку це був перший і останній раз, коли я чув про цю ОС )
Ну, все буде як завжди. Викотять якусь хрінь, розпиливши мільярди.
Візьмуть meta llama, дотюнять rag-ом (або навіть може донавчають). Скажуть що зробили своє. Profit!
Я от тільки не розумію. Нахіба???
Hugging face буквально ломиться від безліч відкритих моделей (з яких 95% нікому не потрібних). Нахіба там ще одна???
А нафіга? Magistral прекрасно розуміє українську мову. Гроші в нікуди.
Тут гарно мені відповіли dou.ua/...renko-about-national-llm.
Дотренують open source llm якусь.
> А нафіга?
Думаю, шоб тримати свої дані в себе, а не віддавати openAI чи ше комусь.
Magistral відкрита собсно і прекрасно розгорається локально на відносно бюджетному залізі. Але Федоров хоче пиляти з 0, я так розумію.
... солодкі бюджетіки
Свій Turkish Airlines, своя Nvidia, своя LLM.
Черговий тупий популізм від найгіршої влади в історії країни.
Коментар порушує правила спільноти і видалений модераторами.
Федоров, перелогинься
На***?
У нас вийшло чудове інтерв’ю на цю тему з CTO ШІ-центру Мінцифри dou.ua/...renko-about-national-llm
Там більше деталей про бачення національної LLM.
Дякую за статтю, а ну все зрозуміло, візьмуть шось опенсорсне і дотренують даними.
Тоді 9 місяців виглядає реалістично для бети.
То Федоров шось заговорився, або не розуміє і почав про технології які будуть llm.