Коли вийде національна LLM і скільки коштує її розробка. Головні питання CTO ШІ-центру Мінцифри Дмитру Овчаренку

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

4 лютого у межах стратегії інновацій WINWIN Мінцифри оголосило про запуск AI Center of Excellence. ШІ-центр має стати ядром національної ШІ-екосистеми. У лютому 2025 року команда анонсувала перші продукти та цілі. Серед них — створення ШІ-асистентів у «Дії», «Мрії» та юридичних сервісах, зростання ШІ-стартапів на 50% на рік, а також запуск національної мовної моделі.

За технічне втілення відповідальний Дмитро Овчаренко, екскерівник GenAI-напряму в SoftServe. Він став CTO ШІ-центру. Ми поговорили з ним про те, що насправді стоїть за створенням української LLM: які елементи вона має містити, що мовна модель зможе робити і кому буде корисна, чи вистачає в Україні обчислювальних потужностей, на яких даних її навчатимуть і як навчити LLM правильно відповідати на запитання типу «Чий Крим?».

Також поговорили про архітектуру, бюджет, роль університетів, плани щодо відкритого коду, ризики атак і перспективу увійти в трійки країн світу за AI у публічному секторі.

Найбільша технічна конференція DOU Day вже 16-17 травня в Києві.
Купуй квиток зараз, бо потім — буде дорожче!

«На запитання „Чий Крим?“ відповідь має бути однозначною». Про національні LLM

— Що таке національна LLM і чим вона відрізняється від інших мовних моделей?

Національна LLM — це велика мовна модель, яка створюється з урахуванням мовних і культурних особливостей певної країни. Вона зазвичай базується на open-source архітектурах, таких як LLaMA, Mistral або Gemma, і доповнюється специфічними національними мовними корпусами.

Тренд на національні LLM розвивається паралельно з комерційними та опенсорс-рішеннями. Зараз національні LLM мають понад 15 країн: Саудівська Аравія, Польща, Сингапур, Казахстан, OAE, Японія тощо.

Є два підходи до створення національної LLM: взяти опенсорс-архітектуру й доповнювати її корпусами національного контексту, тобто специфічними мовними даними. Або ж тренувати модель з нуля.

Національна LLM може виконувати безліч функцій, як і комерційні моделі. Наприклад:

🔵 У «Дію» щомісяця надходить до 100 тисяч запитів від громадян — про сервіси, замовлення чи проблеми з функціонуванням. Це велике навантаження для команди підтримки, тож віртуальні AI-асистенти розвантажать команду і підвищать ефективність роботи.

🔵 Мовну модель можна використовувати для аналізу нормативних актів. Наприклад, у Мінцифри ми перевіряємо нормативні акти на наявність цифрових аспектів — згадки про бази даних, обробку інформації, застосунки. Уже зараз ми інтегруємо асистента в систему документообігу АСКОД, який виділяє важливі моменти й пояснює, чому на них варто звернути увагу. Це економить час експертів і прискорює ухвалення рішень.

🔵 В оборонній сфері теж є кілька варіантів застосування LLM — від генерування синтетичних даних до аналізу різних ситуацій. Але це не публічна історія.

🔵 Ще один приклад — застосунок «Мрія». Тут мовна модель зможе допомагати організувати навчальний процес, перевіряти тестові завдання, або робити рекомендації. Наприклад, якщо учень має здібності до малювання, модель запропонує йому відповідні навчальні матеріали.

Загалом національна мовна модель буде використовуватися в усіх сферах. Передусім це буде корисно в телекомунікаційному секторі, для банківських і фінансових компаній.

— Чи є країни, які розробляють мовну модель з нуля, окрім Китаю?

Я таких прикладів не бачу. Навіть Саудівська Аравія, маючи величезний бюджет, використовує pre-training. У них є модель ALLaM на 70 мільярдів параметрів, але вони все одно базуються на наявних архітектурах. Їхній мовний контекст досить специфічний, адже існує багато діалектів арабської мови.

Індія теж обрала шлях pre-training на основі опенсорс-архітектур. Вони працюють із 18 різними діалектами, що додає складності. Аналогічно в Японії.

Чому більшість країн обирають саме цей підхід? Бо мета — не просто створити модель «заради хайпу». Ключове завдання — адаптувати моделі до національного контексту, щоб вона відповідала конкретним потребам.

Які саме цінності LLM ми виділяємо для себе:

  1. Культурне значення. Наприклад, на запитання «Чий Крим?» відповідь має бути однозначною. Плюс модель повинна враховувати правильні наголоси, терміни, діалекти тощо.
  2. Безпека. Деякі застосунки та державні організації не можуть розміщувати свої моделі в хмарі. Вони повинні працювати локально, на серверах міністерств або відомств, без виходу за межі певної будівлі.
  3. Оптимізація вартості. Українська мова має більш складну морфологію, що впливає на токенізацію. Наприклад, якщо порівняти одне й те саме речення англійською та українською мовами, то кількість токенів у другому випадку буде в 1,5–3 рази більшою. Це впливає на швидкість роботи моделі (кількість опрацьованих токенів за секунду) і вартість обчислень, оскільки комерційні моделі беруть плату за кожен токен.

Для прикладу, у Мінцифри обробляється близько 100 тисяч документів на рік. Один нормативний документ у середньому містить 85–150 тисяч токенів. Якщо розрахувати витрати на обробку цих документів у комерційній моделі, сума буде значною. Тому ми аналізуємо, що вигідніше: розгортати рішення локально на серверних GPU чи використовувати хмарні сервіси. Для нас важливо, щоби документи аналізували в Україні, бо це питання безпеки.

«Українська модель буде у вільному доступі для некомерційного сектору». Про технічні аспекти LLM

— На якому етапі зараз розробка україномовної LLM?

Ми ще не перейшли безпосередньо до її розробки. Зараз триває етап формування концепції: визначаємо задачі, формуємо оргструктуру, збираємо команду, оцінюємо бюджет і таймлайн, шукаємо партнерів і механізми залучення науковців, університетів і бізнесу.

Вибір моделі — це досить складне завдання. Ми спочатку фокусувалися на одному провайдері, але світ штучного інтелекту розвивається дуже швидко. Постійно з’являються нові архітектури, моделі, і нам доводиться тестувати різні варіанти, щоб ухвалити оптимальне рішення на основі бенчмарків. Тому ми ще не обрали, на основі якої архітектури робитимемо нашу.

«Єдине, що можу сказати точно: ми не розглядаємо китайські моделі та підходи»

Ми багато аналізуємо досвід інших країн, зокрема орієнтуємося на дослідження OpenBabylon, УКУ та lang-uk.Тут дуже детально описано підходи різних держав до створення мовних моделей. На базі цих напрацювань ми сформували свій roadmap, розуміємо ключові етапи роботи та оргструктуру.

Українська модель буде у вільному доступі для некомерційного сектору — держави, університетів, шкіл, науковців. Щодо бізнесу, то ще думаємо над умовами. І процес створення має бути максимально публічним. Бо ми не знаємо деталі про досвід інших країн, тому хочеться розповідати про кожен етап: як планували, тестували, організовували.

Точно можу сказати, що це буде pre-train на наявній архітектурі, а не розробка з нуля. Це значно дешевше, але все одно потребує серйозного фінансування. З досвіду інших країн скажу, що бюджет може коливатися від $1,5 до 8 мільйонів. Державного фінансування не передбачено, тому шукаємо інвесторів для цієї ініціативи.

Наш фокус — маленькі мовні моделі (1-5 млрд параметрів) і середні (12-16 млрд параметрів). Досвід Gemma та останніх версій LLaMA показує, що це хороший напрямок.

Основна відмінність національної LLM для нас — мовний контекст:

  1. Використання національних токенів.
  2. Токенайзер і ембединги.
  3. Вбудовані механізми контролю безпеки (guardrails).

Будь-який публічний продукт відразу стане мішенню для атак, тому питання захисту критичне. Guard — теж модель, тут ми орієнтуємося на Llama Guard, яка має гарні результати в тестах. Це моделі приблизно на 1 млрд параметрів.

Тому триває підготовчий етап, і вже у квітні маємо ухвалити остаточне рішення про архітектуру та інвестора, з яким будемо працювати далі.

— Чи вистачає в Україні обчислювальних потужностей для навчання LLM?

Якщо говорити про pre-train, то, на жаль, наявних обчислювальних ресурсів в Україні не вистачає. Ми розуміємо, які GPU потрібні для навчання маленьких і середніх моделей, і якщо використати всі доступні потужності дата-центрів в Україні, ми просто заберемо всі GPU-ресурси.

Але якщо говорити про інференс (використання вже натренованої моделі), то в нас є хороший потенціал. Ми локально тестуємо різні моделі на H100 і менш потужні GPU, аналізуємо архітектурні виклики та можливості масштабування.

Дата-центри в Україні активно розвиваються в цьому напрямку. Я спілкувався з лідерами ринку та хмарними провайдерами, всі вони готуються до майбутніх AI-навантажень.

— На яких даних її тренуватимуть?

Збір дата-сету для pre-train, ембедингів, токенайзерів і майбутніх моделей — це складний процес. У нас є багато книжок українською мовою, але вони захищені авторським правом, і це ускладнює використання цих артефактів для навчання моделей.

Тому я б хотів подякувати ком’юніті та університетам, які вже роками збирають відкриті джерела українською мовою. Це й новини, Вікіпедія і так далі. Також є дата-сет «Малюк». Він один з найбільших — 113 гігабайтів вичищеного тексту. Крім нього, є NER-UK, UA-GEC, БрУК та інші.

Цих даних достатньо для малих моделей, але явно не вистачить для середніх. Ми вже знаємо, де знайти більше даних. Зараз спілкуємося з університетами та науковими структурами, будемо працювати в цьому напрямку.

— Як модель працюватиме з чутливими даними?

Ідеального дата-сету не існує, тому питання чутливих тем, як-от «Чий Крим?», будемо розв’язувати через донавчання моделі після її базового тренування. Спочатку модель навчиться на загальному масиві текстів з відкритих джерел, а потім буде fine-tuning на спеціально підготовлених даних.

Важливо, що ці дані проходитимуть перевірку експертами — істориками, лінгвістами, культурними діячами. Саме вони сформують «етичний борд», який відповідатиме за якість інформації. Джерелами будуть новини, наукові публікації та інші перевірені матеріали, що не містять дезінформації.

Тобто модель не просто «візьме» дані з інтернету, а проходитиме додатковий шар фільтрації та адаптації під наш контекст.

— Коли планується запуск національної LLM?

Відповідно до нашої Roadmap, за ідеальних умов середня модель має вийти через дев’ять місяців. Тобто в листопаді-грудні 2025 року. Але це не тільки модель, а й guardrail, ембединги, токенайзер. Тобто ціла екосистема певних моделей.

Перед релізом моделі є ще кілька важливих етапів, які необхідно пройти. Один з них — оцінювання людьми (Human Evaluation). Для цього потрібно залучити велику кількість профільних експертів, які тестуватимуть модель за різними запитами. Вони оцінюватимуть відповіді моделі, визначатимуть правильні та неправильні відповіді і допомагатимуть у коригуванні її роботи.

Security red teaming — це етап тестування безпеки моделі. Він охоплює перевірку моделі як самостійно, так і її взаємодії з guard (захисним механізмом), що передає запити та відповіді від моделі. Тестування на вразливість допоможе виявити можливі недоліки в безпеці та захистити модель від потенційних атак.

Необхідно також забезпечити правильне отримання результатів (інференс) для тестування моделі. Це може стати певним викликом, оскільки потрібно не тільки перевірити роботу моделі, а й впевнитися, що вона працює стабільно в реальних умовах. Цей етап передбачає налаштування інфраструктури для тестування.

Важливою є підготовка документації, що охоплює всі етапи проєкту, його реалізацію та застосування.

— Які можуть виникнути труднощі на цьому етапі?

Ризиків кілька. Досвід інших країн показує, що експертиза у створенні таких систем — унікальна. Якщо ми починаємо з нуля чи навіть з попереднього навчання, потрібно побудувати інфраструктуру, розробити правильні бенчмарки, підготувати і почистити дата-сет, усунути дублікати. Це складні етапи, на яких можуть виникнути різні проблеми.

Наприклад, доступність інфраструктури в потрібний час — це очевидний ризик. Навчання моделі може займати місяці, залежно від масштабів потужностей. Тут важливо, щоб у нас був доступ до нобхідних ресурсів вчасно.

Ще один аспект — створення організаційної структури. Ми повинні забезпечити, щоб певні органи, зокрема культурно-етичні, були максимально незалежними від інвесторів. Це дозволить їм заблокувати проєкт, якщо модель працюватиме не так, як очікувалось.

З культурно-етичними питаннями тісно пов’язана безпека. Ми впевнені, що модель одразу потрапить у зону ризику атак, тому потрібне належне тестування системи безпеки — red teaming.

Загалом цей проєкт є дуже складним в організаційному плані. І, звісно, виникає питання фінансування — якщо його не буде, не буде й проєкту.

— Чи має українська LLM шанс стати конкурентом на міжнародному рівні?

Якби ми створювали LLM з нуля, то, можливо, у нас були б амбіції на міжнародний рівень. Основна мета української LLM — це задоволення внутрішніх потреб, а не глобальна конкуренція. Наш фокус — закрити потреби всередині країни, і я б хотів, щоб бізнеси в Україні конкурували між собою за допомогою мовних моделей для покращення своїх сервісів і загального рівня життя. Нам важливо створювати корисні асистенти і бути більш ефективними в управлінні країною.

Основна аудиторія при розробці української мовної моделі — це внутрішній ринок, варто спочатку збагачувати себе. І для цього у нас є необхідні ресурси. Тому коли ми говоримо про конкуренцію, то йдеться не стільки про саму модель, скільки про кількість і якість сервісів, які вдасться запустити. Якщо наша мета — стати однією з провідних країн у впровадженні штучного інтелекту в публічні сервіси, то саме кількісний показник стане рушієм, який дозволить нам рухатися швидше.

Зокрема, ми прагнемо до 2030 року увійти до трійки країн світу за розробкою та впровадженням AI у публічному секторі. Зараз до трійки лідерів входять США, Сингапур і Велика Британія. У британців приблизно 200 AI-сервісів в уряді. Нам потрібно рухатися в цьому напрямку.

— Як впровадження національної LLM вплине на ринок праці?

Вплив буде комплексним. По-перше, це нові можливості для студентів і науковців, які зможуть долучитися до валідації даних, тестування моделей і їх застосування. Це також посилить роль університетів у підготовці AI-фахівців.

По-друге, це дасть поштовх розвитку бізнесу, адже компаніям доведеться адаптуватися до нових технологій, інтегрувати AI-рішення та будувати AI-стратегії. Це стосується не лише великих корпорацій, а й малого та середнього бізнесу.

Крім того, AI створить попит на нові спеціальності та змінить традиційні підходи до роботи в різних галузях. Ми очікуємо, що це призведе до зростання продуктивності компаній та їхньої конкурентоспроможності.

Це також сприятиме розвитку локальних дата-центрів і клауд-провайдерів, що зміцнить AI-експертизу в Україні.

«Зараз у роботі вісім проєктів одночасно». Про AI Center of Excellence

— Які функції покладені на AI Center of Excellence?

Ключовий фокус центру — створення AI-продуктів. В Мінцифри є окрема команда, яка займається правовими аспектами та формуванням політики. Ми з ними співпрацюємо.

Наше основне завдання — дослідження та розробка (R&D), створення AI-лабораторій, а також надання бізнесу та партнерам можливості створювати AI-проєкти в Україні.

— Які продукти в розробці, окрім LLM?

Паралельно з LLM ми працюємо над іншими продуктами. Нині в роботі вісім проєктів одночасно: асистент для «Дії», Slack-боти для різних питань, зокрема HR-кейси, створення OKR, типові «питання-відповіді». Окрім того, ми як команда центру допомагаємо «Мрії» з AI-кейсами. Їхній запуск планується до кінця року.

— Під час презентації ви планували зростання стартапів на 50% в рік. Яким чином плануєте це реалізувати?

По-перше, штучний інтелект привертає увагу. Багато великих технологічних компаній мають спеціальні грантові програми для AI-продуктів. Наразі ми налагоджуємо стратегічні партнерства з цими компаніями, щоб полегшити доступ українських команд до таких грантів.

Ми також співпрацюємо з університетами та плануємо організувати низку хакатонів протягом цього та наступних років. Будемо інформувати університети, команди та компанії про можливості отримання фінансування для їхніх проєктів.

Створення AI Center of Excellence вже стало стимулом для співпраці з іншими країнами. Тепер вони розуміють, що можуть взаємодіяти з командою, яка спеціалізується на розвитку AI-проєктів та продуктів як для державного сектору, так і для підтримки бізнесу в цій галузі.

— Які компанії розглядаєте як інвесторів для LLM?

Наразі ця інформація під NDA. Можу сказати лише, що концептуально ми розглядаємо інвестиції від бізнесу і потенційне залучення інфраструктури провайдерів. Тут нам без підтримки великих гравців або суперкомп’ютерів університетів не обійтися.

— Чи плануєте розширення команди в найближчому майбутньому?

Залежить від цілей. Якщо ми побачимо, що з’явилася нова ціль і потрібно більше людей для її реалізації, то будемо розширюватися.

Все про українське ІТ в телеграмі — підписуйтеся на канал DOU

👍ПодобаєтьсяСподобалось14
До обраногоВ обраному1
LinkedIn



67 коментарів

Підписатись на коментаріВідписатись від коментарів Коментарі можуть залишати тільки користувачі з підтвердженими акаунтами.

Хочу нагадати, що це міністерство коштувало Україні 4.16 млрд грн на 2025 рік. Все для того щоб дізнатися чий Крим.
В той час є питання по протезам для військових:

Міністерство встановило граничну вартість протезів, яку оплачує держава. Так, для військових протез нижніх кінцівок — 856 596 грн, верхніх кінцівок — 543 451 грн. На все, що вище цієї суми, учасник бойових дій має знайти додаткове фінансування — з власної кишені, через благодійні фонди чи з бюджету місцевої громади. Окрема стаття державного фінансування — забезпечення протезами підвищеної функціональності за новітніми технологіями. Вони надзвичайно дорогі, і у цьому держава може допомогти не всім.

А потім якось виходить що ніхто не хоче воювати, а як так?

Мене завжди дивував один момент...

"

У нас є багато книжок українською мовою, але вони захищені авторським правом, і це ускладнює використання цих артефактів для навчання моделей.

".

Тобто людина, яка умовно пішла в бібліотеку, отримала знання з книжок (читай — з відкритих джерел), яка далі, спираючись на ці знання пішла та зоробила грошей (або зробила якесь особливе відкриття для людства) — це ок. А коли ці знання скормили нейромережі і вона почала ними користуватися та заробляти гроші (або робити відкриття), то це не ок? Це порушення авторських прав?

Шо не так з цім світом?)) Чі я шось не так розумію?

А тут складне питання. Шарінг книжок через бібліотеку, вірогідно, взагалі не відражається на продажах. А з іншої сторони автору буде трошки так прикро, якщо продукт, над яким він працював рік, один раз куплять, завантажать в нейронку і на цьому прибуток тої історії скінчиться

А чому б, наприклад, не переосмислити саму книжкову монетизацію? Всеодно може знайтися якийсь індівід, який закине ту літературу на якийсь торрент, з якого вона можливо колись тихо піде в датасет до навчання (десь пролітала така інфа наче Meta так робила, але не точно). Тобто сама наявність авторских прав не забезпечує недоторканність. Піди потім побігай по судах, ага.. Нам жеж потрібно національну культуру штовхати (у данному випадку), чи за банкнотою бігти? Але в цілому не можу не погодитися — складне питання))

Великі компанії в США забили великий х* на всі авторські права та і взагалі на всі персональні дані. Оптимізація прибутку для них головне. Тут вирішення не видно. Умовний ЄС скоріш за все буде мати регуляції для цього — але вони не будуть працювати якщо в США просто можна красти інформацію без наслідків.

Тому більшість компаній які тренують моделі (не тільки китайці, привіт Meta) активно кладуть великий болт на авторські права та піратять з LibraryGenesis.

Нейронка не «користується» знаннями, вона їх копіює, просто маленькими шматками (але інколи навіть великими, саме тому позов Таймс до Альтмана все ще на розгляді в суді, а не викинутий ще на ранньому етапі). Ну і взагалі вся історія з fair use має мету захищати людей і чесне використання захищеного контенту, а не програми які пишуть мегакорпорації для збагачення.

очередной потужный попил бабла под прикрытием лозунгов «Чей крым»

Черговий потужний вис*р під прикриттям «какая разніца»

Друже, ты чего такой агрессивный? Я тебя трогаю? На ровном месте на меня агрессию выливаешь.
Ты не имеешь права мне что-либо предъявлять потому что:
1. Кто ты такой чтоб мне что-то предъявлять?
2. Ты сидишь в своей Польше и что-то там вякаешь.
3. Я в отличии от тебя служу, пока ты пьешь свой лате на кокосовом молоке и держишь свой зад в тепле и комфорте. Не будь мудаком.

Прежде чем на кого-то гавкать, подумай, чего ты этим добьешься и стоит ли это того.
А если не хочешь об этом думать, то иди к черту, ты мне никто и звать тебя никак чтоб ты мне что-то предъявлял.

Ваша пассивная агрессия — тоже агрессия. Назвав чужое мнение «высером» c языковым подтекстом. Мой ответ на вашу агрессию структурирован по фактам.

Крім запитання «чий Крим», вона також буде давати правильну відповідь на «хто найвеличніший лідер сучасності». Всі правильні відповіді досі були в телемарафоні, і відтепер — в ШІ. Пропоную назвати модель Орвелл.

Стежу за вашим каналом на ютубі @dmytro-ovcharenko.
Толкові речі описуєте там 👍

Використовуючи слова архітекта, запитаю:
Які trade-off були зважені при порівнянні проекту «національного LLM» проти наприклад... «національного AI для автоматичного пілотування дронами»?

Дякую!

Загляну в новости — опять прилет, пожар и погибшие.
Загляну на ДОУ — новая инициатива Минцифры.
Одна страна — две реальности.

В цілому картина виглядає так, наче треба підняти військовий збір до 10%.

А як там Дія москвина Міши Фьодарава, у котрої відбувся злив даних 13,5 мільйонів українців у 2022-му році?

Це все компіляція. Роль кібербезпеки той-во

Поки у керма «трускавецька школа» та квартальщина, — доти усі ці «реформи» та «зміни» робитимуться тільки для схематозів цих московських колаборантів

Майже 6 років знадобилося мудрому наріду, щоб розгледіти цих потвор та невігласів. Хоть пАржали, надіюсь.

ДержСпецІнтелект

не знаю щодо самої концепції АІ викладеної тут, як такої, але видно, що більшість не дочитали далі, ніж тайтл, але гівна про розпил накинути на вентилятор — святе діло)

З досвіду інших країн скажу, що бюджет може коливатися від $1,5 до 8 мільйонів. Державного фінансування не передбачено, тому шукаємо інвесторів для цієї ініціативи.

Так а чого гівна на вентилятор, всі ж розуміють, що це розпил. Те що державного фінансування не передабачено, це стара схема, камон)))
Вже було таке, потім чудесним чином журналісти знаходили звʼязки цих компаній з депутатами....ну це в часи, коли була журналістика

Не знаходите протиріччя між поняттями «національна» — належить державі та громадянам, та «інвестиція», тобто буде на 100% приватним підприємством, та працювати в інтересах кінцевого бенефіціара, у якого у 99% випадків інтерес це заробити гроші?

Якщо не знаходите, то тоді OpenAI — це національна LLM, вона вміє українською приймати інструкції та надавати відповіді (з 20% ПДВ).

$ grep -oE '\b(буде|будемо|будуть)\b' | wc -l
18

Спіймав мужик золоту рибку:

— Хочу, щоб в мене усе було!
— Мужик! У тебе все було!

О черговый попіл податків на казкові історії. Де я курва живу — зупиніть землю я зійду.

А ця ллмка зможе зробити алгоритм авторизації, такий щоб ноумнейм банки не могли залогінити будь кого в «дію», де можна генерувати ецп?

Непогана ідея, принаймні жахливих ляпів у статті я не побачив. Але дивіться, вже пройшло 25% року, а кінь ще не валявся — у тексті йдеться про «майбутнє» (якісь майбутні лінгвісти/університети/інвестори). Звичайно, зклепати щось можна й за тиждень, але якість буде відповідна.

Щоб мати гарні результати завтра, експериментувати потрібно сьогодні, а дані потрібно було зібрати вчора, а ще позавчора інфраструктуру під ці дані. Й різні «забаганки», які хочуть вписати маркетологи, лише збільшують залежність від того, чого ще не зроблено. З мого досвіду, маючи гарні дані (а їх не буде) потрібно ~50 експериментів, щоб отримати модель з оптимальною якість/витрати. Тобто без спеціалізації у якомусь вузькому домені, якість моделі буде незадовільна. І виникає запитання, а чи справді потрібно витрачати кошти, щоб отримати дорогу (а без масштабів, сервити її буде дорого) й неякісну модель (а вона буде неякісною, бо 5B/16B мало для відкритого домену).

Якщо порівнювати з «дорогим» OpenAI: 100K документів * 100K токенів на рік * $2.50 за M = 10_000M токенів * $2.50 = $25K / рік для вхідних даних 4o, що дешевше однієї H100 або одного DS/рік, при цьому, якість недосяжна для малих моделей. А ціни на старі моделі скоро впадуть, загальна вартість ще зменшиться. Тому загалом — досить неоднозначне враження.

Щоб мати гарні результати завтра, експериментувати потрібно сьогодні, а дані потрібно було зібрати вчора, а ще позавчора інфраструктуру під ці дані.

Ну з міністерствами під егідою різних малоросів типу пана хведоріва та державою під найвеличнішим воно чомусь завжди так получається.

Он американська мормонська церква, коли почалась війна, то вони бистро заключили договір з кожним з обласних центрів України і оцифрували всі метричні книги, кожної церкви та синагоги України, що тут були ще з часів Польського королівства. За півроку все зробили та виклали у вільний доступ, без лишніх слів та піару. Все для того, щоб зберегти дані про українське коріння. Бо коли приходить срусня, то ця вся інформація знищується в першу чергу.

Сраколизам хведорів нічого не заважало оцифрувати все, що тільки побажаєш, за останні 6 років біля корита, але у нас можуть тільки гучними лозунгами кидатися.

Цікаво, не знав про «американська мормонська церква ...» кейс

Сайт familysearch.org
Якщо цікаво зайнятися своєю генеалогією.

Локально захостити дікпік діпсік, нє?

Зараз будуть пиляти бабки, потім за місяць до релізу піднімуть Бедрок(залежить від цін на нерухомість в Іспанії) або задеплоять діпсік на безкоштовний інстанс на якомусь heroku, якщо розпилять все.
Накрутять якусь мінімальну юайку силами епамівських джунів і вуаля, наш «атвєт западу» готовий)))

«На запитання „Чий Крим?“ відповідь має бути однозначною». Про національні LLM
string question = Console.ReadLine();
if(question == "Чий Крим?")
     Console.WriteLine("однозначною");

Частина ТЗ виконана, можна отримувати державне фінансування

А українську національну вакцину від ковіду вже закінчили розробляти?

Чекай, тут ще за 30 років національну ідею не знайшли.

В мене тут з’явилась ідея для державного стартапу.
Зараз, під час нищівної повномаштабної війни, все більш актуальною стає необхідність розробки національної операційної системи, яка б використовувалась на комп’ютерах держслужбовців, щоб убезпечити їх від ворожих хакерських атак.
Я навіть назву вже придумав: UKRainian ADvanced Operating System, або скорочено ukrados.
Підкажіть, хто в темі: до кого звернутись, щоб мені виділили окремий департамент в мінцифри?

Thank you sir, you are a man of culture, and you made my day.

Висловлюю всебічну підтримку цій ініціативі. Ви молодці і наша надія.

Шкода бачити масовану атаку від дуже сумнівних коментаторів.

Нажаль, схоже на те, що більшість незаангажованої аудиторії тут не має й гадки, наскільки ця робота критична і важлива в контексті національних інтересів та нац. безпеки у довгостроковій перспективі.

ті напевно теж з кварталу, напевно зі стендапами виступаєш? де можна подивитись, бо початок дуже інтригуючий.

Так а чим критична?
В нас біженці зі сходу сплять в хлівах, бо на них не побудували ніякого прихистку за 3 роки, в сільпо кредити на продукти, військові збирають гроші на базові речі і лікування.

Припустимо, що доступні в інформаційному просторі мовні моделі будуть визначати ідентичність наших дітей значно більшою мірою, ніж батьки і вчителі разом взяті, а етичні принципи і норми в ядрі цих моделей будуть задавати абсолютно чітку траєкторію суспільних настроїв таким чином, що ніякі мас-медіа і горизонтальні зв’язки не зможуть переплюнути цей вплив.

Правильно, кого ж єbе, що на кухні кавоварка з YandexGPT підтримала згадку росіян заспокоюючим жартом з нотками колективізму, а текстовий редактор викинув з публікації всі згадки про Азов. Ми то помічаємо таку фігню, еге ж? Щоб стати планктоном на підніжжі у «русского мира», зварившись як жаба в кастрюлі, народу треба десь аж ціле покоління мабуть, чи два? То чого ж перейматись, ще часу багато. А як стане зовсім туго, то завжди можна податися в неолудити!

Так ви розмірковуєте над цим?
Чи перспектива культурного рабства — то занадто висока матерія, щоб думати про майбутнє у такий скрутний час?

Мій комент про критичність і своєчасність. Ми знаходимось на соціальному дні, офіційно tax hell, люди виживають, а не живуть....
Щоб країна була комусь потрібна, треба боротись з корупцією, робочі суди, поліція, робоча соціалка і тд. Також потрібно, щоб закони працювали для всіх, а не тільки для бідних
Ви чомусь думаєте, що «руский мір» це про прапор, але це якраз про те що я описав вище

В мене є надія, що таких як ви меньшість і в людей які хочуть будувати Україну ще залишився мізерний шанс це зробити

Яким чином наукова діяльність у сфері нац. безпеки перешкоджає боротьбі з корупцією і соціальним роботам?

Маєте надію, щоб не було таких як я?

То що, ви хочете Україну, де будуть тільки поліцейські, судді, соц. працівники і військові, а інженерну та наукову діяльність в країні потрібно терміново згорнути?

— Наукова діяльсть ні, в тупу пиляти гроші через різні проксі, які назвуть іноземними інвесторами, перешкодає
— Звісно, маю надію, що таких людей буде меньше. Бо як би країна, яка знаходиться на самому дні, де люди голодують і не можуть дозволити собі продукти, має сконцентруватись на виходу з кризи. А то виглядає все як в совку, по телевізору літають в космос, а в реальності витираються газетою, бо дефіцит
— Хочу щоб це працювало на людей, а не на режим. Не дуже розумію, яке відношення має наша відповідь чату жпт до наукової діяльності. В вас же блін ціль зробити патріотичну LLM)))

Мені здається краще наукові ресурси направити на те щоб боротись з проблемою тотальної бідності
Але кому я про це розповідаю, ті хто підтримує це або живуть в іншій реальності або і так не зрозуміють, або просто усасники розпилу)

Бо на карго-культ легко виділити бабло, а поміряти ккд затрат досить складно. Я досить здивований, що до 2025го року ще не виділили 3 гігатонни дєнєг на створення національної криптовалюти, а перейшли одразу до ШІ

Якщо ви сприймаєте ШІ як карго-культ, то може вам краще зайнятись самоосвітою замість дискредитації тих рідкісних проблесків технологічного розвитку власної країни?

Тим паче в галузі національної безпеки, де без державної підтримки навряд-чи щось можливо. Це все-таки не дронів в гаражі збирати. Тут волонтери не зберуться і не зроблять своїми силами. Ви ж це розумієте?

То вам треба зайнятись самоосвітою, чи хочаб пропускати свої коментарі через ллмку і просити її шукати логічні помилки та дешеві маніпуляції ;-)
Може опануєте професію вайб коментатора

Так в нас і замануху у вигляді %що завгодно% + bluetooth, колись страшенно популярну в світі, старанно провтикали :)

Досить дивні люди пролазять в наші міністерства жижиталізації. Очікувано?..

//мені імхуєцця шо весь цей цирк з-за того що, «завдяки» повномасштабці, в Україну потекли великі гроші. І шановані люди тепер старанно вигадують як би ото не залишитись на узбіччі освоєння бюджетів. Бо садок вишневий біля власної, 3х поверхової, хати (і щоб гараж, басейн, всьо як в людей) десь в Португалії хочуть «не тільки лиш всі». А під що найпростіше вициганювати гроші в інвестора? Під те на що є зараз тренд в країні інвестора.

Наукова діяльсть ні, в тупу пиляти гроші через різні проксі, які назвуть іноземними інвесторами, перешкодає

Ну то вам тут розповідають про наукову діяльність пов’язану з нац. безпекою, а виходить, що вона вам перешкоджає, бо ви голословно кричите про розпил і безпідставно виставляєте це на сміх.

Така поведінка в інтересах якої країни?

Така поведінка в інтересах українців. Українці, для мене і є Україна. В тому наша фундаментальна розбіжність. Для вас Україна це влада, мова, вишиванка, потужні гасла....а для мене це в першу чергу люди

мовні моделі будуть визначати ідентичність наших дітей значно більшою мірою, ніж батьки і вчителі разом взяті, а етичні принципи і норми в ядрі цих моделей будуть задавати абсолютно чітку траєкторію суспільних настроїв таким чином, що ніякі мас-медіа і горизонтальні зв’язки не зможуть переплюнути цей вплив

АХАХАХАХАХАХ, ну это будет даже покруче чем Министерство Правды, фантазиям нейро-комиссаров нет границ

Чому ми маємо з бюджету покривати розробку кривої версії DeepSeek?

Щоб вона могла сміливо слати на три букви розробників продуктів російської екосистеми, лобіюючих нехтування національною безпекою в коментарях на DOU.

Така відповідь вас влаштує?

RAG became a commodity.

Розберіться скільки вартує донавчати з ембедінгом й що таке Langchain LoRA / QLoRa.

Тут пойнт що люди можуть робити то в гаражі за 30-40k$
Цінність відповідного рішення й адекватність бюджету дуже сумнівна.

Взагалі не зрозумів що ви мали на увазі, якась ахінея. Попросіть вашу ллм перефразувати для нормальних людей

Тому що треба відволікати увагу від інших феєричних рішень, як добровільно-примусове впровадження Cisco Umbrella, наказом КСЗІ, й злив всього українського документообігу, всіх державних установ, в невідомому (Pala.. кхем-кхем) напрямку.

Ну й так як нема відповідальності за згідно-відповідність, доступність, актуальність й коректність держ реєстрів. Міськради окрім Cisco ще мають мати бюджет й кадри на Oracle, й бути відповідальними за локальні держ реєстри й їх синхронізацію «з чимось»... з кінця цього місяця, кожна область, громада чи регіон з місцевим самоврядуванням — стає фактично окремим індивідуальним муніципалітетом, який має функціонувати децентралізовано, без потреби в працездатності Центральних органів влади.

В нас вимагають держ портали на крадяному бутстрапі (bootstrap italia) від сел, де нема бюджету замінити лампочки в сільраді.

Ви просто гадки не маєте який Мінцирк феєричний.

A давайте робити юридичний RAG й перевіряти брехню політиків й міністерства оборони про відсутність корупційних ризиків, й конституційність законопроектів і наказів ?...

Сильно-потужно Спроможні ?

ні на таке грошей не буде ніколи, а ідеологів думаю або позбавлять громадянства або під черговий бахмут відправлять, це ж основи української державності зруйнує.

Крінгемет працює на повну.

Ухх, ото і розпил буде
Якийсь сюр, в одній реальності пиляють лярди на нікому не потрібних патріотичних LLM, в іншій Сільпо видає розстрочки на продукти

Ну там в одному місці є доступ до кормушки з безлімітним баблом, а іншим по 12 годин треба впахувати за 15к грн.
В перших закінчуються ідеї як ще папіляти бабла, доводиться вигадувати необхідність створювати українську LLM (І це не будет форк ллами, чесно-чесно)

Якщо ми маємо стратегію вступу до ЄС, то чи не простіше це робити разом з ЄС?

Там он і потужності будуватимуть

www.euronews.com/...​-protect-critical-sectors

Якби мета була саме у створенні, а не у потужній незламності (розпил бабла), то це б мало сенс =)

Підписатись на коментарі