Матеріали на тему «LLM»

RSS

Національна LLM: між політичними амбіціями та технологічними реаліями

Сергій Петренко 4801

Чи справді українська мова потребує окремої моделі? У чому її реальна проблема та яким є реалістичний план дій для її створення — читайте в блозі Сергія Петренка, відомого багатьом як колишнього керівника Яндекс.Україна та засновника одеського коворкінгу «Термінал 42». 99

Як я створила помічника, що допомагає відповідати на бізнес-запити

Kateryna Babii 2333

Катерина Бабій ділиться досвідом створення Business Insider Bot — AI-асистента, що відповідає на бізнес-запити простою мовою, будує графіки та генерує SQL-запити під капотом. 6

Мінцифри й «Київстар» розроблять українську LLM

Дарія Подвишенна 2394

Мінцифра та «Київстар» розпочали розробку першої української великої мовної моделі (LLM). Її тренуватимуть на відкритих україномовних даних без персональної інформації. 5

Постнавчання LLMs: від базових генераторів до розумних помічників

Dmytro Kuzmenko 3049

Дмитро Кузьменко, викладач НаУКМА та PhD Robotics Student, пояснює: чому LLM не працюють ефективно «з коробки» і як постнавчання перетворює їх на корисних, логічних та етичних агентів. А також розповідає, як навчають моделі міркування (reasoning models). 34

Товарні рекомендації нового покоління: як підвищити конверсію на 71% завдяки трансформерній моделі

Ivan Diulai 900

Іван, AI-Driven Marketing Specialist в eSputnik, пояснює, як поєднання трансформерів і LLM дозволило збільшити конверсію товарних рекомендацій до 71%. У статті він розкриває переваги нової моделі, її вплив на персоналізацію в ecommerce, а також наводить готові кейси її використання.

Cloud WAN, Gemini 2.5 Flash, та чи повторить ADK шлях Genkit — головне з Google Cloud Next (квітень 2025)

Nikita Galkin 805

Чи стане Pathways on Cloud масовим інструментом для розробників? Чи змінить цей анонс позиції на ринку LLM-вендорів? І на який саме підхід цього року робить ставку Google Cloud? Читайте про це в репортажі Нікіти Галкіна з конференції Google Cloud Next. 2

AI-кодинг, Observability, RAG та дані нового покоління — головне з Thoughtworks Technology Radar (квітень 2025)

Артур Шевченко 2924

Артур оглядає квітневий випуск Thoughtworks Technology Radar, оцінюючи найцікавіші інструменти, практики та тенденції. Від AI-асистентів і observability до GraphRAG і fuzz testing — ловіть стислий гайд за техтрендами першої половини 2025-го. 4

ШІ та узагальнення: чому тест ARC визначає майбутнє AGI

Oleksandr Knyga 1700

Олександр Книга, CTO та Head of AI у компанії WLTech, розповідає: чому ARC став бенчмарком для розвитку AGI (загального штучного інтелекту), які існують методи його розв’язання та чому ця тема стає все більш актуальною у світі. 11

Створюємо «пошуковий рушій» для інтернет-магазину за допомогою Embeddings

Pavlo Brykov 2158

Павло Бриков поєднав embedding-модель Alibaba та векторне сховище pgvector у PostgreSQL, щоб реалізувати «розумний» пошук із підтримкою транслітерації на сайті його онлайн-магазину. У статті він також пропонує можливі шляхи покращення перфомансу пошуку. 18

Як ми створили інструмент для постачальників державних закупівель на основі AI

Сергій Панькін 1304

Сергій Паньків та його команда створили SmartCheck AI — інструмент, що автоматизує опрацювання вимог держзамовників. Читайте у статті, як вдалось створити проєкт, що вже працює та допомагає учасникам закупівель Prozorro готувати якісні пропозиції. 3

Як запускати відкриті GenAI-моделі локально. Генеруємо переказ 8-годинного відео Валерія Маркуса

Yuriy Guts 6517

Юрій Гуц розповідає про можливості відкритих моделей штучного інтелекту, які можна розгортати у власному середовищі та використовувати офлайн. У матеріалі на вас чекає згенерований портрет айтівця зі спільноти DOU та вірш про українське IT, який міг би написати Тарас Шевченко. 27

Як і чому працює ChatGPT Assistant model. Пояснює Data Scientist

Pasha Lysyi 4782

Паша, Data Scientist із понад 6-річним досвідом, пояснює, як навчаються мовні моделі, які тут є можливості, обмеження та виклики. У статті детально описано етапи навчання від збору даних до впровадження людського фідбеку, а також основи архітектури Transformer. 19

10 АІ-подій, якій найбільше вплинуть на розробників у 2025-му

В'ячеслав Колдовський 4789

«AI-моделі стали достатньо розумними для того, щоб не просто писати код, а робити це навіть краще за багатьох розробників», — лідер AI-спільноти В’ячеслав Колдовський ділиться найбільш масштабними подіями зі світу штучного інтелекту, які вплинуть на роботу розробників у 2025. 1

Майбутнє з AI. Оптимізація роботи з LLM для зниження витрат без втрати продуктивності

vitaliy sobol 1539

Віталій, Software Engineer, розмірковує про згубний вплив використання AI на екологію та наше майбутнє. Та пояснює, що цього можна уникнути, оптимізувавши роботу зі штучним інтелектом за допомогою LATM — нової моделі роботи з LLM, що зберігає продуктивність, при цьому зменшуючи витрати. 4

Трансформуємо управління ресурсами в Azure за допомогою Microsoft Copilot

Victor Karabedyants 1057

Віктор Карабедянц розглядає Microsoft Copilot для Azure, який перевертає уявлення про щоденне використання платформи. Автор пояснює, як цей інструмент на базі GPT-4 оптимізує витрати, автоматизує рутинні завдання та підвищує безпеку даних.

Корпоративні GenAI-системи. Відмінність від відкритих систем та принципи роботи з даними

Igor Manzhos 1231

Ігор, віцепрезидент з технологій GlobalLogic, розглядає корпоративні GenAI-системи та їх відмінності від відкритих. А також описує принципи роботи з даними, підготовку інформації для системи та архітектуру, що забезпечує оптимізацію бізнес-процесів. 5

Сила графів знань для ШІ в застосунках RAG. Частина 2

Damien Berezenko 1429

Дам’єн Березенко розглядає застосування графів знань у системах RAG для отримання точних відповідей на складні запитання. Автор пояснює, як графи допомагають виявляти приховану інформацію та формувати зв’язки між даними, наводячи приклади використання графів для аналізу літератури та порівнюючи їх ефективність з векторним пошуком. 4

Моделі нескінченної уваги: виклики, рішення та компроміси

Damien Berezenko 1349

Дем’єн Березенко розповідає про механізм нескінченної уваги від Google, що розширює контекстне вікно моделей до 10 мільйонів токенів і відтак вирішуює проблему обробки великих текстів. Це корисний інструмент, однак він має свої недоліки, як-от втрата деталей та підвищені витрати. Детальніше у статті. 24

Wren AI Text-to-SQL: UI та API, або Як спростити роботу з реляційними базами в застосунках RAG/Agent

Damien Berezenko 1386

Wren AI — це конвеєрний застосунок для ШІ, який перекладає запити природною мовою на мову SQL, щоб ви могли спілкуватися з вашою базою даних у чаті. Це значно спрощує роботу зі структурованими табличними даними у застосунках RAG/Agent. Про те, як налаштувати інструмент, читайте в цій статті Дем’єна Березенка. 1

Як я розробив чат-бот зі штучним інтелектом

Сергій Труш 5055

У цій статті Сергій Труш розповідає про один зі своїх тривалих опенсорс пет-проєктів, робота над яким триває останні три місяці. Йдеться про репозиторій TelegramAIChatbot — україномовний телеграм чат-бот, написаний на Python з ШІ. 30

← Сtrl 12 Ctrl →

Коментарі

Ох, як дивно
Postman — не фреймворк
Ні, не підтверджується. skepticalinquirer.org/authors/geoffrey-a-dean
В нас сама ужасна бімба на планєтє! Аналагавнєт!
Є така штука як крива очікування від часу. Дуже грубо кажучи «чекати до 5 хвилин ок», а після шо 7 шо 8 суб’єктивно стає в області «піздец як довго», і додаткова хвилина не робить вже погоди, від незадоволеності.
Надзвичайно мала база по США. Варто шукати більше спеціалістів. Мені здається, що там має бути кілька тисяч ІТ спеціалістів з України.
Я також вчасно оновлював, але зараз зʼявився штраф, не до кінця розумію за що. Хотів як раз побачити / сплатити, але так само висить статус що шукає інформацію, не показує причину і можливості сплати.
Думаю на 3 місяця, бо військовий стан продовжують кожні 3 місяця. І нажаль не бронювання, бо «засоби по оповіщенню» від ТЦК ніхто не відміняв наскільки мені відомо.
Мені пише «У разі виявлення порушення вам прийде сповіщення з деталями». Але я вчасно оновлював, не повинно бути порушень. А знайомому вісвітилось плашка про невчасне оновлення в розділі штрафи онлайн. Буквально вчора пробували.
Чи мають такі внутрішні тестові покатушки якісь закриті можливості (як адмін-панель у розрабів). Бо, банально, дев може хоче додому їхати, а йому замовлення з [OFFICE_LOCATION] у Бориспіль кидає, а він десь біля Жулян живе :))))
мені як юзеру глубоко П+П на очікування клієнта «Б» Це поки ти сам не клієнт Б
Воно завжди так, — коли якийсь проєкт очолює відомий великий корупціонер, який займає посаду міністра, — то гроші кудись діваються, продукт «чомусь» виходить неякісним...
Державне бюро розслідувань затримало чоловіка, який номінально володів компанією Ще одне нагадування, що варто перевіряти юридичну інформацію про компанію, яка є у публічному доступі на сайтах Opendatabot та YouControl, зазвичай легко гуглиться, а...
тільки поки не працює. при спробі увійти в розділ сплати штрафів — вже більше доби висить в статусі «перевіряємо інформацію»