Чи справді українська мова потребує окремої моделі? У чому її реальна проблема та яким є реалістичний план дій для її створення — читайте в блозі Сергія Петренка, відомого багатьом як колишнього керівника Яндекс.Україна та засновника одеського коворкінгу «Термінал 42».
Катерина Бабій ділиться досвідом створення Business Insider Bot — AI-асистента, що відповідає на бізнес-запити простою мовою, будує графіки та генерує SQL-запити під капотом.
Мінцифра та «Київстар» розпочали розробку першої української великої мовної моделі (LLM). Її тренуватимуть на відкритих україномовних даних без персональної інформації.
Дмитро Кузьменко, викладач НаУКМА та PhD Robotics Student, пояснює: чому LLM не працюють ефективно «з коробки» і як постнавчання перетворює їх на корисних, логічних та етичних агентів. А також розповідає, як навчають моделі міркування (reasoning models).
Іван, AI-Driven Marketing Specialist в eSputnik, пояснює, як поєднання трансформерів і LLM дозволило збільшити конверсію товарних рекомендацій до 71%. У статті він розкриває переваги нової моделі, її вплив на персоналізацію в ecommerce, а також наводить готові кейси її використання.
Чи стане Pathways on Cloud масовим інструментом для розробників? Чи змінить цей анонс позиції на ринку LLM-вендорів? І на який саме підхід цього року робить ставку Google Cloud? Читайте про це в репортажі Нікіти Галкіна з конференції Google Cloud Next.
Артур оглядає квітневий випуск Thoughtworks Technology Radar, оцінюючи найцікавіші інструменти, практики та тенденції. Від AI-асистентів і observability до GraphRAG і fuzz testing — ловіть стислий гайд за техтрендами першої половини 2025-го.
Олександр Книга, CTO та Head of AI у компанії WLTech, розповідає: чому ARC став бенчмарком для розвитку AGI (загального штучного інтелекту), які існують методи його розв’язання та чому ця тема стає все більш актуальною у світі.
Павло Бриков поєднав embedding-модель Alibaba та векторне сховище pgvector у PostgreSQL, щоб реалізувати «розумний» пошук із підтримкою транслітерації на сайті його онлайн-магазину. У статті він також пропонує можливі шляхи покращення перфомансу пошуку.
Сергій Паньків та його команда створили SmartCheck AI — інструмент, що автоматизує опрацювання вимог держзамовників. Читайте у статті, як вдалось створити проєкт, що вже працює та допомагає учасникам закупівель Prozorro готувати якісні пропозиції.
Юрій Гуц розповідає про можливості відкритих моделей штучного інтелекту, які можна розгортати у власному середовищі та використовувати офлайн. У матеріалі на вас чекає згенерований портрет айтівця зі спільноти DOU та вірш про українське IT, який міг би написати Тарас Шевченко.
Паша, Data Scientist із понад 6-річним досвідом, пояснює, як навчаються мовні моделі, які тут є можливості, обмеження та виклики. У статті детально описано етапи навчання від збору даних до впровадження людського фідбеку, а також основи архітектури Transformer.
«AI-моделі стали достатньо розумними для того, щоб не просто писати код, а робити це навіть краще за багатьох розробників», — лідер AI-спільноти В’ячеслав Колдовський ділиться найбільш масштабними подіями зі світу штучного інтелекту, які вплинуть на роботу розробників у 2025.
Віталій, Software Engineer, розмірковує про згубний вплив використання AI на екологію та наше майбутнє. Та пояснює, що цього можна уникнути, оптимізувавши роботу зі штучним інтелектом за допомогою LATM — нової моделі роботи з LLM, що зберігає продуктивність, при цьому зменшуючи витрати.
Віктор Карабедянц розглядає Microsoft Copilot для Azure, який перевертає уявлення про щоденне використання платформи. Автор пояснює, як цей інструмент на базі GPT-4 оптимізує витрати, автоматизує рутинні завдання та підвищує безпеку даних.
Ігор, віцепрезидент з технологій GlobalLogic, розглядає корпоративні GenAI-системи та їх відмінності від відкритих. А також описує принципи роботи з даними, підготовку інформації для системи та архітектуру, що забезпечує оптимізацію бізнес-процесів.
Дам’єн Березенко розглядає застосування графів знань у системах RAG для отримання точних відповідей на складні запитання. Автор пояснює, як графи допомагають виявляти приховану інформацію та формувати зв’язки між даними, наводячи приклади використання графів для аналізу літератури та порівнюючи їх ефективність з векторним пошуком.
Дем’єн Березенко розповідає про механізм нескінченної уваги від Google, що розширює контекстне вікно моделей до 10 мільйонів токенів і відтак вирішуює проблему обробки великих текстів. Це корисний інструмент, однак він має свої недоліки, як-от втрата деталей та підвищені витрати. Детальніше у статті.
Wren AI — це конвеєрний застосунок для ШІ, який перекладає запити природною мовою на мову SQL, щоб ви могли спілкуватися з вашою базою даних у чаті. Це значно спрощує роботу зі структурованими табличними даними у застосунках RAG/Agent. Про те, як налаштувати інструмент, читайте в цій статті Дем’єна Березенка.
У цій статті Сергій Труш розповідає про один зі своїх тривалих опенсорс пет-проєктів, робота над яким триває останні три місяці. Йдеться про репозиторій TelegramAIChatbot — україномовний телеграм чат-бот, написаний на Python з ШІ.
Коментарі