Промптинг — це вже базовий навик, а не конкурентна перевага. Що далі
Привіт! Мене звати Артем. Я VP of Software Architecture та Platform Engineer у Techstack, і останні роки більша частина моєї роботи — інтеграція AI-інструментів у реальні інженерні процеси: Claude Code, Cursor, MCP-інтеграції, агентні пайплайни. У квітні ми провели вебінар «Next Gen AI: чому простого промптингу вже недостатньо» з live демо мультиагентної системи в дії, у цій статті — основні тези.
57% організацій мають AI-агентів у продакшені
За даними LangChain State of AI Agents Survey 2026, більше половини організацій вже запустили AI-агентів у продакшн. Ринок агентів зараз оцінюється в $7.84 млрд і росте з CAGR 46% — до $52 млрд до 2030 року (MarketsandMarkets). Gartner прогнозує, що до кінця 2026 40% корпоративних додатків матимуть task-specific AI-агентів, хоча на початку 2025 їх було менше 5%.
Ці цифри підкріплені конкретними кейсами. Klarna зекономила $60 млн на підтримці клієнтів. Amazon мігрував 50 тисяч Java-систем — процес, який раніше займав 50 днів, тепер займає кілька годин. GitHub Copilot перетнув 20 млн користувачів і давно вже не просто автодоповнення — це повноцінний agent mode.
Вміти писати промпти в цьому контексті — це приблизно як вміти писати SQL-запити. Необхідна база, але не те, що дає перевагу.
Еволюція: від мистецтва запитувати до системної інженерії
У 2022 Prompt Engineering був революційним. Правильно сформулював — отримав хорошу відповідь.
У 2023 з’явились RAG і Function Calling. Модель отримала доступ до зовнішніх даних і здатність викликати функції. Перший крок від «розумного генератора тексту» до «системи, що може діяти».
2024: Workflows. Замість одного виклику моделі — ланцюжки викликів, оркестровані через код. Prompt chaining, routing, паралелізація.

Ключовий зсув: це дисципліна системної інженерії, а не промптування. Ми проєктуємо системи, а не формулюємо запити.
Workflows vs Agents і чому складність має бути виправдана
Anthropic у гайді «Building Effective Agents» розмежовує два підходи.
Workflows — LLM оркестровані через заздалегідь визначені шляхи в коді. Шлях передбачений, детермінований. Як CI/CD пайплайн: кроки визначені заздалегідь.
Agents — LLM динамічно керує власним процесом. Сам вирішує, які інструменти використати, в якому порядку, скільки ітерацій зробити.
Принцип, який варто тримати в голові: починайте з простих промптів, додавайте агентні системи лише тоді, коли простіші рішення не справляються. Мультиагентна оркестрація для задачі, яку вирішує один промпт із Function Calling — це архітектурний надлишок.
Три патерни, перевірені в роботі: Prompt Chaining (послідовні виклики з верифікацією кожного кроку), Tool Use (динамічний виклик API через function calling) і ReAct (reasoning + acting у циклі). Reflection, мультиагентна оркестрація і Plan-and-Execute готові до продакшену, але ще формуються. Повністю автономні агенти з довгим горизонтом — поки що експериментальна зона. Головна проблема це накопичення помилок: за 10 кроків з error rate 5% ймовірність коректного результату вже 60%, за 20 — 36%.
Context Engineering важливіше за промптинг
Prompt Engineering — це як написати правильний лист колезі. Context Engineering — це перед тим, як він вийде на роботу, підготувати йому стіл, розкласти потрібні документи, налаштувати доступи і показати де лежать довідники.
Контекст агента складається з: system prompt (хто він і як поводитися), доступних інструментів, пам’яті (коротко- і довгострокової), документів із RAG, історії розмови і схем структурованого виводу.
Агент із сильним промптом, але поганим контекстом, провалиться. Агент із нормальним промптом, але відмінним контекстом, працюватиме добре.
Якщо ви робили CLAUDE.md у проєкті з описом архітектури, конвенцій і поведінки агента — ви вже займались context engineering. Якість description кожного tool в MCP-сервері — теж context engineering. Це не нова концепція, це назва для того, що досвідчені люди робили інтуїтивно.

MCP: один сервер — всі клієнти
Без MCP кожен AI-інструмент потребував окрему інтеграцію з кожним сервісом. N клієнтів × M сервісів = N×M інтеграцій. З MCP: кожен сервіс пише один сервер — і він працює з усіма AI-клієнтами. N + M замість N×M.
Anthropic представив MCP у листопаді 2024. У грудні 2025 протокол передали до Linux Foundation, співзасновниками стали Anthropic, Block і OpenAI, підтримку дали Google, Microsoft, AWS, Cloudflare. Зараз: більше 10 тисяч публічних серверів, 97 млн щомісячних завантажень SDK. Впроваджено в ChatGPT, Claude, Gemini, Microsoft Copilot, VS Code, Cursor.
Паралельно Google у квітні 2025 представив A2A (Agent-to-Agent Protocol) для комунікації між агентами, і теж передав до Linux Foundation у червні. Якщо MCP це вертикаль (агент + інструменти), то A2A це горизонталь (агент + агент). Обидва на JSON-RPC 2.0, обидва під Linux Foundation. Це стандартний стек мультиагентних систем 2026.
Практична порада: вчіть MCP зараз. A2A тримайте в полі зору. Перший MCP-сервер можна зробити за вихідні: Python або TypeScript,
Human-in-the-Loop: чому 40% проєктів скасують
Gartner прогнозує, що більше 40% проєктів agentic AI буде скасовано до кінця 2027 року — через ескалацію витрат, незрозумілу бізнес-цінність і неадекватний контроль ризиків. Cisco опитав 8 тисяч senior IT-лідерів: 83% планують впроваджувати agentic AI, але лише 29% вважають безпеку пріоритетом.
Це класична помилка при впровадженні: компанія бачить демо, дає агенту повний доступ до продакшн-середовища без approve-гейтів і логування. Дослідниця безпеки з Meta виявила, що її агент автономно видалив всю поштову скриньку, проігнорувавши інструкцію «підтверджуй перед дією». Їй довелося фізично вимикати машину.
Рішення — не забороняти агентам діяти. Рішенням є градація контролю за принципом deny → ask → allow.
Читання автоматично. Дії з побічними ефектами (видалення файлів, відправка email, зміна конфігурації) тільки після підтвердження. У Claude Code це реалізовано через ієрархію правил із glob-pattern matching, яка каскадується від глобальних до проєктних. У версії 2.0 додались Hooks — shell-скрипти, що виконуються до і після кожного tool call: логування в SIEM, перевірка git diff перед комітом, Slack-сповіщення при видаленні файлів.
Правильна прогресія розгортання: Copilot (агент пропонує, людина виконує) → Guarded Automation (агент виконує з воротами підтвердження) → Supervised Autonomy (агент самостійний у чітких межах) → повна автономія тільки для ізольованих середовищ. Довіру до агента будують так само, як до нового інженера в команді: спочатку код-рев’ю, потім автономія.

Шість антипатернів, які я бачу постійно
Надмірна автономія без контрольних точок. Агент отримує повний доступ до продакшн-середовища без approve-гейтів і deny-правил. Результат передбачуваний.
«Жирні» промпти замість архітектури. Промпт на 3000 слів, де ви текстом намагаєтесь передбачити кожен edge case. Якщо system prompt більше однієї сторінки — потрібна не краща інструкція, а краща архітектура. Розбийте на спеціалізованих агентів, використайте routing, винесіть знання в RAG.
Детермінований підхід до стохастичної системи. LLM дає різні результати на той самий промпт. Якщо пайплайн ламається від неочікуваного формату відповіді — це проблема дизайну. Structured output, retry з fallback, валідація на кожному кроці.
Поганий дизайн циклів. Anthropic сформулював точно: «Більшість збоїв агентів — це збої дизайну циклу, а не моделі.» Без умов виходу і метрик прогресу агент або зависає, або зупиняється занадто рано. Якщо за три ітерації немає руху — ескалюй до людини.
Prompt injection без захисту. Вразливість № 1 за OWASP Top 10 for LLM Applications. Email із прихованою інструкцією, яку агент виконує як системну команду — реальний вектор атаки. Розділяйте інструкції від даних, використовуйте guardrails та input sanitization.
Lethal Trifecta (концепція Саймона Вілісона): доступ до приватних даних + доступ до зовнішніх інструментів + обробка ненадійного вхідного контенту. Якщо агент має всі три — мінімізуйте перетин або ставте HITL на кожну дію з побічним ефектом.

З чого почати інженеру, якщо хочеш будувати агентні системи
Фундамент: Python або TypeScript, async programming, базове розуміння теорії графів, більшість оркестраторів побудовані на графах.
AI-специфічні навички: Context Engineering, Agentic RAG (RAG як частина агентного циклу, а не окремий пошук), Tool Design (naming, descriptions, параметри так, щоб агент міг ефективно використати інструмент), Evaluation Design — класичний unit test тут не підходить.
Фреймворки: LangGraph 1.0 — продакшн-стандарт, починайте з нього. CrewAI — для прототипування. OpenAI Agents SDK — якщо хочете бути ближче до металу.
Перший крок: одна реальна задача з вашого робочого процесу. Не «побудуємо мультиагентну систему», а «агент, що перевіряє PR на типові помилки» або «агент, що аналізує логи і створює тікети». Один агент, два-три інструменти, ReAct-патерн, human-in-the-loop. Запустіть, поміряйте, ітеруйте. Складність додасте потім.
Різниця між «написати хороший промпт» і «побудувати агентну систему» це різниця між написати SQL-запит і спроєктувати схему бази даних. Обидва вміння потрібні, але саме друге визначає, що взагалі стане можливим.
Якщо хочеш побачити, як це виглядає в дії, то на вебінарі ми показували live демо мультиагентного пайплайну, який будує презентацію з нуля. Запис тут.
Ресурси:
- Anthropic «Building Effective Agents»: www.anthropic.com/...building-effective-agents
- LangGraph: langchain-ai.github.io/langgraph
- MCP специфікація: modelcontextprotocol.io
- Antonio Gulli «Agentic Design Patterns», Springer, 2025
10 коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарівДивна аналогія. Це ж зовсім різні рівні абстракції
Якщо SQL це база, то промпти — надбудова (пробачте за каламбур) )))
Посил, звісно, зрозумілий — і промпти і SQL-запити це не щось захмарне. Але є розробники, які вміють писати SQL-запити, тільки ці SQL-запити поганої якості. З промптами, мабуть, те ж саме.
Чи є необхідним вміння писати промпти без вміння писати SQL-запити? А як оцінити вміння написання промптів?
Можліво треба було підібрати іншу аналогію більш прозору.
Наприклад «це як вміння гуглити в 2010» або «як написати баш команду». Але нажаль універсальної підбірати складно. Бо може умовний розробник фронту ніколи і не виконував sql запиту а умовний менеджер жодного разу не відкривав терміналу.
Щодо оцінки якості промтів, то це вимірюється на результаті конкретної задачи. Хоч llm і не є детерміновою сістемою, але ви легко можете для себе провести експеремент з формування10-15 різного рівня деталізації промтів однієї задачи, проженути кожен 3-5 разів і оцінити результат.
Ще можна порівняти з «вмінням працювати в IDE» ))
ОК, спробую зайти з іншого боку: якщо вміння писати промпти не є перевагою, то чи є недоліком невміння/небажання писати промпти?
Згодував статтю своєму агентові. Він прочитав і сказав, що все зрозумів і навіть місцями згоден. Просив переказати привіт його колезі.
Передайте йому, що Claude дякує за визнання
Мені було важко читати статтю. Більшість її створив штучний інтелект, а ініціатор статті, на жаль, з тих чи інших причин її не відредагував — що було б виявом поваги до читачів та спільноти. Хоча, безумовно, у статті підіймаються важливі питання.
Дякую за фідбек, Дмитре.
Але в цьому і була суть вебінару та статті.
Разом з AI все і було зроблоно: дослідження джерел, скрипт, слайди, і навіть живе демо мультиагентної системи в прямому ефірі. Все це і є agent engineering в дії, де ми перходимо від «зроби за мене все» до "я зроблю це за допомогою ось цих інструментів.
Якщо якісь місця здаються занадто штучними — я буду вдячний за ваш фідбек з конкретними місцями, що зачепили вас.
Та пішов ти нахєр зі своїм промптингом, деган.
Чи є гарантія дотримання їх, і якщо да, в чому вона і наскільки міцно виконується?
Зважаючи на такі історії, це буде першим питанням до такої системи (примітьте — саме з Claude трапилась та халепа).
На це дуже впливає рівень реалізацію. В Claude code deny-allo правила це не інструкція моделі, яку вона може проігнорувати. Це зашито в логіку на cli клієнті. Забороняючий рул накштал
bash(rm -rf)буде фізично заблокований.Hooks додає ще один рівен де шелл-скріпт виконується до виклику tool і може цей виклик заблокувати
Але...стовідсоткової гарантії немає, бо ніще не заважає моделі знайти воркераунд і напісати виконати пітон скрипт, який вона виконає. Але наше завдання звести подібне до нуля
Дякую за цікаве питання