Аналіз бізнес-результатів: чи готові ми довірити його ШІ?
Довгий час медійні агентства асоціювалися насамперед із закупівлею рекламного інвентарю. Але в умовах зростаючої складності ринку цього вже недостатньо. Бізнесу потрібні не просто контакти з аудиторією, а зрозумілі відповіді на запитання «чому?», «що буде далі?» і «де межа ефективності?». Саме тому аналітичні підрозділи медіаагентств стали повноцінними партнерами бізнесу в моделюванні та прогнозуванні KPI.
Інтерес до використання штучного інтелекту в аналітиці зростає разом зі складністю бізнес-середовища. ШІ вже сьогодні здатен не лише обробляти великі масиви даних, а й допомагати у формуванні гіпотез, прогнозуванні показників і пошуку причин змін у бізнес-результатах.
У цьому матеріалі розповідаю, як п’ять популярних ШІ-інструментів (ChatGPT, Grok, Gemini, DeepSeek і Claude) справляються з роллю дата-аналітика, запропонувавши їм відповісти на три ключові запитання:
- як визначити причини падіння продажів;
- як побудувати прогнозну модель KPI з урахуванням медіа-активності;
- як зрозуміти момент, коли треба зупинитися з додатковими інвестиціями.
Тест на пошук причин падіння продажів, якщо воно трапилось
Я обрала фармацевтичну категорію як найбільш релевантну з точки зору збору та якості даних. При формулюванні цього промпту я надала кожному із ШІ-інструментів трохи контексту та вказала базові метрики: це продажі в упаковках, продажі в грошах і частка ринку. Бо якщо цього не зробити — кожен з ШІ має свої уявлення про структуру вхідних даних, і відповіді стають важко порівнюваними.
Фундамент відповіді на це питання у всіх ШІ практично співпадає. Вони починають з підтвердження факту падіння, визначення його масштабу, а також моменту, коли падіння почалося. Далі майже всі переходять до пошуку причини через контрольовані бізнес-показники. Також важливим спільним елементом є аналіз категорійного контексту та конкурентного середовища з використанням частки ринку, а також перевірка ролі медіа-активності. У фіналі всі ШІ прагнуть звести результати в набір гіпотез і рекомендацій для бізнесу.
Але при цьому кожен з інструментів продемонстрував свої особливості:
ChatGPT фокусується на механіці продажів. Його підхід починається з аналізу базових причинних факторів, що цілком логічно, і лише після цього переходить до аналізу ринку, конкурентів і медіа.
GROK одразу пропонує працювати в Python або R і побудувати
Відповідь Gemini певною мірою збігається з відповіддю ChatGPT,але додатково він пропонує набір швидких інструментів для перевірки гіпотез: часову кореляцію, аналіз еластичності, крос-табуляції.
DeepSeek починає з валідації даних — чого не зробили попередні мовні моделі. Він пропонує провести нормалізацію за кількістю робочих днів та порівняти Date-to-Date з аналогічним періодом минулого року.
Claude також оцінює масштаб падіння на старті та пропонує аналізувати перетікання частки до конкурентів.
Якщо узагальнити, всі ШІ добре відтворюють базову логіку аналізу причин падіння продажів: від підтвердження факту падіння до формування гіпотез і рекомендацій. Але як виявилось, певні моделі схильні занадто ускладнювати задачу,
Побудова прогнозної моделі
Моделювання — одна з основних задач в щоденній роботі Data-аналітика. Воно потрібне для оцінки майбутньої динаміки бізнес-KPI, планування інвестицій та перевірки what-if сценаріїв ще до того, як вони реалізуються в реальності.
У цьому питанні я свідомо не просила ШІ писати код. По-перше, з першої спроби він майже ніколи не буває повністю коректним і готовим до використання. По-друге, для повторюваних запитів вже є напрацьовані скрипти, які потребують лише точкових модифікацій під конкретний кейс. Тому в цьому блоці мене цікавила не конкретна реалізація, а логіка побудови моделі, вибір підходу та принципи перевірки її адекватності. Але, спойлер — тут відповіді ШІ мене дещо розчарували.
Порівняно з аналізом причин падіння продажів, у цьому питанні розбіжності між підходами різних ШІ стали помітнішими. Частина моделей одразу пішла в складні архітектури, частина — у базову регресійну логіку.
Усі ШІ-інструменти сходяться в кількох базових припущеннях:
— модель будується на тижневих даних;
— цільова змінна — продажі в упаковках або грошах (часто з рекомендацією працювати саме з упаковками);
— період спостережень має бути не менше 2 років, оптимально 3+ (хоча насправді цілком реально побудувати хорошу модель на меншому історичному періоді);
— медіа-активність має враховуватись із лагами (найчастіше
— модель має дозволяти what-if сценарії на основі майбутнього медіа-плану;
— результатом є розкладання продажів на baseline та інкрементальний ефект медіа.
ChatGPT фактично пропонує двошарову конструкцію. Для оцінки медіа-ефекту він використовує Bayesian Marketing Mix Model або класичну MMM, а для прогнозу KPI — SARIMAX, Bayesian Structural Time Series (BSTS) або градієнтний бустинг (XGBoost / LightGBM). Такий підхід виглядає методологічно коректним, але на практиці є не надто зручним, бо по суті, пропонується будувати дві різні моделі — одну для декомпозиції, іншу для прогнозу, хоча в реальних кейсах одну й ту саму модель можна і потрібно використовувати і для розкладання продажів на бейзлайн та медіа-ефект, і для прогнозування.
Grok одразу фіксується на Bayesian MMM, як основний інструмент й прямо називає реалізації Robyn (Meta), LightweightMMM або Orbit. Як не дивно він не згадує Google Meridian, який є більш новим байєсівським фреймворком MMM, і має ширший функціонал для роботи з апріорними розподілами ROI та менш жорсткі вимоги до історичних даних.
Gemini обирає значно простішу і, водночас, дуже практичну логіку. Основні моделі — множинна лінійна регресія або Bayesian Structural Time Series, де медіа виступають зовнішніми регресорами. Це, по суті, найбільш ефективний базовий підхід для багатьох бізнес-задач. Важливо, що Gemini єдиний з усіх інструментів, хто прямо пропонує перевіряти адекватність моделі через ROI, а не лише через статистичні метрики. Перевірка якості обмежується MAPE на holdout-періоді та перевіркою знаків коефіцієнтів.
DeepSeek працює в межах класичної MMM, але робить акцент на статистичній коректності. Окрім байєсівських і регуляризованих регресій, він прямо пропонує аналізувати статистичну значущість коефіцієнтів (p-values).
Claude не прив’язується до одного підходу і пропонує вибір моделей залежно від задачі: Multiple Linear Regression, Ridge/Lasso, SARIMAX, а у виняткових випадках — Random Forest або XGBoost для короткострокового прогнозу. Така гнучкість — це безумовний плюс. Водночас використання Random Forest та XGBoost у бізнес-контексті виглядає сумнівним: це по суті «чорні ящики», які складно інтерпретувати інтуїтивно і пояснювати стейкхолдерам, особливо коли йдеться про медіа-ефекти та планування інвестицій.
Пошук точки насичення медіа інвестицій
Тепер переходимо до останнього блоку — визначення моменту, коли зростання медіа-інвестицій перестає давати додатковий ефект.
ChatGPT виходить із заданого бізнес-порогу окупності, будує response curve через MMM або Bayesian MMM та оцінює маржинальний ROAS як похідну кривої. Основний критерій — момент, коли mROAS падає нижче заданого порогу.
Grok також фокусується на Bayesian MMM і працює з response curves через Hill-функцію. Його критерії — marginal ROI нижче 1, падіння еластичності та досягнення
Gemini формально визнає необхідність моделі, але на практиці робить акцент на метриках рекламних кампаній: частоті, CPA, зростанні CPM, зупинці приросту reach. Це може бути корисним додатковим кроком, але без повноцінної моделі складно зрозуміти, що буде далі з кривою і як поводитись із бюджетом у сценаріях.
DeepSeek найбільш послідовно вибудовує підхід саме від моделі: будуємо модель, потім на її основі response curve, потім маржинальний ефект, і вже після цього — перевірка через польові метрики.
Claude дає дуже деталізовану відповідь і намагається охопити одразу всі можливі підходи — від простих регресій до складних нелінійних моделей із трансформаціями GRP. Логіка загалом коректна, але рівень деталізації надмірний для прикладного завдання, він ускладнює аналіз і зсуває акцент з управління бюджетом на сам процес моделювання.
Підбиваємо підсумки
Фаворитами в результаті цього експерименту стали ChatGPT та Gemini:
- ChatGPT намагається тримати рівновагу між бізнес-логікою і моделями, але інколи ускладнює там, де це не обов’язково.
- Grok мислить більше як data scientist і відразу йде в моделювання, що добре для глибоких досліджень, але не завжди доречно для щоденної аналітики.
- Gemini найкраще підходить для швидкої оцінки ситуації і перевірки гіпотез, коли потрібно рішення.
- DeepSeek найбільш дисциплінований з точки зору аналітичного процесу: спочатку дані, потім модель, потім висновки.
- Claude знає багато підходів, але часто ускладнює задачу настільки, що це заважає швидко перейти до управлінського рішення.
Але як не крути, ШІ все ще не спроможний дати повністю коректне рішення з першої спроби, а аналітика — це ітеративний процес, у якому остаточну відповідальність за якість висновків несе людина.
З ШІ чи без нього, бізнес-моделювання в руках досвідченого фахівця залишається стратегічною зброєю, що дозволяє компаніям ефективно конкурувати на ринку. Саме такий підхід лежить в основі аналітичної роботи Carat Ukraine — коли дані та експертиза доповнюють одне одного, а не замінюють.

Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів