5 застосувань AI для аналізу комерційних дзвінків в IT-командах: що працює зараз і що ще на стадії експерименту
В IT-компаніях ставлення до аналізу комерційних розмов еволюціонувало швидше, ніж у решті ринку. Спочатку — записи дзвінків у Google Drive, які ніхто не слухав. Потім — стандартна аналітика на основі CRM-полів. Зараз — застосування
Розгляну п’ять застосувань AI у роботі з комерційними дзвінками, які зараз тестують або вже впроваджують IT-команди. Деякі з них стали стандартом, деякі ще на стадії експерименту. Спробую розрізнити, що дає вимірюваний ефект, а що поки що — pet project з гарною презентацією.
1. Автоматична транскрипція з ідентифікацією спікерів
Базовий рівень, на якому зараз працює більшість IT-команд. Запис дзвінка автоматично транскрибується, окремо позначаються репліки кожного учасника, додаються таймкоди. Технологічно — це поєднання speech-to-text (Whisper від OpenAI, Deepgram, Google Speech-to-Text) і speaker diarization.
Для української та змішаної укр/рос мови якість моделей за останні два роки виросла значно. Whisper large-v3 показує WER (word error rate) на рівні
Що це дає на практиці. По-перше, повний пошук по всіх дзвінках за ключовими словами. Можна за 5 секунд знайти всі дзвінки, де згадували конкретного конкурента, ціновий діапазон, технічну проблему. По-друге, base layer для всіх інших AI-застосувань — без транскрипції далі рухатись неможливо.
Підводний камінь — приватність. Передача аудіо у хмарні сервіси може порушувати GDPR і внутрішні політики безпеки. Альтернатива — self-hosted Whisper на власному GPU. Це додаткова інфраструктурна задача, але для багатьох команд це єдиний прийнятний варіант.
2. Класифікація розмови за етапами та темами
Наступний рівень. На транскрипцію накладається класифікатор, який автоматично визначає, на якому етапі розмови знаходились учасники у який момент. Виявлення потреби, презентація, обробка заперечень, обговорення ціни, домовленість про наступний крок.
Технічно — це або fine-tuned LLM (GPT-4o, Claude Sonnet, Gemini) з кастомним промптом, або власна модель для класифікації, навчена на розмічених прикладах. Перший варіант швидший у розгортанні. Другий — дешевший на великих обсягах і дає кращий контроль.
Цінність — у можливості агрегації. Скажімо, видно, що в команді конкретний менеджер витрачає на «обробку заперечень» 40% часу розмов, а інший — 8%. Це привід для розбору: чому такий розкид. Або видно, що в певному сегменті клієнтів етап «обговорення ціни» в середньому затягується більше, ніж в інших — теж сигнал.
Без AI отримати таку аналітику можна тільки вручну. Це нереально на потоці понад 50 розмов на тиждень.
3. Виявлення «точок розриву» розмови
Це вже складніше і цікавіше. AI аналізує не просто текст, а патерн взаємодії — пари «питання менеджера → відповідь клієнта». Виявляє моменти, де клієнт переходить від змістовних розгорнутих відповідей до коротких формальних. Це сигнал, що менеджер втратив його увагу або викликав закриття.
Технічно це робиться так. На рівні транскрипції виокремлюються репліки. До кожної застосовується embedding-модель — для оцінки змістовності реакції клієнта. Реакції оцінюються за шкалою. Далі — пошук переходів від високих оцінок до низьких. У моменті такого переходу і знаходиться «точка розриву».
На практиці це працює як автоматичний асистент розборщика дзвінків. Він не замінює людину, але вказує: подивись на 4:32, тут щось пішло не так. Економить час РОПа і ставить розбір на конкретні точки.
Це той клас застосувань, який поки що в більшості випадків — кастомна розробка, а не готовий продукт. Готові сервіси типу Gong і Chorus роблять щось схоже, але адаптації під українську мовну специфіку не пропонують.
4. Виявлення відхилень від ICP (Ideal Customer Profile)
Менш очевидне, але потужне застосування. Команда визначає, який профіль клієнта є ідеальним для продукту — за параметрами, які видно у розмові. Це може бути розмір компанії, тип запиту, рівень технічного розуміння у людини на лінії, готовність до інвестицій певного рівня.
AI-модель, аналізуючи транскрипцію, оцінює, наскільки конкретна розмова відповідає ICP. На виході — score від 0 до 1. Якщо менеджер витрачає годину на дзвінок, де score 0.2 — це сигнал. Або менеджер слабо квалифікує лідів і веде багато розмов з не-ICP. Або CRM присилає менеджеру нерелевантні ліди.
Прикладна цінність очевидна: команда фокусує час на правильних клієнтах. У IT-сегменті, де середній чек може складати десятки тисяч доларів, навіть невелике зміщення фокусу команди на ICP-клієнтів дає вимірюваний ефект.
Розробка такого класифікатора займає
5. Real-time підказки під час дзвінка
Найскладніший і поки що найменш відпрацьований клас застосувань. AI слухає розмову у реальному часі, аналізує контекст, видає менеджеру підказки — на що звернути увагу, яке питання поставити, як обробити заперечення.
Технічно це поєднання streaming speech-to-text, retrieval-augmented generation, і UI-шару у вікні CRM. Більшість елементів вже зрілі. Інтеграція — задача, але вирішувана.
Чому це поки що рідко в продакшені. Кілька причин. Перша — латентність. Підказка має з’являтись за
В Україні я бачу декілька команд, які експериментують у цьому напрямку. Стабільного публічного продукту з рівня enterprise — поки що немає.
Що це означає для технічних команд
Аналіз комерційних дзвінків через AI у
Те, що раніше було задачею ручного аналізу однієї людини над 50 годинами записів, тепер — це pipeline, який обробляє 50 годин за 30 хвилин і виокремлює саме ті моменти, на які варто подивитись.
Для IT-команд, які працюють із комерційними процесами, це не питання «чи впроваджувати», а питання «коли і в якому обсязі». У 2026 році відсутність такого шару у комерційному процесі стане конкурентною слабкістю. Команди, які почали раніше, накопичують і дані, і експертизу швидше, ніж ті, хто чекає готових рішень.
Окрема рекомендація — починати з простого. Транскрипція з пошуком. Потім — класифікація етапів. Потім — точки розриву. Більш складні застосування — після того, як перші два шари дадуть стабільні дані.
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів