5 застосувань AI для аналізу комерційних дзвінків в IT-командах: що працює зараз і що ще на стадії експерименту

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

В IT-компаніях ставлення до аналізу комерційних розмов еволюціонувало швидше, ніж у решті ринку. Спочатку — записи дзвінків у Google Drive, які ніхто не слухав. Потім — стандартна аналітика на основі CRM-полів. Зараз — застосування ML-моделей для обробки розмовних даних у реальному часі.

Розгляну п’ять застосувань AI у роботі з комерційними дзвінками, які зараз тестують або вже впроваджують IT-команди. Деякі з них стали стандартом, деякі ще на стадії експерименту. Спробую розрізнити, що дає вимірюваний ефект, а що поки що — pet project з гарною презентацією.

1. Автоматична транскрипція з ідентифікацією спікерів

Базовий рівень, на якому зараз працює більшість IT-команд. Запис дзвінка автоматично транскрибується, окремо позначаються репліки кожного учасника, додаються таймкоди. Технологічно — це поєднання speech-to-text (Whisper від OpenAI, Deepgram, Google Speech-to-Text) і speaker diarization.

Для української та змішаної укр/рос мови якість моделей за останні два роки виросла значно. Whisper large-v3 показує WER (word error rate) на рівні 8-12% для української залежно від якості запису. Цього достатньо для практичного використання.

Що це дає на практиці. По-перше, повний пошук по всіх дзвінках за ключовими словами. Можна за 5 секунд знайти всі дзвінки, де згадували конкретного конкурента, ціновий діапазон, технічну проблему. По-друге, base layer для всіх інших AI-застосувань — без транскрипції далі рухатись неможливо.

Підводний камінь — приватність. Передача аудіо у хмарні сервіси може порушувати GDPR і внутрішні політики безпеки. Альтернатива — self-hosted Whisper на власному GPU. Це додаткова інфраструктурна задача, але для багатьох команд це єдиний прийнятний варіант.

2. Класифікація розмови за етапами та темами

Наступний рівень. На транскрипцію накладається класифікатор, який автоматично визначає, на якому етапі розмови знаходились учасники у який момент. Виявлення потреби, презентація, обробка заперечень, обговорення ціни, домовленість про наступний крок.

Технічно — це або fine-tuned LLM (GPT-4o, Claude Sonnet, Gemini) з кастомним промптом, або власна модель для класифікації, навчена на розмічених прикладах. Перший варіант швидший у розгортанні. Другий — дешевший на великих обсягах і дає кращий контроль.

Цінність — у можливості агрегації. Скажімо, видно, що в команді конкретний менеджер витрачає на «обробку заперечень» 40% часу розмов, а інший — 8%. Це привід для розбору: чому такий розкид. Або видно, що в певному сегменті клієнтів етап «обговорення ціни» в середньому затягується більше, ніж в інших — теж сигнал.

Без AI отримати таку аналітику можна тільки вручну. Це нереально на потоці понад 50 розмов на тиждень.

3. Виявлення «точок розриву» розмови

Це вже складніше і цікавіше. AI аналізує не просто текст, а патерн взаємодії — пари «питання менеджера → відповідь клієнта». Виявляє моменти, де клієнт переходить від змістовних розгорнутих відповідей до коротких формальних. Це сигнал, що менеджер втратив його увагу або викликав закриття.

Технічно це робиться так. На рівні транскрипції виокремлюються репліки. До кожної застосовується embedding-модель — для оцінки змістовності реакції клієнта. Реакції оцінюються за шкалою. Далі — пошук переходів від високих оцінок до низьких. У моменті такого переходу і знаходиться «точка розриву».

На практиці це працює як автоматичний асистент розборщика дзвінків. Він не замінює людину, але вказує: подивись на 4:32, тут щось пішло не так. Економить час РОПа і ставить розбір на конкретні точки.

Це той клас застосувань, який поки що в більшості випадків — кастомна розробка, а не готовий продукт. Готові сервіси типу Gong і Chorus роблять щось схоже, але адаптації під українську мовну специфіку не пропонують.

4. Виявлення відхилень від ICP (Ideal Customer Profile)

Менш очевидне, але потужне застосування. Команда визначає, який профіль клієнта є ідеальним для продукту — за параметрами, які видно у розмові. Це може бути розмір компанії, тип запиту, рівень технічного розуміння у людини на лінії, готовність до інвестицій певного рівня.

AI-модель, аналізуючи транскрипцію, оцінює, наскільки конкретна розмова відповідає ICP. На виході — score від 0 до 1. Якщо менеджер витрачає годину на дзвінок, де score 0.2 — це сигнал. Або менеджер слабо квалифікує лідів і веде багато розмов з не-ICP. Або CRM присилає менеджеру нерелевантні ліди.

Прикладна цінність очевидна: команда фокусує час на правильних клієнтах. У IT-сегменті, де середній чек може складати десятки тисяч доларів, навіть невелике зміщення фокусу команди на ICP-клієнтів дає вимірюваний ефект.

Розробка такого класифікатора займає 2-3 спринти за наявності розмічених прикладів. Без розмітки — більше, бо доводиться валідувати модель ручним способом.

5. Real-time підказки під час дзвінка

Найскладніший і поки що найменш відпрацьований клас застосувань. AI слухає розмову у реальному часі, аналізує контекст, видає менеджеру підказки — на що звернути увагу, яке питання поставити, як обробити заперечення.

Технічно це поєднання streaming speech-to-text, retrieval-augmented generation, і UI-шару у вікні CRM. Більшість елементів вже зрілі. Інтеграція — задача, але вирішувана.

Чому це поки що рідко в продакшені. Кілька причин. Перша — латентність. Підказка має з’являтись за 2-3 секунди після потрібного моменту, інакше менеджер уже пройшов цю точку розмови. Технічно це досяжно, але потребує оптимізації pipeline. Друга — якість підказок. RAG над базою знань компанії має повертати релевантний контекст за конкретною ситуацією. Якщо підказки не корисні — менеджер швидко перестане звертати на них увагу. Третя — психологічний фактор. Менеджеру важко одночасно вести розмову і читати підказки. Інтерфейс має бути дуже простим — інакше це додає когнітивне навантаження замість його зменшення.

В Україні я бачу декілька команд, які експериментують у цьому напрямку. Стабільного публічного продукту з рівня enterprise — поки що немає.

Що це означає для технічних команд

Аналіз комерційних дзвінків через AI у 2024-2025 році переходить від experimental до production. Базовий шар — транскрипція з диаризацією — зрілий і доступний навіть для невеликих команд. Аналітичний шар — класифікація етапів, виявлення розривів, ICP-скоринг — потребує кастомної розробки, але цілком реалізовується.

Те, що раніше було задачею ручного аналізу однієї людини над 50 годинами записів, тепер — це pipeline, який обробляє 50 годин за 30 хвилин і виокремлює саме ті моменти, на які варто подивитись.

Для IT-команд, які працюють із комерційними процесами, це не питання «чи впроваджувати», а питання «коли і в якому обсязі». У 2026 році відсутність такого шару у комерційному процесі стане конкурентною слабкістю. Команди, які почали раніше, накопичують і дані, і експертизу швидше, ніж ті, хто чекає готових рішень.

Окрема рекомендація — починати з простого. Транскрипція з пошуком. Потім — класифікація етапів. Потім — точки розриву. Більш складні застосування — після того, як перші два шари дадуть стабільні дані.

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі