Annual Open Tech Conference - ISsoft Insights 2021. June 19. Learn more.
×Закрыть

Data Science у мобильных операторов, или Как работать с анонимными данными

В рамках DS Competition от AI Booster и Vodafone мы разбирались, какие решения возможны при работе с анонимными данными.

AI Booster провел онлайн-хакатон для мобильного оператора и мы не могли упустить возможность поделиться инсайтами, как проводят аналитику больших данных в области телекоммуникаций.

Поскольку, в большинстве своем украинские абоненты мобильной связи — это пользователи предоплаты, операторы работают преимущественно с анонимными данными. Они пытаются этот сегмент точнее описать, детализировать, чтобы их предложения были релевантными и более востребованными во времени. Тенденции идут к тому, чтобы сегментирование абонентов делать еще более точным — вплоть до каждого клиента.

На данный момент у Vodafone порядка 20 миллионов абонентов, и оператор собирает уже очищенные, подготовленные данные для моделирования, а это более 3000 показателей в разрезе каждого клиента. Хорошая подготовка качества данных позволяет запускать персонализированные рекламные кампании, вести целевые коммуникации на клиентскую базу.

В разрезе каждого клиента специалисты компании ежемесячно проводят активности с использованием аналитики — это либо удержание клиента, если есть склонность к переходу к конкурентам, либо же это продажи услуг. Во втором случае возникают такие задачи как определение релевантности предложения для пользователя, либо оптимизация затрат на наиболее дорогостоящих каналах продаж. Например, как телемаркетинг или продажа при звонках клиента в контактный центр компании.

Какие данные есть у телеком-оператора?

У каждой такой компании есть биллинговая система, телекоммуникационная сеть, другие подсистемы. Также присутствуют платформы, позволяющие фиксировать IMEI телефона (уникальный номер устройства связи), далее через каталоги расшифровывать, определять, какая операционная система там установлена, кто произвел этот смартфон, и в какой он ценовой категории.

Классический параметр в этих данных — это тарифный план абонента. Это ценовая модель, по которой клиент оплачивает услуги, в результате оператор рассчитывает показатели доходности в разрезе каждого клиента. Среди других показателей: пополнения счета за месяц, usage-трафик, как часто человек делает звонки, продолжительность его разговора. При этом для анализа могут использоваться дневные, часовые, недельные периоды. Можно также анализировать популярные направления интернет-трафика, какими мобильными приложениями пользуется клиент и многое другое.

По мере пользования клиента услугами (например, совершение звонка, отправка SMS, отсутствие соединения и пр.) оператор также собирает информацию о качестве сети. Это помогает понимать, какого качества сервис клиент получает, есть ли сложности с расположением в городе базовых станций.

Отдельный блок расчетных показателей характеризует, на каком жизненном цикле находится клиент — это новый клиент, развивающийся, сформировавшийся, либо же клиент на этапе затухания, когда совершают никаких действий.

Помимо так называемых прямых показателей, есть еще предиктивные показатели, рассчитываемые в результате на основании прогностических моделей, которые представляют собой основную ценность.

Какой инструментарий используется?

Ежесуточно ночью с биллинговой системы собираются все сырые данные в хранилище, где-то до 8 утра проводится их агрегация. Вся информация раскладывается в витрины — кубы данных, на которых уже можно строить автоматические процессы моделирования и процессы целевых кампаний. Для этого используем решение SAS Enterprise — полноценную аналитическую систему, позволяющая строить модели. Кроме промышленного решения используется также Python — на сегодняшний день это один из самых эффективных инструментов.

Как использовать геолокацию и определить место жительства?

В каждом звонке, когда происходит соединение, биллинговая система получает так называемый CDR-файл, в нем указаны направление звонка, продолжительность разговора в секундах, ряд характеристик, отвечающих за тарификацию, координаты базовой станции, с помощью которой произошло это соединение. Далее данные по каждому клиенту аккумулируются за интервал времени, что позволяет сформировать допущение с высокой точностью о том, где живет, работает или часто проводит время абонент.

Социальные связи

Большой пласт задач оператор может решать в области анализа социальных связей. Так как в каждом исходящем/входящем звонке содержится номер телефона, кто звонит и кому звонят. Далее, применяя теорию графов, можно выделять устойчивые социальные группы, так называемых альфа-пользователей (те, которые наиболее часто коммуницируют внутри группы) и бета-пользователей (абонентов, стоящих на стыке нескольких разных сообществ). Подобного рода информация очень ценна для решения задач по продвижению продуктов, задач, связанных с защитой от мошенничества, и сама по себе имеет высокую предиктивную силу как входящая информация для различных математических моделей.

Таргетинг рекламы по геолокации

Извечная проблема оффлайнового магазина — как увеличить клиентопоток для увеличения продаж. Есть изящные методы, связанные как раз с прямой коммуникацией: для каждого магазина прописываются базовые станции, которые «закрывают» этот район в некой пешей доступности, например, до 500 метров. Если в данной зоне клиент совершает или принимает звонок, система определяет его местоположение, и за несколько секунд, проанализировав огромное количество его исторических данных, сделает ему релевантное предложение, доступное как раз в этом магазине. Vodafone использовал такую коммуникацию после старта 4G, чтобы предлагать клиентам SIM-карты и смартфоны, поддерживающие новую технологию, когда они находятся рядом с магазином оператора.

Новые вызовы

Для поиска новых технических решений Vodafone совместно с AI Booster провели онлайн-соревнования по Data Science. И команды разработчиков решали задачи от оператора: определение возраста пользователей по обезличенным данным, а также склонность к покупке приложения Vodafone Music.

За 2 недели работы участники создали эффективные решения, которые решают реальные проблемы бизнеса.

Отдельно хочется упомянуть формат соревнования — очень удачно был выбран стандарт kaggle. Это еще новинка для хакатонов в Украине. По этому стандарту команды-участницы соревнуются в течение двух недель, при этом точность работы их решений в режиме реального времени синхронизируется с публичным лидербордом. Это добавило сумасшедшего драйва в соревнование. Ну, и несомненно, призовой фонд в $3000 стал неплохим катализатором активностей хакатона.

👍НравитсяПонравилось0
В избранноеВ избранном0
LinkedIn
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

ОПСОСы ещё свои задачи решают и нашару, за счёт обезьян на «хакатонах». Хорошие это мероприятия хакатоны, надо всем почаще их проводить.

А почему бы и нет. Капитализм, он знаешь ли такой, а участие в хакатоне -дело добровольное (если что — я не участвовал и не собираюсь)

Бабушка надвое гадала Аналитика больших данных показывает удивительно высокую достоверность предсказаний на уровне 49,(9)%

Та ну. Мені фейсбук створює ілюзію підбору для мене товарів, які мені подобаються, і про існування яких я навіть не підозрював. І якби не ФБ реклама, то фіг я би про них дізнався. Ось так.

Хорошая подготовка качества данных позволяет запускать персонализированные рекламные кампании, вести целевые коммуникации на клиентскую базу.

лучей поноса вам за персонализированные рекламные кампании.

и отдельных лучей операторам за 4 недельные тарифные планы, за подключение всяких «полезных» услуг...типа гудка и диджинглов...

Подписаться на комментарии