Получать лучшие публикации от редакции раз в неделю:

Михаил Левиев (АлгоМост): Для чего мобильным операторам необходим дата-майнинг

Генеральный директор компании «АлгоМост» считает эту технологию новым драйвером, который будет обеспечивать рост телеком-рынка
17 апреля, в 09:50

iBusiness.ru публикует фрагменты интервью с Михаилом Левиевым, впервые размещенного на TelecomDaily.

«Анализ данных – это фундамент успешного развития телеком-компаний: классические драйверы роста телеком-рынка уже более-менее отыграны. Конкуренция плавно переходит в ту фазу, когда операторы задумываются, что они могут извлечь из своей клиентской базы, а именно из того трафика, который формируется на этих каналах. Анализируя эти данные, операторы могут узнать гораздо больше.

Михаил Левиев (АлгоМост): «Анализ данных – это фундамент успешного развития телеком-компаний: классические драйверы роста уже более-менее отыграны»

Один из наших мобильных операторов строит систему анализа пробок более эффективную, чем это происходит у «Яндекса». В каждом авто есть минимум один телефон. Примерно 30% мобильного трафика приходится на одного оператора. Поэтому оператор знает гораздо более точно, кто стоит в пробке, где пробка есть, где ее нет и насколько она вообще велика. Это как один пример анализа данных. Из этого может вытекать все что угодно. Зная, что люди стоят в пробках, что они обычно двигаются по такому-то направлению, операторы могут делать конкретные предложения, например оператор такой-то предлагает посетить такое-то кафе, которое расположено на этой дороге».

О чем мобильные операторы смогут узнать с помощью дата-майнинга

«Изначально операторы на основе анализа передаваемых данных (звонка, смс, файла) научились правильно расставлять вышки. Также они анализировали, какую пропускную способность надо подвести под базовую станцию. Но сейчас пошел следующий этап эволюции, когда операторы и телеком-компании не просто анализируют геолокационные параметры трафика, а анализируют исходя из того, какой трафик идет каждому клиенту.

У большинства из нас есть смартфон. Учитывая ясный тренд, что смартфоны дешевеют и скоро будут стоить 10 – 20 долларов, мы понимаем, что сможем извлекать гораздо больше информации: не только о том, что человек делает и где он находится. Мы можем понимать, какими приложениями он пользуется в определенных местах, можем понимать его интересы и, как результат, создавать более сложные профили абонентов, которые сами по себе являются товаром. Эти знания (данные, профили) позволяют операторам проводить какие-то совместные акции».

Как осуществляется дата-майнинг

«Дата-майнинг – это процесс, когда из сырых данных извлекается какая-то полезность, находится взаимосвязь. Например есть пользователь А, и по определенным признакам мы видим, что он находится в состоянии, когда он хочет сменить оператора. И дата-майнинг позволяет, проанализировав его поведенческие особенности, понять, когда человек подходит к этому желанию сменить оператора. И можно, выявив этот факт, принять какие-то меры, чтобы сохранить этого пользователя, предложив более выгодный тариф или решив какую-либо другую проблему.

Что делаем мы? Мы создаем алгоритм, который из сырых данных о клиенте выявляет какую-то ценность, например, как понять, что клиент хочет уйти от оператора.

За время свой работы в сфере коммерциализации науки (почти девять лет) мы постоянно сталкивались с потребностью в анализе данных. Все IT-проекты, с которыми мы работали, генерировали огромное количество данных, из которых надо было извлекать какие-то полезности. И в какой-то момент с партнерами решили создать эффективный способ построения и создания алгоритмов.

Создание происходит в два этапа. Сначала нужно узнать, где есть лучшие специалисты и какие есть лучшие подходы для решения той или иной задачи. Соответственно, мы проводим конкурс. У нас на платформе уже более 300 команд специалистов в области анализа данных со всего мира, которых мы называем «решателями». Мы среди них проводим конкурс (аудитория «решателей» постоянно растет).

После конкурса берутся пять лучших дата-майнеров, к ним присоединяются два лучших эксперта индустрии. И под нашим менеджментом такая распределенная исследовательская группа (смарт-грид) становится такой аутсорс-лабораторией, которая может создавать алгоритмы под все задачи. И что еще хорошо: эти люди находятся по всему миру, нам не надо снимать для них офис, не надо платить за них налоги. У нас есть контрактная работа. И для клиента это становится очень эффективным инструментом реализации своих потребностей в области анализа данных.

Алгоритмы в основном разрабатываются в таких специализированных приложениях типа MathLab, а дальше уже код матлабовский интерпретируется в любой код, который пожелает заказчик. И потом он как модуль встраивается в любую систему, исследовательская группа может донастроить алгоритм по необходимости, поскольку в телекоме очень часто выскакивает «биг дата», причем потоковая, где надо иметь определенную производительность и устойчивый результат. И вот этот смарт-грид доводит алгоритм до определенного результата. И алгоритм работает в режиме 247. А компания может обратиться за новым алгоритмом или еще большим улучшением текущего.

Тем самым мы выводим наверх зону принятия решений. Все эти нишевые процессы, в них человеческий фактор уже вычленен, потому что анализ производится полностью за счет алгоритма и представляет собой квинтэссенцию полезности того, что есть в данных».

Дата-майнинг в науке и бизнесе

«В СССР тоже был дата-майнинг. Он происходил следующим образом. Формировался заказ какому-то институту, институт проводил исследования и выдавал какой-то результат. Такая модель используется до сих пор в ряде случаев. Основные факторы – это долго, дорого, результат неопределенный, насколько он будет соответствовать мировой практике – никто не знает.

Есть еще такой формат, применяемый разными компаниями, когда берутся данные, ставится задача, публикуется конкурс, народ участвует, получается срез, но результаты этого конкурса не готовы к тому, чтобы быть внедренными в бизнес, то есть в инфраструктуру заказчика, поэтому они хороши для науки, но для бизнеса бесполезны».

Как защищаются личные сведения абонентов

«Этот аспект регулируется федеральным законом. Здесь есть ряд ограничений. Во-первых, мы все, когда становимся клиентом такого-то оператора, подписываем соглашение об обработке персональных данных. Эти персональные данные обрабатываются, но не выгружаются наружу. Результаты в том или ином виде могут выдаваться. Большинство операторов, как правило, не заходит в такие личностные зоны, так как есть большой риск потерять клиента, и это для них более приоритетно, нежели небольшая транзакция при формировании профиля клиента и получения с этого выгоды. Плюс, профили клиентов, как правило, обезличенные.

Операторы это монетизируют следующим образом: они используют обезличенный профиль. Оператор говорит заказчику, что вот такие-то профили у меня есть в таком-то количестве – 1000 человек с профилями, которые вам подходят, например, мужчины, такой-то возраст, достаток, география и т.д. И заказчик платит, чтобы до этой тысячи донести его информацию».

Как можно определить вероятность потери клиента с помощью дата-майнинга

«Алгоритм совершает те действия, которые совершает клиент, и на основе тех данных, которые есть у оператора, говорит, что вероятность потери клиента такая-то. И при превышении такого-то значения, например, 80%, оператор должен принять какие-то меры. Был проведен тестовый пилотный процесс, были выявлены люди, которых не устраивали определенные аспекты (например, ремонтные работы рядом с домом, из-за которых связь была очень плохая). И оператор, сделав один звонок из колл-центра, спросил: «Все ли в порядке, все ли вас устраивает?» Люди отвечали, что есть вот такая-то проблема. И оператор им пояснял причины проблемы. Они отвечали, что теперь причина перебоев со связью понятна. В итоге таким маленьким действием клиент был сохранен.

[В данном случае анализировались] в первую очередь звонки, которые абонент совершал, и, вообще, весь его мобильный трафик. А в ШПД мы анализировали объем трафика, временные диапазоны, а также как часто человек заходил, как много он скачивал…

Оператор дал нам данные по трафику: когда, как часто пользователь подключался, какой объем данных он скачивал в каждой сессии. И плюс историческую выборку клиентов, которые ушли: вот был клиент, вот он ушел. И, анализируя эти данные, наши «решатели» смогли создать алгоритм, который выявил закономерность в трафике, из которой стало очевидно, что формируется вероятность того, что человек уйдет».

Читать полный текст интервью на TelecomDaily