Технологию data mining можно применить везде, были бы данные

В июле состоялся семинар «Технологии прогнозирования от компании SPSS», организованный компаниями Sybase CIS и SPSS. Хосе Янес, ведущий консультант компании SPSS по Business Intelligence, рассказал о технологии data mining и программном продукте Clementine, ее реализующем. Совместная организация семинара связана с тем, что Sybase CIS заключила с SPSS партнерское соглашение, согласно которому Sybase будет поставщиком системы Clementine в России.

Технология data mining заключается в том, что, используя существующие данные и применяя предиктивные (предсказательные) алгоритмы, строятся выводы, ведущие к улучшению бизнес-результатов. Таким образом, data mining позволяет: предсказывать (как численные значения, так и проводить категоризацию «да-нет»); группировать, собирая элементы в кластеры на основе их характеристик; устанавливать связь между событиями.

Основным приложением этой технологии является маркетинг, особенно в части взаимоотношений с клиентами: привлечение и удержание клиентов, кросс-продажи.

Главные компоненты методологии: сегментация клиентов; построение модели «хорошего клиента» и маркетинговая работа на ее основе; определение клиентов, с наибольшей вероятностью могущих перейти к конкурентам, и применение к ним программ удержания; предсказание покупателей комбинаций продуктов и работа по кросс-продажам. Финансовый эффект, в частности, достигается за счет четкой организации маркетинговых программ, сокращая их бюджет и увеличивая эффективность, удержания и приобретения выгодных клиентов.

Система Clementine поддерживает процесс data mining, обеспечивая быстрое построение моделей с использованием существующих баз данных, является полностью открытой и масштабируемой. Система не отвечает за создание базы данных, поэтому наиболее эффективным является ее построение на основе существующего хранилища информации.

В процессе внедрения определяются бизнес-цели предприятия; тип и качество данных, их подготовка; создание математических моделей, оценка результатов, полученных с их помощью. Clementine имеет два интерфейса: для специалиста (с возможностью конструирования модели) и для пользователя. Эта система применима в самых различных отраслях: государственный сектор, финансовый сектор, телекоммуникации, индустрия развлечений, здравоохранение.

В финансовом секторе Clementine позволяет обнаруживать характерные транзакции по «отмыванию» денег, выбирать клиентов для выдачи «безопасных кредитов», делать пакетные предложения, производить удержание выгодных клиентов. Внедрения в этой сфере произведены в Lloyds TSB (Англия), добившейся 10-20% увеличения прибыли за счет предотвращения ухода клиентов, и Banco Espirito Santo (Португалия), внедрившей систему по борьбе с мошенническими транзакциями с банковскими картами.

Открытая и масштабируемая Система SPSS Clementine поддерживает процесс data mining, обеспечивая быстрое построение моделей с использованием существующих баз данных

В области здравоохранения, где Clementine имеет 30% своих клиентов, она применяется в области биоинформатики (определения генетических факторов, влияющих на заболевания). В похожих целях ее использует знаменитый футбольный клуб «Манчестер Юнайтед», имеющий 5000 игроков в разных возрастных категориях. Система позволяет прогнозировать (а иногда — предотвращать) травмы каждого игрока, строить персональные планы тренировок.

В области телекоммуникаций Clementine дает возможность выделять лояльных и недовольных клиентов, предпринимать меры по предотвращению их оттока. Ярким примером внедрения служит British Telecom, увеличившая отклик клиентов на свои кампании и успешно внедрившая модель по удержанию наиболее выгодных клиентов.

Основным конкурентом SPSS, поставляющим на рынок аналогичную продукцию, является компания SAS. Коротко сравнивая свойства этих продуктов, Янес отметил, что SAS имеет несколько более сильные позиции в финансовом секторе, а SPSS — в области телекоммуникаций.