Вокруг рынка Больших Данных до сих пор витает некий ореол загадочности. «Говоря о пользовательских данных, люди часто словно что-то недоговаривают и выглядят так, как будто они знают то, о чем не принято говорить вслух», – считает Константин Круглов, генеральный директор Data-Centric Alliance. Все это по сути идет от непонимания того, как на самом деле работает рынок данных – ведь эта область действительно весьма сложная и непонятная для неподготовленного человека. А непонимание порождает страх. По этой причине наблюдается дефицит качественных данных, которые компании опасаются отдавать на рынок.

«Big Data – волшебное словосочетание, на которое можно списать что-то сложное и непонятное, – согласен Кирилл Малев, директор по данным компании Merku. – Тем не менее мы собираем, покупаем или получаем на правах партнера доступ к различным источникам. И сейчас, в 2016 году, вопрос даже не в том, где взять данные, а как понять, что именно клиенту нужно и что применимо». Есть множество открытых наборов данных, которые могут быть использованы для анализа при решении задач компаний. Например, речь может идти о динамике цен на аренду и покупку квартир вблизи торговых точек.

По мнению Малева, в целом для заказчиков проектов Больших Данных никаких проблем нет. Компании, которым нужно провести исследование, построить математическую модель или сделать что-то трудоемкое с точки зрения машинного обучения, спокойно найдут поставщика, способного выполнить поставленную задачу.

Проблема «яйца и курицы»

Константин Круглов, генеральный директор Data-Centric Alliance:  «Все хотят сервисов на базе данных, но мало кто готов за это нормально платить. А раз нет денег, то трудно достать хорошие данные в достаточном объеме»

«Все хотят информационных сервисов, основанных на данных, но мало кто готов за это нормально платить. А раз нет денег, то трудно достать хорошие данные в достаточном объеме», – говорит Круглов. Компании понимают, что новые неявные знания о потребителях, которые могут быть добыты с применением технологий Больших Данных, должны увеличить эффективность многих процессов – привлечения клиентов, вторичных продаж, персонализации предложений, оценки рисков и т. п. Однако в условиях дефицита информации о реализованных проектах потенциальный эффект оценить трудно. По этой причине многие компании, даже большие и богатые, не хотят рисковать, боятся переплатить и играют с поставщиками сервисов Больших Данных в игру «найди дно». Они загоняют провайдера в условия, когда он вынужден работать либо себе в убыток, либо вообще бесплатно в рамках пилотных проектов. И чем крупнее и богаче компания, тем выше у поставщика вероятность попасть на бесплатный пилот. «В больших компаниях подобными инновационными проектами редко занимаются люди с волей, достаточной для инициализации их финансирования. Сделать же такой проект за счет небольшого ИТ-стартапа всегда приятно», – констатирует Круглов.

Компании понимают, что новые неявные знания о потребителях, которые могут быть добыты с применением технологий Больших Данных, должны увеличить эффективность многих бизнес-процессов

Все это убивает желание вкладываться в проект по полной и приводит в целом к тому, что провайдер начинает недоинвестировать в развитие технологии и приобретение необходимых знаний о потребителях. Как следствие, результаты пилотных проектов могут получиться не такими ощутимыми, какими могли бы быть.

«Получается замкнутый круг, типичная ситуация с “курицей и яйцом”. В данном случае первый шаг должны сделать все-таки большие и богатые», – продолжает Круглов. Тот, кто первый в достаточной мере проинвестирует эту тему, получит серьезное преимущество перед конкурентами. А отрасль, в свою очередь, получит кейсы, на базе которых будут финансироваться и взрослеть технологии.

Бизнес с учетом эпидемий и погоды

Примером растущего интереса бизнеса к технологиям Больших Данных может служить проект, реализованный крупной аптечной сетью, включающей более 650 аптечных пунктов в трех регионах России. В кризисных условиях повышение эффективности торговых точек является критически важной задачей. Решить ее без продвинутых аналитических технологий и использования внешних данных было нереально.

Часть торговых точек сети в последний отчетный период показали низкую рентабельность, а некоторые даже стали убыточными. На протяжении трех месяцев продажи в 108 аптеках упали до критичного минимума. Кроме того, на региональные рынки вышли крупные федеральные игроки, открыв аптечные пункты в пешей доступности от торговых точек сети. Наконец, наблюдаются устойчивый рост спроса на более дешевые препараты-заменители и, соответственно, снижение продаж ряда торговых марок. Это потребовало от руководства компании мер по стабилизации бизнеса.

Главным лицом, заинтересованным в реализации проекта, стал директор по маркетингу. Перед ним встал вопрос, что же влияет на продажи в конкретных точках, так как версия о снижении общей покупательской способности не подтверждалась продажами в относительно благополучных аптеках.

Из-за отсутствия у компании доступа к внешним данным, характеризующим актуальную ситуацию на рынке, возник интерес к поставщикам услуг, способным провести такой анализ. Целью при этом стал прогноз ежедневных продаж для проблемных точек на шесть недель с использованием собственных данных аптечной сети, планов о промоакциях, информации о конкурентах и внешних данных.

Гипотеза была вполне очевидной: продажи находятся под влиянием множества факторов – промоакций, поведения конкурентов, государственных праздников, сезонности, местоположения торговой точки. Обычно каждый управляющий торговой точки прогнозирует продажи на основе своей конкретной ситуации. Однако ограниченность данных снижает точность прогнозов, негативно влияя на результаты всей сети.

Уточненный прогноз продаж должен был определить, какие товарные группы будут пользоваться повышенным спросом, а какие «просядут» в ближайшее время, и помочь разработать промоакции, позволяющие сбыть товар в кратчайшие сроки. Кроме того, менеджеры торговых точек на основе прогноза имеют возможность оптимизировать расписание, которое повысит эффективность и мотивацию фармацевтов.

Аналитика как сервис

Раньше аналитические задачи в таком виде никогда не ставились. Было решено передать их не собственному отделу аналитики, а в аутсорсинг – в компанию Merku. Было понятно, что внутренних данных (фактически только исторических данных по продажам) недостаточно и их необходимо дополнить данными о ситуации на рынке.

Таким образом, к собственным данным, имевшим важное значение для анализа (ежедневному числу клиентов, ассортименту каждой торговой точки, расстоянию до ближайшего конкурента, данным по промоакциям и т. п.), добавились внешние источники. Созданную модель дополнили статистика распространения вирусных и аллергических заболеваний в регионах страны, динамика уровня заработной платы, динамика стоимости коммунальных услуг, температура воздуха и количество осадков, данные о датах начала летнего отдыха и каникул. Привлечение внешних данных позволило выявить большее число факторов, влияющих на продажи в каждой конкретной точке, и благодаря этому увеличить точность прогноза.

Естественно, работа с данными заняла довольно продолжительное время на начальном этапе проекта. Первичная очистка данных, их консолидация и приведение в нужный формат, а также выбор факторов и переменных для построения моделей традиционно занимают большую часть времени при решении аналитических задач.

Как результат проекта руководство компании отмечает рост оборота на 9,7% в охваченных проектом торговых точках за счет корректировки плана промомероприятий и ассортиментной матрицы с учетом моделей потребления в конкретном районе. Важными шагами стали ввод новых товарных позиций, исключение из ассортимента ряда торговых марок и расширение линейки сопутствующих товаров.

Более адекватный прогноз продаж позволил спланировать расписание работы персонала торговых точек, учитывая активность продаж в конкретные дни, в том числе во время проведения промоакций. Количество вызываемых на работу фармацевтов увеличилось в дни роста продаж и сократилось в дни, когда активности не ожидалось. Тем самым торговые точки оптимизировали HR-бюджет и перераспределили мотивационную часть заработной платы персонала с учетом занятости в дни активных продаж. Этот проект стал пилотным. Подобные исследования планируют проводить регулярно, определив задачи долгосрочного сотрудничества.

Купить номер с этой статьей в PDF