В большинстве отраслей не заметно роста эффективности от использования накапливаемых сведений. Зачастую причина в том, что компании имеют неверное представление о ценности различных источников данных. Действительно, не все данные одинаково полезны. Компании по-прежнему склонны оценивать то, что клиент сам сообщает о себе, а не ориентироваться на его поведение. Поэтому системы, использующие источники данных нового типа для повышения эффективности бизнеса, все еще редки.

«Уже несколько лет мы экспериментируем с различного рода источниками данных и давно убедились в том, что не всегда “больше данных” означает “больше денег”», – подчеркнул Максим Савченко, руководитель разработки моделей в Центре компетенций исследований и разработки моделей компании «Сбербанк-Технологии», в своем выступлении на конференции «Технологии Больших Данных», организованной издательством «Открытые системы». Ключевым моментом является то, что если говорить о конечных потребителях технологий, то их целью не является игра с данными или моделями – им нужен финансовый эффект. Между тем сам сбор данных и их хранение не приносят компании денег – как раз наоборот. Создание моделей тоже обходится недешево, но модель представляет собой лишь отчет, а отчеты сами по себе денег компании тоже не приносят. О какой-либо выгоде можно говорить только после внедрения моделей в операционный контур.

В любом случае людей, которые имеют опыт построения моделей, гораздо больше, чем тех, кто имеет опыт их внедрения. Кроме того, можно столкнуться с тем, что внедрить модель не позволяет текущая инфраструктура, либо с тем, что внедрение обходится очень недешево.

«Прежде чем начать решать ту или иную задачу, надо ответить себе на два важных вопроса: какая бизнес-польза будет получена и разрешит ли регулятор использовать полученное решение?» – рекомендует Савченко. Компаниям, разрабатывающим такие системы, например, в целях скоринга, приходится иметь дело с массой ограничений, причем в России ситуация еще не самая тяжелая. Если, начиная проект, об этом не подумать, ресурсы будут выброшены на ветер, даже если проект формально окажется успешным.

Отделить зерна от плевел

Источников данных много, но все они делятся на две категории. К первой относится огромное количество общедоступных данных, которые по сути абсолютно бесполезны для решения большинства бизнес-задач. Очевидно, что, например, попытки на основе сообщений на форуме оценить кредитный риск или эффективность человека как руководителя ни к чему хорошему не приведут. В этом случае при построении моделей придется столкнуться с их низкой эффективностью.

Вторую категорию внешних источников составляют полезные данные. Их меньше, и они более структурированы. Однако у этих внешних данных есть как минимум несколько недостатков. Во-первых, ими кто-то владеет, и за обращение к ним придется платить. Но гораздо печальнее то, что многие данные, интересные с точки зрения принятия решений, представляют собой тайну: тайну связи, коммерческую или банковскую тайну. С такими данными надо очень аккуратно работать, необходимы подходы, которые принципиально отличаются от работы с классическими источниками. Нужны схемы, позволяющие получить необходимую информацию, не нарушая законов и не ущемляя ничьих прав.

«Любопытно, что большая часть детальной информации, интерес к которой может вызывать неприятие клиентов, бизнесу и не нужна. Мы не копаем слишком глубоко, не лезем в те подробности, до которых нам нет дела», – подчеркивает Савченко. Типичным примером стал проект скоринга корпоративных клиентов, реализованный Сбербанком. В результате удалось найти определенный баланс между тем, что нужно, и тем, что можно по закону, причем так, чтобы не создавать проблем...

Это не вся статья. Полная версия доступна только подписчикам журнала. Пожалуйста, авторизуйтесь либо оформите подписку.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF