Ник Росситер Informatica
Ник Росситер: «Многие крупные российские компании уже начали путешествие в мир Больших Данных»

В рамках форума Big Data 2013, проведенного 21 марта издательством «Открытые системы», серьезное внимание было уделено экономической эффективности проектов Больших Данных. Как подчеркнули многие эксперты, Большие Данные сами по себе не интересуют бизнес, подобные технологии должны продвигаться как бизнес-проект. Своими взглядами на проблему поделился Ник Росситер, региональный менеджер Informatica в России и СНГ.

- В чем, с вашей точки зрения, заключается проблема Больших Данных? Каковы ее ключевые проявления?

У многих компаний существует свой собственный взгляд на Большие Данные. С нашей точки зрения, Большие Данные включают в себя три взаимосвязанные, но различные составляющие: «Большие транзакционные Данные», «Большие Данные взаимодействия» и «обработка Больших Данных».

Транзакционные данные компаний растут примерно на 40% в год, что представляет значительную проблему. Но еще большую проблему представляет рост информации в социальных сетях и данных межмашинного взаимодействия – различных устройств и датчиков. Эта категория данных демонстрирует четырехкратный рост ежегодно. Главная проблема, стоящая как перед компаниями, так и перед госучреждениями, состоит в том, что их информационная инфраструктура никогда не рассчитывалась на такие объемы данных, которые сейчас стали реальностью.

- Если заглянуть в будущее, анализ Больших Данных станет скорее конкурентным преимуществом компаний или условием их выживания на рынке?

Это не вопрос будущего. С Большими Данными уже приходится иметь дело, и проблема, как я уже сказал, в том, что ими пытаются управлять с помощью устаревших технологий.

Многие крупные российские компании уже начали путешествие в мир Больших Данных. Вероятно, когда-нибудь эти технологии станут обычными для большинства компаний, но в обозримом будущем речь идет все-таки о создании мощных конкурентных преимуществ.

Например, один из мобильных операторов использует наши решения для интеграции многочисленных источников данных – как внутренних, так и внешних. Это дает возможность анализировать причины оттока клиентов на базе информации об их звонках, биллинговых данных, записей в социальных сетях. Объединив данные транзакционных систем с внешними источниками, компания вдвое сократила показатель оттока, что, очевидно, дает ощутимый финансовый эффект.

- Гора Больших Данных может содержать маленькое зернышко бизнес-ценности, не оправдывающее затрат на хранение и обработку. Как избежать таких ситуаций?

Разумеется, в случае плохого управления проектом такое может произойти. Перед тем как начинать столь инновационный проект, какими сейчас пока являются любые действия с Большими Данными, следует пристально взглянуть на текущую ситуацию. Как показала многолетняя практика внедрения различных ИТ-систем, самое главное, что следует сделать при автоматизации каких-либо ручных процессов, — убедиться, что они работают корректно и эффективно. Примерно то же самое можно посоветовать применительно к Большим Данным. Не все виды данных одинаково ценны для бизнеса, и выбор верных источников критически важен. Ни одна компания не может себе позволить анализ абсолютно всех данных, особенно если они устарели, ошибочны и т. п.

- Технологии Больших Данных требуют значительных инвестиций. За счет чего они могут окупиться?

Такие технологии, как Apache Hadoop, позволяют удерживать необходимые инвестиции в разумных пределах, предоставляя платформу для дешевого хранения и обработки информации. Их использование совместно с решениями, ориентированными на аналитику, дает ощутимый возврат инвестиций. К слову, именно такая тенденция наблюдается сейчас и в мире, и в России. Компании создают и тестируют экосистемы вокруг кластеров Hadoop.

Кроме того, никто не отменял практику пилотных проектов. Компании переходят к полномасштабной реализации лишь тех проектов, которые показали свою жизнеспособность и очевидную пользу для бизнеса. Это тоже помогает держать инвестиции под контролем.

Что касается экономических эффектов, то они зависят от сферы деятельности компании и специфики рынка. Например, для телекоммуникационных компаний важно отслеживать лояльность клиентов. Автопроизводители предлагают услуги, основанные на анализе данных с датчиков на машинах. В медицине технологии Больших Данных помогают спасать жизни – это тоже возврат инвестиций.

- Как оценить возврат инвестиций в Большие Данные? Можете ли вы предложить варианты таких оценок?

Все просто: возврат инвестиций равен ценности, получаемой от Больших Данных, разделенной на стоимость их сбора, хранения и обработки. Улучшать это соотношение можно как путем повышения значения числителя – функционала созданной системы, так и путем сокращения знаменателя.

Но в рамках каждой компании или даже каждого отдельного проекта могут быть разработаны и собственные метрики. Возврат инвестиций может происходить благодаря ускорению вывода на рынок продуктов и услуг или более точной оценке настроений клиентов.

К сожалению, далеко не всегда традиционные для ИТ метрики (например, скорость транзакций и сокращение энергопотребления) могут быть адекватно применены к проектам Больших Данных.

Многие виды данных имеют ценность лишь в реальном времени. Имеет ли смысл компаниям хранить такие данные?

Это во многом зависит от политики компании, но могу вас уверить, что торговля системами хранения данных еще долго будет оставаться весьма прибыльным бизнесом. Существует очень много направлений, где необходим анализ исторических данных, например системы борьбы с мошенничеством, являющиеся одним из примеров систем реального времени.