Действительно, данных у компаний хватает, и даже с избытком — их генерируют датчики в составе промышленного оборудования, информационные системы, другие источники. Не стоит забывать и о залежах неструктурированной информации, накапливающихся в Интернете. Однако пока в большинстве случаев они признаются малоценными и игнорируются. Между тем задач, которые решаются на основе больших объемов и потоков данных, может быть очень много.

Как прогнозируют в Gartner, рынок технологий, объединяемых термином «Большие Данные», в 2013 году достигнет 34 млрд долл., к 2015 году в этой сфере будет трудиться 4,4 млн ИТ-специалистов. И все же до сих пор, по мнению аналитиков, эти технологии только ищут свое применение. И сейчас не существует «правильного» или «неправильного» подхода к использованию Больших Данных.

Во многих отраслях начинают искать способы монетизации имеющихся данных, но следует понимать, что далеко не все данные являются ценным ресурсом. Анализ некоторых бесполезен, и порой лучшее, что можно сделать, — просто выкинуть все горы исторических данных, хранение которых становится не более чем пустой тратой денег. Но для того чтобы понять их реальную ценность, важно определить, на какие вопросы компания ищет ответ.

Доводов для инвестиций в Большие Данные может быть много — от снижения рисков до повышения качества продуктов и услуг. Однако два из них являются безусловными лидерами: более быстрое и обоснованное принятие решений, а также пристальное изучение клиентов. Конечно, эти причины характерны и для традиционных средств BI. Но реальное бизнес-преимущество дает именно скорость получения ответов на возникающие вопросы. Используя средства анализа Больших Данных, компании получают ответы за секунды и минуты, а не за часы и дни, и это радикально влияет на их бизнес-процессы. Вся проблема именно в том, чтобы идентифицировать вокруг себя ценные источники оперативных данных различной природы и задавать «правильные» вопросы.

Но понимает ли сам бизнес, чего хочет от Больших Данных? Многие компании стали осмысливать соответствующие проблемы только в прошлом году, они находятся в самом начале пути. Лишь наиболее «продвинутые» из них определились с используемыми инструментами, видами интересующих данных и способами их обработки, а также с желаемыми результатами и способами их измерения.

Наиболее прогрессивный с точки зрения освоения Больших Данных рынок — это розничная торговля, поскольку здесь активно применяются такие технологии, как радиочастотная идентификация, контроль трафика, управление цепочками поставок и программы лояльности. Они создают поток информации, имеющей наибольшую ценность лишь в реальном времени, и именно здесь кроется масса наиболее очевидных задач для анализа Больших Данных.

Крупные компании из других отраслей, например финансовые, также довольно активно изучают возможности использования Больших Данных, причем более быстрыми темпами, чем можно было ожидать. Как отмечают в NewVantage Partners, такие компании обычно тяжелы на подъем, однако обладают значительными ресурсами. Они видят ценность Больших Данных, особенно содержащихся в Интернете, которые позволяют организовывать поиск клиентов и взаимодействие с ними. 85% из них уже запустили ознакомительные проекты, причем 75% уже вложили в технологию более 1 млн долл. Тем не менее достижение успеха подобных проектов пока видится скорее искусством, чем наукой.

У любой коммерческой организации основным движителем проектов является экономическая целесообразность. Все, что потенциально может увеличить доход или оптимизировать затраты, бизнесу будет интересно. Однако с оценкой эффективности инициатив, связанных с Большими Данными, возникают проблемы. При этом дело не только в наличии большого количества неопределенностей и технологических рисков. Подготовка специалистов для реализации потенциала Больших Данных может оказаться гораздо более сложной задачей, чем внедрение необходимых технологий и процессов.

Данные, считанные с приборов или полученные извне, как правило, являются «грязными» и представляют мало интереса. Их нужно поддерживать в актуальном состоянии, проводить дедупликацию и обогащение. Это означает необходимость создания специальных подразделений, отвечающих за управление данными и их обработку. Их задача — перевод большого объема на первый взгляд малосвязанных данных в предсказательные «догадки», способные принести реальные результаты. Разумеется, такие специалисты, получившие название data scientist, в большом дефиците. Их подготовка требует гораздо более глубокого образования, чем в случае «обычных» аналитиков.

Поделитесь материалом с коллегами и друзьями