Причины возникновения этих направлений понятны. Информация становится все более ценным ресурсом, необходимым для работы предприятий в любой области деятельности. Соответственно, необходимы механизмы и инструменты для работы с этим ресурсом. До появления идеи хранилищ данных такими инструментами являлись системы оперативной обработки данных. Основной задачей этих систем было, как правило, производство данных (чтобы работать с каким-либо ресурсом, необходимо, по крайней мере, его произвести) и их использование для решения задач текущей деятельности предприятия. Со своей задачей они справились более чем успешно. Настолько успешно, что теперь нужно решать: что делать со всей этой информацией, как ориентироваться в накопленных терабайтах данных, как использовать эту информацию во все более обостряющейся конкурентной борьбе?

Два наиболее очевидных решения, сразу приходящие в голову, заключаются в следующем. Путь первый: собрать всю необходимую (или всю существующую) информацию из различных источников данных (системы оперативной обработки информации, электронные архивы и т.д.) в одном месте (на складе), систематизировать ее (разложить по полочкам на складе) и потом спокойно отгружать потребителям, сделавшим соответствующую заявку. Путь второй: потребителям информации пытаться самостоятельно добывать данные из различных источников.

Второй путь, скорее всего, ни к чему хорошему не приведет. Представьте себе, например, попытку найти нужную информацию в Internet. Если вы знаете, что вам нужно и где это находится, вы все получите легко и просто. Если вы знаете, что вам нужно, но не знаете где это искать (и есть ли вообще такая информация), задача сильно усложняется. Если бы в Internet отсутствовали специальные службы поиска, проблема была бы практически неразрешимой. И именно эти службы придают Internet черты склада (правда бесконечно большого и быстро обновляющегося), в котором есть кладовщик, знающий где что лежит.

Неудивительно поэтому, что основное внимание уделяется второму подходу. И внимания уделяется много. Созданием и развитием концепций в области хранилищ данных и оперативной аналитической обработки занимаются многие очень известные и авторитетные специалисты в области систем обработки данных. Даже живые классики. Например, концепцию оперативной аналитической обработки предложил, активно развивает и пропагандирует создатель реляционной модели данных Е.Ф.Кодд.

За короткую историю существования этих подходов, они получили значительное развитие. Созданы десятки продуктов, возникли и набирают обороты фирмы, специализирующиеся на продуктах из этой области. Несмотря на эти успехи, при создании хранилищ данных, как и для всех относительно новых инструментов, возникает множество вопросов, требующих тщательного рассмотрения. Многие из этих вопросов очень актуальны сейчас в России.

Прежде всего, хранилища данных необходимы не сами по себе, а как средство улучшения функционирования предприятия. Если для многих предприятий отсутствие систем оперативной обработки информации в большинстве случаев просто нереально, а выход их из строя грозит предприятию крайне неприятными последствиями, то отсутствие системы поддержки принятия решений, основанной на информационном хранилище, может вообще остаться незамеченным. Особенно если не нужно бороться с конкурентами за доли процента присутствия на рынке, скрупулезно анализируя для этого объемы продаж конкретных групп товаров в некотором регионе на заданном временном интервале. А как раз такая ситуация наиболее характерна для экономик переходного периода.

Кроме этого, в силу того же свойства экономики, многие ли предприятия могут похвастаться существованием у них детальной информации о деятельности предприятия за последние десять-двадцать лет? Вновь возникшие организации (коммерческие банки, крупные торговые дома, частные авиакомпании) для которых, в силу специфики их деятельности, оперативная обработка данных крайне важна, еще не успели произвести столько информации, сколько нужно для осуществления долговременного стратегического анализа и планирования. Те же крупные предприятия, которые работают на российском рынке давно (то есть "вышли" на рынок еще до его образования) часто были монополистами в своей области и для борьбы с конкурентами будут использовать методы, связанные с обработкой информации довольно опосредованно. И не будут, по крайней мере сразу, строить сложные системы поддержки принятия решений и утруждать себя тщательным анализом собственной деятельности. Зачем КАМАЗу "добывать" данные в собственном хранилище, пытаясь выяснить насколько лучше будут продаваться синие грузовики в северных областях в зимний период чем красные, если его конкуренты практически и так ничего не производят?

Есть еще одна проблема, с которой сталкивается предприятие, даже если оно решилось на построение хранилища данных, обладает необходимой технологией и накопило необходимые для этого данные. Насколько эти данные достоверны? Насколько они соответствуют действительности? Кому интересны показатели продаж каких-либо товаров десятилетней давности, еще в "той" экономике, до наступления переходного периода?

И последнее, о чем хотелось бы упомянуть. Каждое хранилище данных - уникальное изделие "ручной работы". Их проектирование, реализацию и внедрение нельзя поставить на поток. Необходимо участие высококвалифицированных разработчиков и, главное, наличие квалифицированных пользователей, которые сами должны продумывать и формировать запросы к хранилищу. Причем большая часть запросов будет нерегламентированными, что налагает большие требования на уровень пользователей, работающих с информационным хранилищем. Хотя эти соображения, наверное, меньше всего будут препятствовать распространению информационных хранилищ в России. Специалисты по "штучным" изделиям у нас всегда были, есть и, надеюсь, будут.

Как всегда, вопросов больше, чем ответов. Но, несмотря на все возникающие вопросы, технологии, о которых шла речь выше, развиваются очень бурно. Рано или поздно придется проявить к ним интерес. Раньше - лучше.


Андрей Волков - главный редактор журнала "Системы Управления Базами Данных". С ним можно связаться по электронной почте: volkov@osp.ru.

Поделитесь материалом с коллегами и друзьями