Алексей Шуленин: "Microsoft поддерживает три схемы построения хранилищ данных: ROLAP, MOLAP и HOLAP"

Все уже давно привыкли, что у Microsoft, как в Греции, есть все. Есть в ассортименте этой компании и решения в области хранилищ данных. Правда, Gartner Group пока позиционирует их в качестве решений для создания киосков данных и небольших хранилищ. Менеджеры Microsoft стараются не подчеркивать явным образом эту особенность продуктов своей компании, впрочем, они и не позиционируют их как системы, ориентированные на создание больших хранилищ, скорее даже наоборот - время от времени проскальзывают рекомендации применять эти решения для создания вспомогательных хранилищ, тем или иным образом взаимодействующих с основным и предназначенных в первую очередь для поддержки систем оперативной аналитической обработки (OLAP).

По крайней мере, именно так обстояли дела на прошедшем 10 сентября семинаре для разработчиков, организованном Microsoft совместно со своим партнером из Петербурга - компанией Digital Design.

Как сообщил Алексей Шуленин, системный инженер российского представительства Microsoft, в настоящее время корпорация готовит к выходу целый ряд продуктов для создания хранилищ данных и OLAP-серверов. В четвертом квартале нынешнего года должны появиться очередные версии Microsoft SQL Server 7.0 и средства организации репозитариев метаданных Repository 2.0, а также новые продукты: инструментарий для загрузки данных в хранилище Data Transformation Services и средство создания OLAP-систем Decision Support Services 1.0.

Роль ключевого продукта для создания хранилищ данных отводится, конечно, новой версии СУБД. По словам ведущего разработчика компании Digital Design Олега Львовича, Microsoft SQL Server 7.0 обеспечит хранение до 1 млн. Тбайт данных. Размер одного файла базы данных может достигать 32 Тбайт, максимальной строки - 8060 байт. СУБД позволит хранить до 1024 столбцов в одной таблице и включать в один запрос до 255 таблиц. Утверждается, что в новой версии СУБД существенно оптимизированы операции ввода/вывода данных, появились новые типы операций объединения таблиц (JOIN), новый анализатор запросов, усовершенствованы администрирование и мониторинг СУБД, расширены возможности по настройке индекса. Заявленные Microsoft возможности впечатляют, однако корпорации, по всей видимости, придется приложить еще немало усилий, прежде чем она сможет доказать заказчикам, что система SQL Server вполне пригодна для создания хранилищ данных и способна обеспечить для этого не только все необходимые функции, но также достаточную надежность и производительность при работе на реальных ПК-серверах. Впрочем, на управление большими хранилищами данных этот продукт пока не претендует. Сейчас основной акцент делается на возможности Microsoft SQL Server по созданию киосков данных и управлению базами данных, специально спроектированных для OLAP-систем. Новая СУБД поддерживает две основные архитектуры баз данных для OLAP-систем, а также гибридную схему, представляющую собой синтез архитектур. Напомним, что эти схемы - MOLAP (Multidimensional OLAP) и ROLAP (Relational OLAP) - основаны на представлении многомерных кубов, традиционных для OLAP-систем структур данных в виде соответственно многомерных массивов и реляционных баз данных. Первая архитектура обеспечивает подлинную многомерность хранимых данных и более высокую производительность. Схема MOLAP позволяет отделить киоск данных от основного хранилища, обновляя содержащуюся в киоске информацию лишь периодически. OLAP-сервер в данном случае реализуется в виде самостоятельной системы. Схема ROLAP по сути представляет собой развертывание многомерной структуры данных на реляционную плоскость в виде «звездочки» или «снежинки». Схема реализуется в виде своего рода интерфейса - надстройки над реляционной СУБД, она более медлительна, требует постоянной связи с основным хранилищем, зато обеспечивает минимальное дублирование запросов. Возможно также сочетание двух архитектур - схема HOLAP (Hybrid OLAP).