Павел Котов, менеджер по развитию бизнеса российского представительства SAS Institute: "Решения в области хранилищ данных помогут пользователям усовершенствовать каждодневную работу с информацией"
Рассказывая о своей концепции построения хранилищ данных, представители SAS Institute делают акцент на интеллектуальность систем. Под интеллектуальностью в данном случае подразумевается возможность сделать работу с хранилищем данных более осмысленной как для разработчиков аналитических приложений, так и для их пользователей. Пользователи должны иметь возможность доступа не только к имеющейся в данный момент выборке, подготовленной для текущих аналитических исследований, но и к исходным детальным неагрегированным данным. Это позволит им максимально широко менять диапазон анализируемых данных в надежде получить более достоверный результат. Кроме того, повышению осмысленности работы с данными призваны служить средства мониторинга как за аппаратными, так и программными компонентами, обеспечивающими нормальную работу хранилища данных и прикладных аналитических систем.

Утверждается, что объем выборки данных, построенной с помощью инструментария SAS, в среднем составляет примерно 25% от объема исходных данных (сжатие происходит за счет агрегации). Степень сжатия может меняться в зависимости от требуемого соотношения между объемом баз данных и производительностью аналитических приложений.

При построении хранилищ данных SAS ориентируется на гибридную архитектуру систем аналитической обработки данных (Hybrid OLAP), основанную на комбинации плоских реляционных таблиц и многомерных баз данных. Развитые средства управления метаданными позволяют, в числе прочего, интегрировать метаданные реляционных и многомерных баз данных. Поддерживается несколько типов многомерных баз данных, в том числе и те, что оптимизированы на повышение производительности аналитических систем для конкретных прикладных областей. Один из таких типов, например, предназначен для получения консолидированной финансовой отчетности и аналитики в области финансов. Есть возможность оптимизации хранилищ для более продуктивной работы в области добычи данных и некоторых других областях.