Средства бизнес-анализа (Business Intelligence, BI) справедливо относят к наиболее многообещающим инструментам ИТ-области, поскольку они позволяют существенно увеличивать конкурентные преимущества и активы компании. В то же время тяжеловесность BI решений (прежде всего необходимость сбора и «многопроходной» обработки весьма значительных объемов информации с участием бизнес-аналитиков) до сих пор ограничивала применение этих средств уровнем стратегического управления крупных компаний.

Четверть века назад наряду с поддержкой оперативной деятельности линейных подразделений (обработкой заказов, ведением бухгалтерии, учетом ресурсов и т.д.) едва ли не самой важной задачей информационных систем было предоставление сводных отчетов высшему руководству компаний. Через десять лет к этому добавились возможности интерактивной обработки запросов и формирования аналитических отчетов как для топ-менеджмента, так для руководителей среднего звена. Сейчас становятся актуальными общедоступные средства бизнес-анализа, обеспечивающие мониторинг результатов деятельности и предоставление аналитических данных в режиме реального времени

Сегодня руководители предпочитают самостоятельно «осязать» бизнес-ситуацию и возможные сценарии ее развития. Если раньше управление деятельностью компании отталкивалось преимущественно от годового финансового плана, то теперь ключевую роль получают решения тактического и оперативного характера. Руководители среднего звена и рядовые исполнители хотят иметь доступ к детализированной аналитической информации непосредственно в ходе выполнения повседневных операций управления поставками, производством и сбытом, при организации взаимоотношений с клиентами и партнерами, при оценке рисков, конкурентном анализе и финансовой деятельности.

Однако на практике BI являются инструментами 80% руководителей высшего ранга, 50% менеджеров среднего звена и лишь 26% исполнителей. Внедрение средств бизнес-анализа сдерживается, прежде всего тем, что сотрудники не знают их возможностей (57%), а также высокой стоимостью таких решений (54%) и недостаточной квалификацией пользователей (34%). Основные ожидания руководства компаний в отношении средств бизнес-анализа таковы: всем сотрудникам необходимо овладеть навыками принятия решений с их помощью, должны совершенствоваться технологии и повышаться уровень доступности — при одновременном упрощении использования, обеспечении точности и недвусмысленности предоставляемой информации.

Информационная культура и архитектура

Корпоративные информационные системы и Internet обеспечивают неограниченный доступ к информации, однако не вполне ясно, в какой мере эти возможности отвечают требованиям бизнеса. Возникает масса вопросов.

  • Есть ли у руководства и разработчиков ИТ-решений целостное видение деятельности компании и ее бизнес-процессов?
  • Созданы ли в организации условия, при которых все сотрудники, имеющие необходимые знания, в той или иной мере участвуют в создании и использовании информации, в том числе аналитической?
  • Эффективно ли применяются внутренние и внешние информационные ресурсы?
  • Как фильтруются, классифицируются и накапливаются данные?
  • Насколько просто найти нужные данные?
  • Имеются ли в компании эксперты по отдельным областям деятельности и все ли заинтересованные сотрудники знают, как к ним обратиться?

Целостный взгляд на деятельность компании и те информационные системы, ресурсы и технологическую инфраструктуру, которые ее поддерживают, предоставляет общекорпоративная архитектура. Ее неотъемлемыми частями являются бизнес-архитектура, архитектура прикладных систем, ИТ-архитектура, архитектура результативности и эффективности бизнеса, а также архитектура информации, охватывающая следующие области:

  • описание информационных объектов и ресурсов;
  • интеграция информационных ресурсов и предоставления доступа к ним вне зависимости от физического размещения ресурсов;
  • взаимодействие между информационными системами в ходе выполнения бизнес-процессов;
  • обеспечение должного уровня качества хранимой, обрабатываемой и предоставляемой информации (точность, полнота, актуальность, целостность).

Многие подразделения компании работают с одними и теми же информационными объектами (например, «заказ», «продукт», «клиент», «услуга» и т.п.), поэтому необходимы общие определения структуры, грамматики, семантики данных. Эти определения должны быть согласованы с деловым и технологическим контекстами использования данных для обеспечения высокого качества информации и ее доступности (в том числе за счет стандартизации семантики и структур данных, глоссариев, тезаурусов, классификаторов, общих словарей и определений данных). Такая стандартизация критически важна для реализации механизмов очистки и накопления достоверных, логически целостных данных.

Ядром корпоративной информационной архитектуры является эталонная модель информации. Она однозначно идентифицирует информационные ресурсы, используемые бизнес-процессами, и конкретные описания хранилищ данных, классов, типов документов и сообщений. Архитектура ориентирована на задачи интеграции данных и отображает описания бизнес-объектов, их семантики и связей с бизнес-процессами, описания сообщений, элементов и структур хранимых данных. Здесь фиксируются применяемые в компании правила и модели формирования таких описаний и работы с ними.

С помощью эталонной модели информации описываются концептуальная структура данных, логическая структура сообщений, которыми обмениваются взаимодействующие системы, элементы данных, методология обеспечения корреляции между данными в разных хранилищах, а также области ответственности за обеспечение целостности и распространение данных. Особенное внимание уделяется данным, которые используются при информационном обмене между системами. Необходимо проверить, применяются ли аналогичные данные в других подразделениях, и принять меры для унификации их описаний с помощью наиболее распространенных инструментов и языков, в частности XML, позволяющих задавать описания общих форматов обмена информацией.

Важную роль должен играть репозиторий метаданных, позволяющий централизованно накапливать описания структур и форматов данных информационных систем и ресурсов компании, как и способов доступа к этим данным. А поскольку руководителям и исполнителям для принятия решений необходимо активное взаимодействие с информационной средой компании, при котором аналитическая информация запрашивается, формируется и предоставляется непосредственно при выполнении бизнес-процессов, средства бизнес-анализа должны рассматриваться в контексте общекорпоративной архитектуры.

Интеллектуальная среда бизнес-анализа

Под термином «интеллектуальная среда бизнес-анализа» (The Smart BI Framework), введенным Клаудией Имхоф и Колином Уайтом (Claudia Imhoff, Colin White), подразумевается высокоуровневое представление BI-компонентов во взаимосвязи с другими компонентами корпоративной «информационной фабрики». Сама же концепция такой «фабрики» предложена Биллом Инмоном в 1990 году.

Ключевым элементом интеллектуальной среды бизнес-анализа (рис. 1) является блок интеграции данных. Здесь располагаются ИТ-компоненты, ответственные за интеграцию информационных ресурсов и обеспечение взаимодействия BI-компонентов с оперативными бизнес-процессами (транзакциями), процессами планирования, коллективной работы и обмена информацией между сотрудниками компании. К таким компонентам можно отнести средства интеграции данных, интеграции прикладных систем, извлечения, преобразования и загрузки данных и т.п. Наличие средств как автономного (пакетного), так и оперативного объединения информационных ресурсов позволяет:

  • регистрировать бизнес-события и изменения оперативных данных;
  • встраивать BI-сервисы в оперативные бизнес-процессы;
  • рассматривать показатели результативности оперативных бизнес-процессов в контексте плановых показателей;
  • совместно использовать результаты бизнес-анализа и осуществлять информационное взаимодействие между пользователями.

 

Интеллектуальная среда бизнес-анализа

Рис. 1. Интеллектуальная среда бизнес-анализа

Технологические изменения

С начала 90-х годов средства бизнес-анализа быстро развивались по трем основным направлениям.

Архитектура. Сначала аналитические средства были реализованы в мэйнфреймах и мини-компьютерах, а затем перенесены на персональные компьютеры. Впоследствии массовыми стали решения для архитектуры «клиент-сервер». Сегодня широко обсуждаются преимущества распределенной сервисной архитектуры и организации взаимодействия на основе Web-сервисов.

Эволюцию аналитических средств для бизнеса можно проследить на примере продуктов образованной в 1976 году компании SAS Institute. Она выпустила базовую версию продукта Base SAS для мэйнфреймов IBM, затем дополненную компонентами GRAPH (построение графиков), ETS (эконометрика и анализ временных рядов), FSP (полноэкранный редактор) и средствами доступа к базам данных разных СУБД. В 1984 компания создала версии продуктов для мини-компьютеров. Первая версия Base SAS и SAS/RTERM для операционной системы PC DOS появилась в 1985 году и сразу получила признание пользователей. В 1990 году создала решения для распределенной архитектуры «клиент-сервер», в 1998 году — функционально полное решение для корпоративного хранилища данных, в 2003 году — сервер выборки, трансформации и загрузки данных Enterprise ETL Server, а текущий год ознаменовался появлением версии для среды grid.

Интеграция. Из набора разрозненных инструментов, ориентированных преимущественно на потребности аналитиков, средства бизнес-анализа превращаются в специализированные прикладные платформы. Они обеспечивают универсальные сервисы обработки запросов, генерации отчетов и анализа данных, которые при необходимости соответствующим образом адаптируются к потребностям разных категорий пользователей. В качестве примера можно упомянуть продукты Business Objects Enterprise и Panorama Novaview.

Расширение технологического стека. В современные платформы бизнес-анализа включаются как средства логической или физической интеграции информационных ресурсов с соответствующими инструментами описания преобразований, так и развитые интуитивно понятные средства формирования запросов и визуализации результатов аналитической обработки. Примерами таких решений могут служить компоненты бизнес-анализа в составе Oracle Application Server 10g и Inoformatica PowerCenter 8.

Основные технологические достижения, определившие развитие хранилищ данных и средств бизнес-анализа, таковы:

  • многопроцессорные и кластерные решения, позволяющие обрабатывать огромные объемы данных; встроенные в СУБД механизмы управления хранилищами данных;
  • средства консолидации информационных ресурсов (extract, transfer, load, ETL — выборка, трансформация и загрузка данных; enterprise application integration, EAI — интеграция приложений, enterprise information integration, EII — интеграция данных);
  • аналитические средства поддержки принятия решений; репозитории метаданных;
  • средства анализа и обработки слабоструктурированных и неструктурированных данных; виртуальные хранилища оперативных данных.

Формирование информационных ресурсов для анализа

Компании продолжают вкладывать значительные средства в создание корпоративных хранилищ данных. А поставщики инструментов бизнес-анализа стремятся предоставить унифицированные средства доступа и интеграции данных неоднородных информационных систем и ресурсов, способные, например, извлекать данные о конкретном человеке из систем сервисной службы, обработки заказов и финансовой, объединять их и передавать центру обработки заявок клиентов.

Колин Уайт, основатель консалтинговой компании BI Research, рассматривая требования бизнеса и технологические возможности оперативного анализа, выделяет три специфические области: оперативная интеграция данных, мониторинг показателей результативности бизнес-процессов, отображение результатов для принятия решений (Colin White, Right-time Business Intelligence). Степень оперативности тех или иных средств анализа трактуется с точки зрения возможностей регистрировать события или ситуации, оповещать заинтересованных лиц, принимать своевременные решения и осуществлять ответные действия в масштабе времени, приближенном к реальному (в зависимости от приложения требуемое время реакции может составлять несколько минут, часов, рабочий день).

Задачей интеграции данных является формирование единого информационного ресурса на основе нескольких неоднородных информационных ресурсов-источников. Существует множество подходов к решению этой задачи.

Физическое перемещение данных и формирование объединенного информационного ресурса. Данные периодически извлекаются из систем оперативной обработки, подвергаются контролю, преобразованию и очистке, а затем загружаются в хранилище. По данным аналитиков Gartner и IDC, на рынке систем извлечения, преобразования и загрузки данных лидируют компании Ascential Software, Business Objects, DataMirror, IBM, Informatica, Microsoft, Oracle, Pervasive/Data Junction и SAS. Процессы ETL имеют место и при использовании технологии тиражирования баз данных, а также в системах управления контентом, которые позволяют объединять данные из структурированных и неструктурированных источников. Как правило, перенос данных осуществляется в запланированное время в автономном режиме.

Сочетание технологий ETL и EAI на базе одной из развитых платформ интеграции приложений, например компаний BEA, IBM, Microsoft, Oracle и Tibco, обеспечивает управляемое событиями пополнение хранилищ оперативных данных (operational data store, ODS) в приближенном к реальному масштабе времени. Продукты IBM (DB2 Warehuse Manager, DB2 Information Integrator), Microsoft SQL Server и Oracle одновременно поддерживают оба механизма, причем в каждой их новой версии взаимопроникновение технологий увеличивается. Качество конкретного решения определяется прежде всего обеспечиваемым уровнем интеграции, и определяющая роль в этом принадлежит средствам управления и использования метаданных.

Перемещение и обработка больших объемов информации требуют значительных ресурсов, но при необходимости многократной однотипной аналитической обработки статичных (ретроспективных) данных из неоднородных источников оказывается предпочтительным формирование физического объединенного информационного ресурса. Данному подходу присущи и некоторые ограничения: в отдельных случаях создание копии данных источника не допускается по соображениям конфиденциальности и безопасности; не предусматривается корректировка исходных данных.

Формирование виртуального представления. При использовании этого альтернативного подхода к интеграции информационных ресурсов приложение имеет возможность непосредственного доступа к неоднородным ресурсам через единое виртуальное представление. Обработка запросов в рамках такого представления возлагается на сервер интеграции приложений или систему управления распределенными базами данных, которая осуществляет декомпозицию запроса, направляет компоненты запроса источникам, «собирает» результат и возвращает его запрашивающему приложению.

Функциональные возможности серверов интеграции приложений и СУБД определяются не только степенью оптимизации запросов и масштабируемостью, но и спектром поддерживаемых источников данных: это реляционные базы данных, данные специализированных (ERP, CRM) и унаследованных систем, слабоструктурированные и неструктурированные данные. Общепризнанными в области интеграции приложений являются решения, предлагаемые компаниями Actuate (Enterprise Reporting Platform), BEA (Liquid Data), Composite Software (Software Information Server), IBM (DB2 Information Integrator), NCR Teradata (Teradata Warehouse и Teradata Relationship Manager) и MetaMatrix (MetaMatrix Server).

Главное преимущество виртуальной интеграции — отсутствие физического перемещения больших объемов данных и необходимости хранения их копий, но приходится «на лету» решать проблемы согласования разнородных представлений, осуществлять преобразования и очищать данные. При обработке особо сложных запросов с корректировкой исходных данных повышается нагрузка на системы оперативной обработки.

Определенную проблему представляет собой объединение статичных и оперативных данных, но этот вопрос находит эффективное решение, например, на платформе интеграции PowerCenter 8 компании Informatica. Она поддерживает большинство современных стандартов, включая XML, и Web-сервисы для извлечения данных из неоднородных источников, в том числе из систем обработки транзакций. Основным критерием выбора технологической схемы виртуальной интеграции должен служить объем данных, объединяемых за один цикл обработки (он должен быть небольшим, что характерно для оперативного бизнес-анализа). Дополнительными аргументами в пользу логической интеграции являются необходимость преодоления правовых ограничений на создание физических копий или объединение данных конфиденциальных источников, а также сильная «загрязненность» источников.

Оперативный мониторинг и анализ бизнес-ситуаций

Традиционные системы бизнес-анализа и хранилища данных помогают отвечать на вопросы «что происходило в компании?» и «как могут изменяться обстоятельства?». За кадром остаются потребности сотрудников и руководителей отделов продаж, производства, складов, логистики и сервисных служб, которым необходимо оперативно оценивать текущую ситуацию и возможные риски, принимать решения непосредственно в ходе бизнес-процессов. В отчете консалтинговой компании Ventana Research отмечается, что начиная с нынешнего года будут расти возможности и расширяться сфера применения средств оперативного бизнес-анализа.

Системы оперативного бизнес-анализа отличаются от традиционных временем реакции и способом предоставления информации об изменениях. Диаз Несамони (Diaz Nesamoney) полагает, что системы этого класса должны обеспечивать:

  • фиксацию в масштабе реального времени изменений данных в разных источниках;
  • выявление временных зависимостей в цепочках событий;
  • динамическую корректировку аналитических моделей;
  • применение бизнес-правил в соответствии с изменением показателей мониторинга;
  • интуитивно понятный интерфейс.

В качестве ядра таких систем рассматривается специализированное потоковое хранилище данных (streaming data store, SDS). С его помощью в масштабе реального времени осуществляется захват данных о бизнес-событиях, зарегистрированных программными агентами, которые встраиваются в систему оперативной обработки транзакций. Взаимодействие SDS с агентами может осуществляться с помощью интерфейсов прикладного программирования, поддерживающих Web-сервисы, JMS, JDBC, посредством обмена сообщениями с использованием программного обеспечения промежуточного слоя (Tibco, IBM MQ Series), а также соответствующих средств корпоративных информационных систем (например, компаний SAP или PeopleSoft). Факультативно данные о зарегистрированных событиях могут в виде кортежей с соответствующими временными метками выгружаться в реляционную базу данных для последующего анализа уже в автономном режиме.

Наряду с постоянно пополняемым массивом данных о регистрируемых событиях могут храниться и дополняющие их «статичные» данные, извлекаемые из систем поддержки планирования, корпоративного хранилища или иных систем (например, история взаимоотношений с заказчиком, данные о наличии продукта на складе или кредитная история клиента). Имеется возможность динамически формировать композитное представление, наглядно отражающее текущее состояние рассматриваемого вида или аспекта деятельности. По мере возникновения новых событий данные обновляются с сохранением предыдущих значений, причем можно формировать и анализировать временные последовательности значений. В результате выполнения отдельных транзакций извлекаются и интегрируются данные из оперативных и статичных источников, а результирующее представление сохраняется. Пользователь видит текущее значение измеряемого показателя или индикаторную панель, а нежелательное воздействие соответствующего запроса на данные систем оперативной обработки сводится к минимуму.

По мнению одного из руководителей института The Data Warehousing Institute (TDWI) Уэйна Экерсона, новый инструмент оперативного бизнес-анализа, индикаторные панели (dashboard), реализует до 80% функциональных потребностей большинства пользователей компании. Как показывает практика, они предпочитают обращаться к аналитическим средствам преимущественно при возникновении каких-либо отклонений или нештатных ситуаций. Согласно проведенным TDWI в 2004 году исследованиям, 51% организаций уже используют индикаторные панели, а 17% готовятся к внедрению. Оперативные инструментальные панели нового поколения (рис. 2) позволяют менеджеру иметь перед глазами «живую картинку», которая раскрывает динамику текущей бизнес-ситуации: изменения раскрашенных областей, предупреждения, графика и таблицы наглядно отображают параметры выполняемых процессов, показывают развитие событий.

Пример индикаторной панели
Рис. 2. Пример индикаторной панели

При возникновении определенной ситуации (заказанный товар заканчивается на складе) внимание пользователя концентрируется на интуитивно понятном визуальном сигнале. Когда сигнал получен, можно оперативно просмотреть сопутствующие данные (был ли заказан этот товар у поставщика, когда он ожидается на складе) и инициировать адекватный бизнес-процесс (заказ поставщику). Представления данных в рамках индикаторной панели расположены «послойно», причем каждый следующий слой раскрывает дополнительные детали и аспекты возникшей ситуации. Многочисленные сторонники метафоры индикаторных панелей считают, что именно этот подход позволит менеджерам перейти от простого реагирования на бизнес-ситуации к их активному анализу и упреждающим воздействиям.

К числу важнейших характеристик оперативных индикаторных панелей Экерсон относит следующие: наличие Web-интерфейса с присущими ему навигационными возможностями; наглядность; возможность пошаговой детализации отображаемой информации; интерактивность и высокая степень свободы действий пользователя; наличие развитой системы помощи; возможность масштабирования показаний; возможность настройки пользователем или ИТ-специалистом пороговых и целевых значений наблюдаемых параметров, достижение которых может обусловливать отправку уведомлений или запуск соответствующих бизнес-процессов; персональные настройки; поддержка множества каналов и форматов обмена данными (в том числе электронной почты и мобильных устройств), а также интеграции с офисными и корпоративными приложениями; поддержка коллективных режимов работы и обмена аналитическими материалами; опора на использование репозитория метаданных; оперативность отображения данных анализа и реакции на действия пользователя; масштабируемость.

Как представляется, индикаторные панели больше соответствуют образу мышления современных руководителей и исполнителей, чем объемные аналитические отчеты и сводки систем предыдущих поколений.

 

Поделитесь материалом с коллегами и друзьями