BI и DSS - две стороны одной медали | Открытые системы. СУБД

Как только не переводят термин Business Intelligence – и организация бизнес-процессов, и коммерческая разведка, и промышленный шпионаж и т.п., но чаще всего используется устоявшееся сочетание бизнес-аналитика. Естественно предположить, что раз нет сложившегося перевода, значит, нет и общепринятого понимания смысла. В то же время вот уже много десятилетий известны близкие к BI системы поддержки принятия решений (Decision Support System, DSS). Здесь и с переводом, и с трактовкой термина проблем не возникает. Если мы сравним соответствующие главы в русском или английском издании Wikipedia, то найдем в них так мало общего между BI и DSS, что у несведущего человека может сложиться ложное впечатление. Может показаться, что речь идет о совершенно разных областях, плюс к тому все выглядит так, будто BI – это хорошо и правильно, а DSS – рудимент академических разработок, начатых еще в 60-е годы и кое-как доживших до нашего времени. Но оба впечатления ошибочны. Во-первых, в обоих случаях речь идет практически об одном и том же – BI и DSS представляют собой два подхода к решению задачи автоматизации и оптимизации управления предприятиями, но первый можно условно назвать «подходом снизу», а второй — «подходом сверху». Условно говоря, DSS в большей степени подход, основанный на теории, а BI – на практике. Во-вторых, значение научного наследия никто не отменял, и продуктивным является не противопоставление одного другому, а, как всегда бывает в аналогичных ситуациях, конвергенция.

С точки зрения BI

С позиции BI разобраться в отмеченном противоречии поможет небольшая, но значимая статья 10 Principles of the New Business Intelligence, написанная признанным экспертом в области BI и управления знаниями Томасом Давенпортом. Кстати, в компьютерной и бизнес-среде чаще говорят именно о BI, а не о DSS. Итак, что утверждает Давенпорт.

Решения – это те составляющие работы, к которым прилагаются инициативы BI.
Если вы действительно хотите улучшить качество принимаемых решений, то недостаточно ограничиться лишь обеспечением доступа к данным и необходимым инструментарием.
Если вы намереваетесь снабжать лицо, принимающее решение, данными, постарайтесь ограничиться необходимым подмножеством.
Отношения между информацией и решениями зависят от типа организации, они могут быть слабосвязанными, структурированными или автоматическими.
Слабая связанность упрощает поставку информации, но редко приводит к решениям высокого качества.
Наиболее перспективна структурированная связь, когда окончательное решение остается за человеком, но тем не менее он действует, используя подготовленные варианты.
Вы не можете определить значение BI, не связав каким-то образом решения и информацию друг к другу, иначе вам будет непонятно, каким инструментом нужно пользоваться.
Чем более тесная связь между информацией и решением, тем более специфичными должны быть методы принятия решений.
Попытки поиска «одной истины» могут оказаться слишком дорогими.
Качество результатов повышается при использовании информационных технологий, адаптированных к определенной области, вплоть до автоматизации.

В соответствии с этими принципами Давенпорт вводит собственную классификацию систем, относящихся к классу BI; он делит их на три уровня – слабосвязанные, структурированные с участием человека и автоматизированные (рис. 1).

На самом деле в классификации Давенпорта нет исторической шкалы времени, отражающей последовательность появления этих трех ступеней. Если бы она была, то тогда можно было бы проследить причудливую траекторию эволюции систем BI. Вопреки ожиданиям она начинается с верхнего уровня этой пирамиды, потому что в те времена, когда это происходило, о существовании и значении нижних уровней никто и не догадывался. Тогда во главе процесса стояли серьезные ученые и казалось, что именно их усилиями должны быть созданы системы, помогающие принимать решения в бизнесе, а интересы пользователей в расчет не брались. Те, кто принимал решения, терпеливо ждали в своих кабинетах, когда из стеклянных машинных залов им принесут данные, чтобы потом погрузиться в их неспешный анализ.

В 80-е и особенно в 90-е годы целый ряд компаний вышел на рынок с продуктами, рассчитанными на пользователей и выполненными по принципу «сделай сам» (do-it-yourself). Чтобы пользоваться ими, не нужно было быть программистом, они предоставили конечным пользователям возможность самостоятельно решать задачи BI. Так началось формирование среднего уровня пирамиды Давенпорта. В последующем часть этих компаний разорилась, а оставшиеся (Cognos, Hyperion и Business Objects) оказались раскупленными более крупными. Все эти продукты хорошо работали с готовыми данными, но их сбор оставался нерешенной задачей.

Сегодня потребность в системах BI снова стала удовлетворяться движением снизу, что привело к стихийному появлению третьего уровня, который обещает дать быстрые и богатые всходы, но страдает собственными слабостями и недостатками.

Некоторым наблюдателям представляется, что можно ограничиться одним третьим «эмпирическим» уровнем, но с этим мнением сложно согласиться, эффективная система BI не может обойтись без всех трех.

Происхождение BI

Первые практические попытки использовать компьютер в качестве инструмента, помогающего в принятии решений, были предприняты в Технологическом институте Карнеги, позже преобразованном в Университет Карнеги-Меллона, еще в конце 50-х, а через несколько лет они были продолжены в Массачусетском технологическом институте. Несмотря на то что задачи создания систем класса DSS ставились давно, количество результативных решений невелико. К числу наиболее успешных попыток реализации идеи DSS как раз и относится то, что сейчас называют Business Intelligence.

Рождение BI датируется 1958 годом, когда Ханс Петер Лун опубликовал в IBM System Journal статью «A Business Intelligence System». В ней он представил бизнес как набор различных видов деятельности в науке, технологиях, коммерции, индустрии и даже в законодательной сфере, а обеспечивающие его системы – системами, поддерживающими разумную деятельность (intelligence system). Словом intelligence Лун обозначал способность устанавливать взаимосвязь между представлениями отдельных фактов и действиями в интересах решения поставленных задач и достижения намеченных целей. Лун замечателен своей разносторонностью: он проработал много лет в текстильной промышленности, сделал несколько изобретений, в том числе измерительный прибор «лунометр», производимый и используемый по сей день. Однако в 50-е годы он изменил направление деятельности и отдал много сил разработке методов работы с информацией; известно, что именно Лун предложил алгоритмы хеширования и полнотекстового поиска.

В представлении BI Лун явно опередил время, поэтому в дальнейшем эта часть его работы была забыта на 30 лет, вплоть до тех пор, когда в 1989 году ее заново открыл известный аналитик из Gartner Ховард Дреснер. Фактически он выделил из множества подходов к DSS один, известный как Data-Driven DSS, и назвал его Business Intelligence. С тех пор у многих сложилось впечатление, что BI – это есть именно то, что имеет в виду Gartner, и что вся аналитика в бизнесе может быть сведена к BI в той форме, как ее интерпретирует Gartner. Так ли это, рассмотрим позже, а пока ограничимся данной трактовкой потому что ее достаточно для того, чтобы понять, как важны системы поддержки принятия решений для бизнеса.

Эмпирический подход к BI

Мировой экономический кризис показал, что имеющиеся средства прогнозирования, заложенные в современные информационные системы, нельзя признать удовлетворительными ни на уровне государства, ни на уровне отдельного предприятия. Причину слабости информационных систем в части аналитики можно искать в том, что при их создании основное внимание уделялось автоматизации операционного управления, а не технологиям поддержки принятия решений. Этот дисбаланс следует устранить, поэтому в ближайшие годы фокус внимания должен сместиться на технологии, поддерживающие аналитику. Об этом, например, говорилось на конференции Gartner Business Intelligence Summit 2009 в Гааге, где была дана оценка перспектив и возможностей BI на период с 2009-го по 2012 год. Итоговый доклад Gartner Predicts 2009: Business Intelligence and Performance Management Will Deliver Greater Business Value вызывает двойственное отношение. С одной стороны, внимание, которое он к себе привлек, свидетельствует об актуальности проблем и авторитете авторов, а с другой – внимательный анализ содержания заставляет прийти к выводу об отсутствии должного понимания места BI в более общей системе поддержки принятия решений. Вот основные положения доклада:

Усилится недоверие потребителей к ИТ-подразделениям. До 2012 года по меньшей мере 40% всего бюджета, отпускаемого на BI, будет использовано не представителями ИТ-структур, а работниками бизнес-подразделений. Такая самодеятельность будет вызвана утратой доверия к ИТ-профессионалам, сомнением в их способности удовлетворить потребность в получении необходимой для принятия решения информации. Естественно, что пользователи пойдут по наиболее понятному им пути, они по-прежнему будут использовать привычные им электронные таблицы и соответствующие индикаторные панели. Но дополнительно они будут закупать готовые аналитические приложения, например, для анализа производительности: Corporate Performance Management, Online Marketing Analytics, Predictive Analytics и т.д., которые не только обеспечат отчетность, но и позволят оптимизировать процесс управления. Действуя независимо от ИТ-подразделений, бизнес-пользователи, возможно, поступают разумно, но такой подход имеет и оборотную сторону. Практичный на первый взгляд подход идеологически представляет собой возврат к созданию бессистемного набора приложений. Это уже проходилось, и для избавления от «зоопарка» программ родилось даже целое направление – интеграция корпоративных приложений (Enterprise Application Integration, EAI).
Положение облегчается тем, что в 20% случаев организации будут реализовывать BI, ориентируясь на получение приложений в виде сервисов (SaaS), однако, скорее всего, по этому пути пойдут не самостоятельные пользователи, а представители ИТ-подразделений.
Начиная с 2009 года будут активно развиваться коллегиальные методы поддержки принятия решений (Collaborative Decision Making), которые могут сочетаться с социальным программным обеспечением, входящим в состав платформ BI.
До 2012 года одна треть аналитических приложений, применимых к бизнес-процессам, будет строиться с использованием корпоративных коллажей.
«Вплоть до 2012 года более 35% из 5 тыс. наиболее крупных компаний будут совершать регулярные ошибки при принятии критически важных решений, касающихся изменений в их бизнесе и на рынке». Признав одну треть неудачниками, аналитики Gartner явно польстили остальным. Экономические потери заставят эти организации переосмыслить стратегические и оперативные планы, а требования со стороны общественных организаций и государственных органов потребуют большей прозрачности в представлении финансовой и других видов отчетности. Однако большинство организаций не владеют сегодня информационными процессами и инструментами, чтобы компенсировать несовершенство информационных инфраструктур и методов управления бизнесом.

Таким образом, потребность в BI налицо, но адекватных способов ее удовлетворения, которые могли бы предложить профессионалы, то есть обещанного на верхнем и среднем уровне по классификации Давенпорта, – нет. Вот и приходится потребителям самим решать свои проблемы.

Во всем «виноват»… Гейтс

Готовы ли мы это признать или нет, но некоторые публичные выступления Билла Гейтса сыграли знаменательную роль в компьютерной индустрии, а ряд из них можно рассматривать в качестве катализаторов будущих процессов. Первым публичным актом стало открытое письмо ограниченному в ту пору сообществу пользователей первых компьютеров Open Letter to Hobbyists от 3 февраля 1976 года, когда компания еще называлась Micro-Soft. Поводом для обращения стало свободное копирование перфолент с интерпретатором Basic, написанным им вместе с Полом Алленом. Автор вопрошал: «Музыкант имеет право на получение прибыли от продажи его записей, то же право имеет писатель, когда продают его книги, а чем отличаются те, кто тиражирует программное обеспечение, почему они не должны отчислять прибыль авторам?» Этот лист бумаги с напечатанным на машинке текстом, хранящийся сегодня в Компьютерном музее в Маунтин-Вью, во многом определил лицо современной индустрии программного обеспечения.

Менее известно выступление Гейтса в ноябре 1990 года на осенней выставке Comdex, американском аналоге СeBIT. Ключевой доклад Гейтса назывался «Информация на кончиках пальцев» (Information At Your Fingertips), в нем он выразил обеспокоенность тем, что примерно с 1986 года наметилось замедление темпов роста производства ПК; если бы дело так и продолжилось, то к 1991 году начался бы спад. Единственный быстрый способ загрузить более мощные компьютеры состоит в том, чтобы заставить их обрабатывать большие объемы данных. Нельзя сказать, что рост объема данных есть результат заговора, но то, что избранный путь развития такому росту способствовал, очевидно. Постепенно в компьютерной индустрии сложилось такое отношение к данным, которое стало причиной накопления немыслимого и чаще всего никому не нужного их количества и привело к положению, которое вполне можно назвать «загрязнением окружающей среды данными».

С тех пор рост объемов данных стал согласовываться с производительностью оборудования. Шерлоку Холмсу было достаточно взглянуть на пепел от сигары, чтобы сделать выводы о том, откуда, когда и зачем приехал посетитель, сегодня можно добиться примерно того же, если перебрать десятки баз данных. Чтобы стимулировать этот процесс, Гейтс порекомендовал превратить ПК в коммуникационное устройство. Для этого потребовались бы поисковое устройство, он назвал его Unite, агрегаторы информации News Edge и InfoAlliance, а также программы для управления потоками Fileshare и Lotus Notes: «Если мы все это сделаем, то тогда сидящий за ПК сможет получить любую нужную ему информацию». По определению Гейтса, информация – это все то, что может заинтересовать человека, включая то, о существовании чего он еще и не догадывается. Он предугадал практически все, что произошло в последующие годы, за исключением того, что именно в ноябре 1990 года Тим Бернерс-Ли изобрел WWW. Сегодня, хотим мы это признавать или нет, но мы живем в информационном мире, построенном по проекту Билла Гейтса, при всем его удобстве и привлекательности страдающем упрощенным отношением к информации.

Вера во всемогущество данных рождает убеждение в том, что, если вся информация доступна, то систему управления предприятием вполне можно представить как управление сложным техническим объектом, где место за пультами занимают директора по направлениям. Об ошибочности этого убеждения говорит Давенпорт в своем втором тезисе, но в начале 90-х сомнений во всемогуществе данных не возникало, однако и сегодня картинка, нарисованная Гейтсом, остается не менее фантастической, чем тогда. Тем не менее управлять как-то надо, и на практике место фантастических пультов заняли системы планирования ресурсов предприятия (Enterprise Resource Planning, ERP), системы управления отношениями с клиентами Customer Relationship Management, CRM), а также бесконечные SCM, ECM, EMM, SSTD, EAM, MES, WMS, SCM, CMMS, HRM, CTMS и многие другие, полезные в определенных отношениях, но не решающие классических задач управления.

Особняком образовалась триада BPM, составленная из компонентов Business Performance Management, Business Process Management и Business Process Modeling, пытающихся моделировать и управлять бизнесом. В качестве инструмента поддержки всех трех BPM предусматривается BI.

BI с точки зрения DSS

Еще в докомпьютерную эпоху предпринимались многочисленные попытки механизировать работу человека с информацией, начиная от совсем наивных проб Раймонда Луллия и Чарльза Стэнхоупа до приближенной к реальности машины Пола Отле и Эмануэля Гольдберга. Последней из этих гипотетических машин оказалась memex Ванневара Буша, описанная всего за год до появления первого компьютера ENIAC и иногда рассматриваемая в качестве прототипа ПК. Но только с появлением таких компьютеров, как IBM 7094 или Univac 494, открылась возможность создания систем, которые позже назовут DSS. Среди тех, кто первым пошел в неизведанное, следует назвать Джорджа Данцига, Дага Энгельбарта и Джея Форрестера. Данциг больше известен как математик, он наряду с Леонидом Канторовичем и Джоном фон Нейманом является одним из трех признанных создателей линейного программирования. Данциг с 1952 года работал над созданием DSS в Rand Corporation, а чуть позже Энгельбарт вместе с коллегами создал гипермедийную систему для групповой работы NLS (oNLine System). Форрестер руководил созданием SAGE (Semi-Automatic Ground Environment), системы для противовоздушной обороны с элементами DSS. Также заслуживают упоминания работы, возглавляемые Джозефом Ликлайдером, которые в конечном итоге стали основой для создания ARPAnet.

Впервые термин Decision Support System в приложении к структурированным и квазиструктурированным решениям был предложен в 1971 году. В 1974 появился альтернативный термин Management Information Systems, относящийся к интегрированным человеко-машинным системам, поддерживающим текущую работу, управление и принятие решений. Следующее десятилетие отмечено огромным количеством академических и университетских работ, в которых рассматривались:

системы каталогизации, обеспечивающие доступ к элементам данных;
системы анализа данных, поддерживающие манипуляции над данными с помощью инструментов, специально адаптированных к определенному классу задач;
аналитические информационные системы, обеспечивающие доступ к специализированным базам данных и небольшим моделям;
бухгалтерские и финансовые модели, позволяющие просчитать последствия предпринимаемых действий;
репрезентационные модели, позволяющие оценить последствия на основе имитационных моделей;
оптимизационные модели, предоставляющие возможность выбора оптимального решения при наличии заданных ограничений;
вероятностные модели, позволяющие сравнивать альтернативные варианты.

К началу 80-х годов многим казалось, что почти все решено. Джон Рокарт из Гарвардской школы бизнеса опубликовал вызвавшую колоссальный эффект работу The CEO goes on-line, после которой как грибы после дождя пошли многочисленные системы для поддержки работы руководителя - Executive Information System (EIS) и Executive Support System (ESS). Особые надежды возлагались на методы искусственного интеллекта и экспертные системы. Логика ученых того времени была удивительно проста – достаточно создать четыре основных компонента: системный язык (language system, LS), на котором описываются сообщения, адресованные DSS, и который может воспринимать система; язык представлений (presentation system, PS), на котором говорит DSS; базу знаний системы (knowledge system, KS) для всего, что знает DSS; систему обработки (problem-processing system, PPS) – программную машину, способную решить все проблемы, встающие перед DSS.

В известной книге Даниэля Пауэра «Системы поддержки принятия решений» (Decision Support Systems: Concepts and Resources for Managers), заслуживающей название «библия DSS», мы можем найти классификацию DSS, наиболее удобную для проведения параллели между BI и DSS.

Управляемые моделями (Model-Driven DSS). Среди систем поддержки принятия решений исторически первыми были именно такие DSS, что неудивительно – они строились примерно на тех же кибернетических подходах, которые применялись в создании технических систем управления с начала 60-х годов. В отечественной практике модели довольно широко использовались в различного рода автоматизированных системах управления. Отличительной особенностью Model-Driven DSS является использование ограниченных по размерам наборов данных и параметров, их объем не должен быть больше, чем необходимо для создания репрезентативной модели, требуемой для анализа финансовой или экономической ситуации. Алгоритмическая основа для моделирования может быть весьма разнообразной, в том числе может быть сведена к графическому представлению данных. Кстати, первая электронная таблица VisiCalc, предложенная для ПК в 1978 году, как легко догадаться из ее названия, предназначалась не столько для расчетов, сколько для визуализации результатов, то есть являлась средством для моделирования. Model-Driven DSS не потеряли своей актуальности и до сих пор используются в ограниченном количестве университетских и академических исследовательских работах, к тому же некоторые системы, построенные на принципах OLAP, можно рассматривать как гибридные, сочетающие в себе свойства управляемых моделями и управляемых данными систем.

Управляемые данными (Data-Driven DSS). Системы этого типа обеспечивают доступ и манипулирование большими базами структурированных данных, чаще всего упорядоченных по времени внутрикорпоративных или внешних. В них основой для составления запросов и выборки нужных сведений служат простые средства для доступа к файлам, они же обеспечивают необходимое агрегирование данных и, если есть необходимость, то и требуемые вычисления. Хранилища, позволяющие манипулировать данными с привлечением инструментов, адаптированных к определенным задачам, обеспечивают более высокий уровень функциональности. Data-Driven DSS с возможностями аналитической работы обеспечивают более высокий уровень функциональности и поддержку анализа исторических данных. Сегодня BI сводится исключительно к анализу Data-Driven DSS, что не вполне корректно.

Управляемые сообщениями (Communication-Driven DSS), или групповые (Group DSS) поддерживаются самыми разнообразными технологиями групповой работы.

Управляемые документами (Document-Driven DSS). Системы этого типа обеспечивают поиск, выделение, классификацию в неструктурированных тестовых документах. Они основываются на комплексе самых разнообразных поисковых технологий, включая техники работы с гипертекстовыми документами, аудио- и видеофайлами.

Управляемые знаниями (Knowledge-Driven DSS). Подобные системы еще называют Suggestion DSS («рекомендательные») или Management Expert System, поскольку они могут давать менеджеру определенные указания или делать предположения, основываясь на правилах бизнеса и базе знаний. Такие системы можно представлять как системы «раскопки» (mining) скрытых образов в базах знаний. Они обеспечивают просмотр больших объемов данных и выделение контекста.

Вот одно из наиболее полноценных определений BI, появившееся на сайте IBM после приобретения ею Cognos: «BI – это сбор, управление, распределение и анализ информации с целью выработки такого видения проблемы, которое позволяет принять наилучшее решение. BI – это процесс последовательного преобразования данных в информацию, информации в понимание, понимания в знание и, наконец, общего знания в целенаправленное, прикладное знание, которое позволяет принимать решение. BI поддерживается данными из хранилищ, методами разработки данных, технологиями поддержки принятия решений». Если мы заменим в этом определении BI на DSS, то не совершим логической ошибки. Ведь BI есть не что иное, как набор приложений и технологий для сбора, хранения, анализа и представления данных, помогающих принять решение, и DSS точно так же можно считать программами и приложениями для анализа и представления с целью упрощения принятия решений. Общность в том, что данные используются для принятия решений.

Для убедительности приведем еще одно определение DSS, его можно найти в известной книге Ральфа Спарка и Эрика Карлсона «Построение эффективных систем принятия решений»: DSS – это компьютерная система, которая помогает лицу, принимающему решение, в условиях неопределенности в процессе прямого взаимодействия с использованием данных и моделей. Если сравнить классификацию DSS по Пауэру с приведенными определениями и классификацией BI по Давенпорту, то между ними несложно установить взаимное соответствие. Нижнему «слабосвязанному» уровню соответствуют Communication-Driven DSS и Data-Driven DSS, среднему «структурированному» – Knowledge-Driven DSS и Document-Driven DSS, а самому верхнему – Model-Driven DSS (рис. 2).

Если возвратиться к отчету Gartner и сравнить его с приведенными соотношениями между BI и DSS, то можно убедиться, что в нем BI сводится исключительно к Communication-Driven DSS и Data-Driven DSS, однако полноценно бизнес-аналитика не сможет развиваться без оставшихся трех: Knowledge-Driven DSS, Document-Driven DSS, и Model-Driven DSS.

***

Имеющихся в современных BI-системах возможностей прогнозирования, как показали «неожиданные» потрясения финансовых институтов, оказалось недостаточно – не последнюю роль в этом сыграло недопонимание сути понятия бизнес-аналитики, которую сводят обычно лишь к отчетности. В настоящей аналитике должны присутствовать методы статистического анализа, моделирования и прогнозирования, а также достойное место отведено технологиям поддержки принятия решений. Реальную аналитику никогда не заменят даже самые мощные средства обработки огромных объемов данных и системы их визуализации – в каждом конкретном случае аналитика будет штучным изделием.

Рис. 1. Три уровня принятия решений

Рис. 2. Соотношение между компонентами DSS и BI

BI на фоне SOA
Бизнес-аналитика нового поколения вместе с рядом других технологий по своей глубинной сути является не чем иным, как шагами по направлению к еще большему сближению средств автоматизации бизнеса с системами управления технологическими процессами.

Первые пять лет «большой компании»
Вначале был Altair 8800 – без этого простейшего компьютера история Microsoft могла бы сложиться совершенно иначе или вовсе не сложиться.

Шесть веков истории логических машинЗа последние шесть веков было создано несколько конструкций логических машин, и все они оказались тупиковыми ветками, но без них не было бы и основных.

Статистическая машина Эмануэля ГольдбергаВ начале 30-х годов ведущему инженеру немецкой компании Zeiss Ikon удалось построить машину для поиска информации, в которой были реализованы предпосылки к созданию гипертекста.