М.С. Каменнова

фирма "Метатехнология", Тел.: 253-38-22


1. Введение
2. Структура корпоративной информационной системы
3. Заключение

1. Введение

Перефразируя знаменитого классика, можно сказать, что с точки зрения системного аналитика все организации весьма похожи друг на друга. В структуру каждой из них, независимо от рода деятельности, входят многочисленные подразделения, непосредственно осуществляющие тот или иной вид деятельности компании, а также дирекция, бухгалтерия, канцелярия и т.д. Подразделения компании пронизаны вертикальными и горизонтальными связями, они обмениваются между собой информацией, а также выполняют отдельные части одной "большой работы". При этом некоторые из подразделений, например, дирекция, финансовые и снабженческие службы взаимодействуют с внешними партнерами (банк, налоговая инспекция, поставщики и т.д.), а также филиалами самой компании (рис.1).

Picture 1

Рисунок 1.

Таким образом, любая организация - это совокупность взаимодействующих элементов (подразделений), каждый из которых может иметь свою структуру. Элементы связаны между собой функционально, т.е. они выполняют отдельные виды работ в рамках единого бизнес-процесса, а также информационно, обмениваясь документами, факсами, письменными и устными распоряжениями и т.д. Кроме того, эти элементы взаимодействуют с внешними системами, причем их взаимодействие также может быть как информационным, так и функциональным. И эта ситуация справедлива практически для всех организаций, каким бы видом деятельности они не занимались - для правительственного учреждения, банка, промышленного предприятия, коммерческой фирмы и т.д.

Такой общий взгляд на организацию позволяет сформулировать некоторые общие принципы построения корпоративных информационных систем, т.е. информационных систем в масштабе всей организации, что и попытается сделать автор статьи, не претендуя, однако, на 100%-ую полноту. Обсуждаемые подходы и представление о том, какой должна быть корпоративная информационная система крупной организации, прошли тщательную экспертизу и проверку практикой в проектах, выполненных автором и коллегами за последние несколько лет.

2. Структура корпоративной информационной системы

Как же подойти к созданию корпоративной информационной системы и на какие вопросы необходимо ответить? Разрабатывать ли все приложения самим или попробовать собрать вместе уже готовые программные решения и что в этом аспекте предлагает Российский рынок?

Попытаемся ответить на поставленные вопросы, выделив основные этапы процесса создания корпоративной информационной системы:

I. Прежде всего необходимо провести информационное обследование организации.

II. По результатам обследования выбрать архитектуру системы и аппаратно-программные средства ее реализации.

По результатам обследования выбрать и/или разработать ключевые компоненты информационной системы (рис.2), коими являются:

III. Система управления корпоративной базой данных

IV. Система автоматизации деловых операций и документооборота

V. Система управления электронными документами

VI. Специальные программные средства

VII. Системы поддержки принятия решений.

Рассмотрим последовательно каждый из перечисленных этапов.

Picture 2

Рисунок 2.

Этап I. Информационное обследование

Информационная система нужна организации для того, чтобы обеспечивать информационно-коммуникационную поддержку ее основной и вспомогательной деятельности. Поэтому прежде, чем вести речь о структуре и функциональном наполнении информационной системы, необходимо разобраться в целях и задачах самой организации, чтобы понять, что же нужно автоматизировать.

Какова миссия компании, т.е. для чего компания создана, и к чему она стремится в своей деятельности? Каковы направления ее деятельности? Какова структура компании, какие функции выполняют ее подразделения и как они взаимодействуют между собой ? Только ответив на все эти вопросы можно переходить к обсуждению того, какие функции должна выполнять корпоративная информационная система, какие аппаратные и программные средства должны быть включены в нее, чтобы автоматизировать функции, выполняемые подразделениями компании и т.д.

Ответы на поставленные вопросы можно получить только после детального информационного обследования компании, целями которого являются:

  • формулировка и описание функций каждого подразделения компании, а также решаемые ими задачи;
  • описание технологии работы "как есть" каждого из подразделений компании и понимание, что необходимо автоматизировать и в какой последовательности;
  • исходя из миссии и направлений деятельности компании, описание технологии работы "как надо" каждого из подразделений и связанных с ними информационных потоков;
  • отображение технологии "как надо" на структуру компании, определение ее функционального состава и количества рабочих мест в каждом структурном подразделении компании, а также описание функций, которые выполняются (автоматизируются) на каждом рабочем месте;
  • описание основных путей и алгоритмы прохождения входящих, внутренних и исходящих документов, а также технологии их обработки.

Результатом обследования являются модели деятельности компании и ее информационной инфраструктуры, на базе которых разрабатываются проект корпоративной информационной системы, требования к программно-аппаратным средствам и спецификации на разработку прикладного программного обеспечения, если в этом есть необходимость.

В идеальной ситуации обследование должны проводить профессиональные аналитики совместно с представителями обследуемой компании. Это позволяет сократить время обследования, не потеряв качества, и научить представителей компании-клиента, что и как необходимо делать в процессе обследования, с тем, чтобы в дальнейшем они смогли бы выполнять эту работу самостоятельно.

Важно правильно выбрать инструментальные программные средства для проведения обследования. Они должны базироваться на методологиях, которые позволяют строить модели деятельности компании, а также формально описывать информационное пространство, в котором работает компания. На Российском рынке эти средства представлены, и среди них необходимо отметить Design/IDEF (MetaSoft), S-Designor (Powersoft Corp.), PB Win и ER Win (Logic Works), Designer/2000 (Oracle Corp).

Модели работы компании, построенные в процессе обследования, позволяют не только спроектировать информационную систему, но и провести анализ деятельности с организационной и структурной точек зрения.

Процесс обследования может также включать этап оценки эффективности предлагаемых решений. Какой выигрыш даст внедрение новых информационных технологий и связанных с ними технических решений? Как скоро могут окупиться вложенные средства? На этот и подобные вопросы вы сможете ответить, проведя стоимостной анализ и получив соответствующие оценки с помощью специальных методологий и программных средств. На российском рынке эти средства представлены более чем скромно. Основная причина - сложность адаптации западных методик и моделей экономического анализа к Российской действительности. Можно лишь отметить пакет EasyABC, ABC Technologies Inc. и методологию Activity Based Costing (АВС) - анализ стоимости, основанный на функциях. Другие пакеты автору, к сожалению, не известны.

При выборе описываемых средств необходимо обратить внимание на то, чтобы работа с ними была бы доступна не только профессиональным финансистам и экономистам, но и более широкому классу аналитиков, менеджерам среднего и верхнего звена, т.к. именно они вырабатывают решения по рабочим вопросам, связанным с созданием проекта корпоративной информационной системы и ее реализацией.

Этап II. Архитектура

По результатам обследования необходимо выбрать архитектуру системы. Для корпоративных систем мы рекомендуем архитектуру клиент/сервер. Не останавливаясь подробно на технических аспектах, в качестве аргумента приведем данные о тенденциях среди западных компаний: к середине 1994 года на эту архитектуру перешли 45% организаций в США, 50% в Европе, 29% в Японии*). Интересно также отметить причины, по которым этот переход происходит. Из 300 американских компаний, работающих в среде клиент/сервер, на вопрос "Почему вы перешли на эту архитектуру", 67% ответили: "Архитектура клиент/сервер предоставляет технологию доступа конечного пользователя к информации в масштабах предприятия"*). Таким образом, архитектура клиент/сервер позволяет создать единое информационное пространство, в котором конечный пользователь имеет своевременный и беспрепятственный (но санкционированный!) доступ к корпоративной информации.

Информационное обследование позволяет выбрать аппаратно-программную реализацию системы. Не затрагивая аппаратные средства, мы будем далее говорить о том, каким должно быть программное обеспечение в составе корпоративной информационной системы. Касаясь операционной среды для серверной части системы, хотелось бы отметить, что с точки зрения автора статьи, UNIX - это именно та операционная система, на базе которой можно и нужно строить крупномасштабные информационные комплексы. На клиентских местах могут быть как алфавитно-цифровые и/или X-терминалы, так и PC в среде MS Windows.

Этап III. Выбор СУБД

Выбор системы управления для корпоративной базы данных - один из ключевых моментов в разработке информационной системы. На Российском рынке присутствуют практически все СУБД, принадлежащие к элитному классу - Oracle, Informix, Sybase, Ingres. Вопрос, какую СУБД использовать, можно решить только по результатам предварительного обследования и получения информационных моделей деятельности компании.

На рынке также представлен достаточно большой набор средств разработки приложений, которые ориентированы как на конкретные СУБД (например, Developer/2000 для Oracle, NewEra для Informix и т.д.), так и могут быть использованы в различных средах. В качестве примера таких универсальных инструментальных средств можно назвать PowerBuilder Enterprise (PowerSoft Corp.), Gupta SQLWindows (Gupta Corp.), Delphi (Borland Int.), Enterprise Developer (Symantec).

Этап IV. Выбор системы автоматизации документооборота

Неразбериха с документами (их задержки, потери, дублирование, долгое перемещение от одного исполнителя к другому и т.д.) - болезненная проблема для любой компании. Поэтому система автоматизации документооборота, которая позволяет автоматизировать ручные, рутинные операции, автоматически передавать и отслеживать перемещение документов внутри корпорации, контролировать выполнение поручений, связанных с документами и т.д. - одна из важнейших составляющих информационной системы.

Можно выделить два класса подобных систем:

  • системы workflow
  • системы groupware

Основное назначение систем обоих классов - автоматизация и поддержка коллективной работы в офисе, однако, имеются некоторые различия в их идеологической направленности и, следовательно, в наборе реализуемых функций. В таблице 1 сопоставляются основные характеристики систем обоих классов.

Таким образом, системы класса groupware ориентированы на автоматизацию работы небольшого коллектива и поддерживают корректное разделение (т.е. совместное использование) информации группой пользователей. Системы класса workflow ориентированы на автоматизацию работы корпорации и поддерживают разделение работ, т.е. выполнение одной "большой" работы группой исполнителей.

Системы workflow и groupware не конкурируют между собой, а скорее дополняют друг друга. Выбор одной из них, а также использование их в комбинации определяются задачами, решаемыми корпорацией. Если вы заботитесь о повышении эффективности работы каждого отдельного сотрудника в коллективе, предпочтение стоит отдать системам класса groupware. На Российском рынке эти системы представлены программным продуктом Lotus Notes (Lotus Development). Если же вы более серьезно обеспокоены повышением эффективности работы всей организации в целом, то вам следует остановить свой выбор на системах класса workflow. На Российском рынке представлены системы Staffware (Staffware plc) и Action Workflow (Action Technologies).

Основываясь на вышесказанном, мы будем рассматривать в качестве компонента, автоматизирующего документопотоки в корпорации, системы класса workflow.

Какие же функциональные возможности этих систем являются ключевыми и на что необходимо обратить особое внимание при выборе соответствующих программных решений:

  • Обеспечение высокой производительности и возможность масштабирования в рамках корпорации.
  • Открытость, т.е. возможность интеграции с другими компонентами информационной системы - СУБД, системами управления электронными документами, коммуникационными программами и т.д.
  • Гибкость, т.е. способность системы к настройке и перенастройке в зависимости от структуры и технологий обработки документов, принятых в организации.
  • Простота в использовании, изучении и обслуживании.
  • Возможность работы с локализованной версией и на русском языке.

Системы класса GROUPWARE Системы класса WORKFLOW
Множество работающих Множество работающих
*) Это означает, что системы обоих классов призваны автоматизировать коллективную работу
  • Одна выполняемая задача, т.е. поддерживается коллективная работа с одной задачей в данный момент времени (например, с текстовым редактором).
  • Множество выполняемых задач, т.е. поддерживается многопользовательская работа с несколькими задачами одновременно, как в синхронном, так и в асинхронном режимах.
  • Отсутствие структуризации в организации работ, т.е. нет никаких правил и предписаний, кто и как должен работать в рамках системы
  • Строгая структуризация, т.е. выполнение работы четко расписано по ролям, документам, времени обработки документов и т.д.
  • Реализация на РС и ориентация на небольшие коллективы.
  • Реализация в среде клиент/сервер и ориентация на масштаб корпорации.

Таблица 1.

Этап V. Выбор программных средств для управления документами

Появление на рынке систем управления электронными документами - EDMS (Electronic Document Management Systems) вызвано стремлением сократить поток бумажных документов и хотя бы частично уменьшить сложности, возникающие в связи с их хранением, поиском и обработкой, и перенести центр тяжести на работу с электронными документами. В отличие от документов на бумажных носителях электронные документы обеспечивают экстраординарные преимущества при создании, совместном использовании, поиске, распространении и хранении информации. По данным Gartner Group можно прогнозировать удвоение объема электронной текстовой информации каждые три года вплоть до 2000-го года, а в офисах объем информации, доступной в электронной форме, в 1996 году удвоится с 25 до 50%.

Системы EDMS реализуют ввод, хранение и поиск всех типов электронных документов, как текстовых, так и графических. С помощью систем этого класса вы можете организовать хранение в электронном виде административных и финансовых документов, факсов, технической библиотеки, изображений, т.е. всех документов, входящих в организацию и циркулирующих в ней.

На рынке предлагается более 500 систем EDMS. Технологически они различаются по способам индексирования и поиска информации. Основной способ ввода документов в систему - сканирование, хотя информация может поступать с магнитных носителей, через модемы и т.д. В системах EDMS первого поколения графические образы введенных документов идентифицируются с помощью ключевых слов, по которым и происходит поиск необходимой информации. В качестве примеров таких систем можно привести программные продукты SoftSolutions (SoftSolutions), DocuData (LaserData), WorkFLO Business System (FileNet).

В более поздних системах EDMS используется технология оптического распознавания символов (OCR - Optical Character Recognition). После сканирования и ввода документа в систему происходит перевод графического образа документа в текстовый файл, после чего следует достаточно трудоемкий процесс исправления ошибок в тексте, допущенных при распознавании. Необходимая информация ищется с помощью механизма четкого поиска по полному содержанию документа. Примерами систем, использующих описанную технологию, могут служить ZyIMAGE (ZyLAB Division of IDI), Topic (Verity), BRS/Search (Dataware).

Каковы наиболее серьезные ограничения предлагаемых систем:

  • Использование технологии ключевых слов "стоит" от $5 до $20 на документ.
  • Определение ключевых слов - достаточно субъективный процесс, а также ключевые слова со временем теряют свою значимость.
  • При использовании технологии OCR требуется тратить значительные усилия на "очистку" текста после использования средств OCR, т.к. даже самые совершенные средства распознавания не дают 100% точность. Это очень трудоемкий и дорогостоящий процесс, его стоимость составляет от $1 до $10 на страницу.
  • Во всех предлагаемых системах EDMS используется механизм четкого поиска, поэтому если в запросе допущены орфографические ошибки или в тексте документа не исправлены ошибки распознавания, система никогда не найдет нужной информации.
  • Индекс систем с полноконтекстным поиском составляет от 200% до 400% от объема исходных документов, что предъявляет серьезные требования к ресурсам компьютера и существенно увеличивает время поиска при увеличении потока документов.

В начале 90-х годов на рынке систем EDMS появились новые разработки с использованием новейших технологий нейронных сетей и искусственного интеллекта. В системах третьего поколения, созданных на основе этих технологий, реализован нечеткий поиск по полному содержанию документа и очень "компактное" индексирование (всего лишь 30% от объема исходного текста).

Нечеткий поиск означает индифферентность по отношению к ошибкам как во входных данных, так и в формулировках запроса, т.е. он сокращает до минимума влияние ошибок распознавания символов, ошибок набора на клавиатуре при вводе данных, а также ошибок правописания в запросах поиска. С помощью механизма нечеткого поиска вы можете найти то, что ищете, даже если вы не знаете, как это пишется, забыли, как это называется или если это окажется неправильно зарегистрировано. Система всегда выдает пользователю ответ, наилучшим образом согласованный с терминами или фразами запроса, по которому проводится поиск.

На рынке коммерческие системы EDMS третьего поколения представлены программным продуктом Excalibur EFS (Excalibur Technologies Corp.). Пакет Excalibur EFS базируется на технологии адаптивного распознавания образов APRP (Adaptive Pattern Recognition Processing), разработанной компанией Excalibur Technologies и реализованной в пакете с использованием механизма нейронных сетей.

Технология APRP обеспечивает автоматическую индексацию всего содержания документа, что исключает необходимость выбирать ключевые слова вручную и дает возможность проведения нечеткого поиска любого слова в документе. Это означает, что в экстремальной ситуации пользователю системы Excalibur EFS не нужно беспокоиться о том, как вспомнить правильное название документа, точную фразу или правильное написание сложной формулы, чтобы получить именно ту информацию, которая ему нужна в данный момент.

Excalibur EFS предоставляет пользователю и другие режимы поиска и получения информации: нечеткий поиск по именам документов; ассоциативный поиск по всему тексту с установленными пользователем синонимами; прямой доступ по пиктограммам файлов; запросы в стиле обычной базы данных; поиск по ключевым словам в полном тексте, именах и названиях; логический поиск по всему тексту.

СУБД, системы workflow и системы EDMS - это средства управления информационными потоками. Как же они соотносятся друг с другом? В таблице 2 приведены их краткие характеристики.

Назначение Примечание
СУБД Ввод, хранение и поиск структурированной информации в электронной форме Это только 15% всей информации, с которой приходится работать
Системы управления документами Ввод, хранение и поиск неструктурированной информации в электронном виде Это 85% всей информации, которая проходит через организацию, включая бумажные документы, переведенные в электронную форму
Системы workflow Управление, маршрутизация и координация передвижением документов в рамках корпоративной системы; контроль за своевременной обработкой документов Системы могут быть интегрированы как с СУБД, так и системами управления документами

Таблица 2.

Комбинация технологий СУБД, workflow и управления электронными документами и, соответственно, интеграция программных продуктов, реализующих эти технологии, дает полное решение проблемы автоматизации работы с документами любого вида в корпорации любого рода деятельности.

Этап VI. Выбор специализированных прикладных программных средств.

При всей описанной общности каждая компания имеет свою специфику, которая определяется родом ее деятельности. Выбор специализированных программных средств в значительной степени зависит от этой специфики.

Например, для компаний, связанных с добычей нефти, в составе информационной системы важно иметь геоинформационные системы. Для промышленных предприятий - системы автоматизации технологических процессов, а также системы класса CAD/CAM. Для коммерческих служб любой фирмы желательно иметь системы финансового анализа, планирования и прогнозирования, для торговых фирм - системы учета клиентов и т.д. При этом могут быть использованы старые наработки (например, бухгалтерия, система регистрации товара на складе и т.д.), интеграция которых в информационную систему будет не слишком трудоемка. Не исключено, что потребуется разработка отдельных специализированных компонентов и интеграция их в единую систему.

Абсолютно для всех компаний необходимо иметь в составе информационной системы стандартный набор приложений, таких как текстовые редакторы, электронные таблицы, коммуникационные программы и т.д. Одним из критериев выбора подобных систем должна быть возможность их несложной интеграции в корпоративную информационную систему.

Этап VII.

Необходимо отметить специальный класс приложений - систем поддержки принятия решений, позволяющие моделировать правила и стратегии бизнеса и иметь интеллектуальный доступ к неструктурированной информации. Системы подобного класса основаны на технологиях искусственного интеллекта.

Различают два направления в развитии технологий искусственного интеллекта:

  • Технология вывода, основанного на правилах;
  • Технология вывода, основанного на прецедентах.

Практически все ранние экспертные системы моделировали процесс принятия экспертом решения как чисто дедуктивный процесс с использованием вывода, основанного на правилах. Это означало, что в систему закладывалась совокупность правил "если...то...", согласно которым на основании входных данных генерировалось то или иное заключение по интересующей проблеме. Такая модель являлась основой для создания экспертных систем первых поколений, которые были достаточно удобны как для разработчиков, так и для пользователей-экспертов. Однако с течением времени было осознано, что дедуктивная модель эмулирует один из наиболее редких подходов, которому следует эксперт при решении проблемы.

На самом деле, вместо того чтобы решать каждую задачу, исходя из первичных принципов, эксперт часто анализирует ситуацию в целом и вспоминает, какие решения принимались ранее в подобных ситуациях. Затем он либо непосредственно использует эти решения, либо при необходимости, адаптирует их к обстоятельствам, изменившимся для конкретной проблемы.

Моделирование такого подхода к решению проблем, основанного на опыте прошлых ситуаций, привело к появлению технологии вывода, основанного на прецедентах (по-английски: Case-Based Reasoning, или CBR), и в дальнейшем - к созданию программных продуктов, реализующих эту технологию.

Прецедент - это описание проблемы или ситуации в совокупности с подробным указанием действий, предпринимаемых в данной ситуации или для решения данной проблемы. Хотя не все CBR-системы полностью включают этапы, приведенные ниже, подход, основанный на прецедентах, в целом состоит из следующих компонентов:

  • получение подробной информации о текущей проблеме;
  • сопоставление (сравнение) этой информации с деталями прецедентов, хранящихся в базе, для выявления аналогичных случаев;
  • выбор прецедента, наиболее близкого к текущей проблеме, из базы прецедентов;
  • адаптация выбранного решения к текущей проблеме, если это необходимо;
  • проверка корректности каждого вновь полученного решения;
  • занесение детальной информации о новом прецеденте в базу прецедентов.

Таким образом, вывод, основанный на прецедентах, представляет собой метод построения экспертных систем, которые делают заключения относительно данной проблемы или ситуации по результатам поиска аналогий, хранящихся в базе прецедентов.

В ряде ситуаций CBR-метод имеет серьезные преимущества по сравнению с выводом, основанным на правилах, и особенно эффективен, когда:

  • основным источником знаний о задаче является опыт, а не теория,
  • решения не уникальны для конкретной ситуации и могут быть использованы в других случаях;
  • целью является не гарантированное верное решение, а лучшее из возможных.

Обратная связь, возникающая при сохранении решений для новых проблем, означает, что CBR-метод по своей сути является "самообучающейся" технологией, благодаря чему рабочие характеристики каждой базы прецедентов с течением времени и накоплением опыта непрерывно улучшаются. Разработка баз прецедентов по конкретной проблеме или области деятельности происходит на естественном русском языке, т.е. не требует никакого программирования и может быть выполнена наиболее опытными сотрудниками - экспертами, работающими в данной конкретной области.

Не стоит, однако, рассчитывать, что экспертная система будет действительно принимать решения. Принятие решения всегда остается за человеком, а система лишь предлагает несколько возможных вариантов и указывает на самый "разумный" с ее точки зрения.

Реально на рынке предлагается лишь несколько коммерческих продуктов, реализующих технологию вывода, основанного на прецедентах. Это объясняется, в первую очередь, сложностью алгоритмов и их эффективной программной реализации. Наиболее успешные и известные из присутствующих на рынке продуктов - CBR Express и Case Point (Inference Corp.), Apriori (Answer Systems), DP Umbrella (VYCOR Corp.). Некоторые из них представлены и на Российском рынке.

3. Заключение

Современная информационная система в масштабе корпорации - это комбинация, тесное переплетение различных информационных технологий, предлагаемых сегодня на рынке. Искусство создания таких систем - в сбалансированной интеграции этих технологий и соответствующих программных и аппаратных средств. Некоторые подходы к этой интеграции описаны в данной статье.

Необходимо отметить, что построение корпоративных систем - дело не одной недели и даже не одного года. Это, как все уже понимают, не просто покупка компьютеров и, в лучшем случае, связывание их между собой. Это, прежде всего, осмысление своего бизнеса, понимание путей его развития и неизбежный вывод о том, что успех в настоящем и будущем может быть обеспечен только в случае, если удастся правильно организовать управление информацией. Это возможно сделать через корпоративную информационную систему, которая должна стать не только основой информационного пространства компании, но и гибким инструментом управления бизнесом в сложных, постоянно меняющихся условиях.


*) Источник: Application Development Tool, IDC Filing Information, IDC #8528, vol.1, 1994