.

Предприятия научились работать со структурированными данными — реляционные СУБД стали стандартным инструментом — но еще не всегда четко представляют, как управлять неструктурированными информационными активами, чтобы они не накапливались мертвым грузом, а работали на благо бизнеса.

В аналитических отчетах сейчас любят проводить параллель между историей развития СУБД и историей развития систем управления содержанием (content management). Управление структурированными данными прошло путь от тесной интеграции соответствующих функций в конкретные приложения к независимым, но частным решениям и затем к стандартизации реляционной структуры баз данных и консолидации рынка в руках нескольких основных поставщиков, прежде всего — Oracle, IBM и Microsoft. Зачатки управления неструктурированными информационными ресурсами появились спустя десять лет после первых реализаций систем управления структурированными данными, и эта функциональность также проходила фазы полной интеграции с приложениями, а затем постепенного отчуждения и превращения в независимые решения. Проблема современного этапа развития Enterprise Content Management (ECM) сходна с ситуацией на рынке СУБД в преддверии появления первых реализаций реляционной модели. Предлагаемые в изобилии разноплановые системы поддерживают управление разными категориями неструктурированных данных. Отсутствует совместимость между решениями разных поставщиков, а у их заказчиков преобладают несвязанные между собой инструменты управления для разных типов информационных активов (электронный документооборот, управления Web-содержанием, управление изображениями и т.д.). Следующим эволюционным шагом должна стать стандартизация форматов представления неструктурированных данных (XML дает реальные предпосылки для этого) и реализация общих корпоративных платформ управления содержанием вместо разрозненных решений. Видимо, неминуема и консолидация рынка, выделение ключевых поставщиков, системы которых будут обладать максимально полной функциональностью и смогут претендовать на роль единой инфраструктуры управления содержанием.

Впрочем, лидеры уже известны. Продолжая сравнение с СУБД, можно сказать, что Documentum постепенно становится «Oracle» рынка управления содержания, задавая тон глубиной и всеохватностью своей платформы; за ней вплотную движутся FileNet и IBM. Большой интерес представляют также усилия, которые предпринимает Microsoft по продвижению своих решений в этой области. Предложения компании нацелены на рынок малого и среднего бизнеса, который все больше интересуется средствами управления содержанием. Кстати, на интерес к внедрению таких систем со стороны компаний самого разного уровня влияет введение в Соединенных Штатах и в ряде европейских стран государственных регламентов, определяющих нормы хранения корпоративной информации, а также снижение цен на аппаратные системы внешней памяти. Но активное освоение Microsoft рынка ЕСМ может означать и то, что эти системы, которые, возможно, многими до сих пор воспринимаются как решения «для избранных», постепенно станут столь же распространенным, если не обязательным элементом ИТ-инфраструктуры, как текстовый редактор и СУБД.

WCM как часть ЕСМ

Международная ассоциация AIIM International, которая занимается проблемами управления документами, содержанием и бизнес-процессами, определяет ЕСМ как «совокупность технологий, средств и методов, которые используются для сбора, управления, безопасного хранения и предоставления пользователям содержания, имеющего отношение к различным процессам в организации» [1]. Под содержанием (content) подразумеваются как традиционные электронные текстовые документы, так и множество других типов неструктурированных данных, включая графику, картинки, метаданные, мультимедиа, таблицы стилей, сводки новостей и т.д. С середины 90-х, когда Internet-технологии стали активно эксплуатироваться компаниями в достижении своих бизнес-целей, сформировалось отдельное направление управления Web-содержанием (Web Content Management, WCM). По определению AIIM, «WCM представляет собой совокупность технологий и дисциплин для управления и эксплуатации неструктурированных информационных активов, которые предоставляются пользователям автоматически и в персонализированной форме посредством Web-сайтов» [2]. Как отмечают аналитики Meta Group [3], у большинства компаний за последние два года проявилась потребность в рационализации своего информационного хозяйства, на котором базируются внешние Web-сайты и ресурсы корпоративных сетей, и которое подчас находится в состоянии хаоса. И это стало важным движущим фактором развития рынка WCM-систем. Один из представителей этого рынка — Microsoft Content Management Server.

Системы управления Web-содержанием фокусируются на задачах создания, хранения, контроля и публикации страниц HTML и ASP, изображений, XML-файлов, текстовых документов и мультимедиа. WCM в целом можно представить как процесс, включающий в себя четыре последовательных этапа (рис. 1):

  • создание - процесс получения или автоматической генерации содержания;
  • хранение и организация - процессы сохранения, организации доступа, обновления, сопоставления и объединения Web-содержания из различных источников;
  • доставка и персонализация - процесс оптимизации содержания в соответствии с контекстом, размещением, прикладными задачами, языком и текущими требованиями его потенциального получателя.
  • администрирование и конфигурирование - управляющие процессы для обеспечения доступности, безопасности и масштабируемости системы WCM.

Рис. 1. Процессы управления Web-содержанием

На этапе создания система WCM должна организовать безопасную среду, в которой операции формирования и управления Web-содержания не потребуют специальных знаний и сложного инструментария. На ранних этапах активного освоения Сети создание сайтов было привилегией только избранных Web-мастеров, которые получали от пользователей необходимое содержание, переформатировали его и включали в шаблоны Web-страниц. Ключевой возможностью современных систем WCM является полная автоматизация этого процесса, которая делает пользователей полноценными участниками создания, а не просто потребителями Web-страниц. На этапе создания система WCM получает на входе произвольный электронный файл, содержимое которого должно быть представлено на Web-странице, а на выходе полностью определяет содержание этой страницы, ее структуру и метаданные. Ключевые стандарты, на которые опирается реализация первого этапа процесса управления Web-содержанием, включают язык HTML для описания Web-страниц, XML для определения структуры страницы и XSLT, позволяющий определить стиль Web-страницы.

Среди пользователей системы WCM могут быть как неспециалисты, которым требуется возможность обновления текстовых документов на страницах корпоративных сайтов, так и профессиональные разработчики Web-сайтов, а также различные приложения. Для непрофессионалов развитая система WCM предоставляет среду, в которой параметры размещения информации на странице, средства для обеспечения безопасности, контроля прав доступа и тестирования полностью скрыты, благодаря чему пользователь получает возможность вносить изменения в содержание Web-страницы с помощью простых, интуитивно понятных операций. Квалифицированным Web-дизайнерам предоставляются более сложные средства редактирования, позволяющие обрабатывать различные форматы файлов, интегрировать различные типы данных и т.д. Однако создавать Web-содержание могут не только люди, но и приложения, поэтому система WCM должна включать в себя возможности размещения информации на сайтах для прикладных бизнес-решений, а также специализированных систем по распределению аудио- и видеоинформации и профессионального мультимедиа.

Что касается хранения Web-содержания, то преимуществом современных средств WCM является возможность организации единого виртуального репозитория, даже если на самом деле он является распределенным по различным сетям, архивам и другим источникам. Функциональность хранения и организации в WСМ позволяет задать параметры защиты, доступности и возможностей использования для любых типов неструктурированных данных с помощью метаданных, средств классификации, категоризации и поиска. Процессы этой фазы управления Web-содержанием отвечают за определение атрибутов или метаданных для контроля за всеми этапами жизненного цикла содержания и извлекают информацию из обычных файловых систем, репозиториев сложных систем управления документами наподобие Documentum или FileNet, бизнес-приложений, внешних источников в Сети и т.д. На стадии организации содержания различные исходные файлы объединяются для создания Web-страницы. Ссылки на внешнее содержание вставляются в процессе создания страницы. Создание и встраивание ссылок может быть реализовано в редакторе, который используется на этапе создания Web-страниц, и содержание из внешних источников часто помещается в кэш Web-страницы для ускорения процесса доставки.

На этапе доставки и персонализации содержания ключевым процессом для современных систем WСМ является возможность в динамическом режиме создавать страницы, содержание которых ориентировано на потребности определенных лиц или групп. Для этого необходима дополнительная база данных для хранения информации о пользователях. Система WСМ устанавливает правила применения пользовательских профилей при предоставлении им персонализированного содержания. Персонализация может базироваться и на выделении общих принципов поведения некоторого сообщества взаимодействующих между собой пользователей. Дополнительным инструментом анализа потребностей пользователей может быть средство добычи данных.

Последним этапом управления Web-содержанием являются процессы администрирования и конфигурирования Web-сайтов. Как правило, управление содержанием для корпоративных систем, ориентированных на поддержку совместной работы сотрудников, сопряжено с достаточно рутинными и в то же время требовательными к вопросам безопасности процессами администрирования. В WCM управление ориентировано на Web-сайты и реализует различные модели электронного взаимодействия компании со своими клиентами и партнерами. Администрирование и конфигурирование Web-содержания должно поддерживать возможности быстрого восстановления при сбоях работы сайта, кэширование для обеспечения бесперебойной работы в моменты пиковой нагрузки, поддержку многоязыковой среды, интеграцию с центрами обработки вызовов и системами типа help desk, интеграцию с транзакционными системами партнеров компании для осуществления финансовых операций и т.д.

Управление содержанием в исполнении Microsoft

Централизованный подход к созданию, организации и публикации корпоративного Web-содержания реализован в системе Microsoft Content Management Server (CMS) 2002. Сервер, реализованный на платформе .NET, использует все возможности этой архитектуры и предоставляет системным администраторам и разработчикам средства построения Web-сайтов с использованием технологий ASP.NET и Web-сервисов. CMS позволяет включить управление Web-содержанием в среду совместной работы путем интеграции с инструментарием Visual Studio .NET и серверами Microsoft Commerce Server и SharePoint Portal Server. Бизнес-пользователи, не имеющие квалификации в Web-дизайне и разработке, могут использовать CMS для создания и публикации Web-содержания с помощью браузера или непосредственно из Word.

CMS хранит содержание в виде объектов, а сборка Web-страниц производится по запросу из специального кэша. Благодаря этому определенное содержание может неоднократно использоваться для разных целей без специального программирования и дублирования. Одно и то же содержание может разделяться между несколькими Web-страницами на сайте. Построенный с помощью CMS сайт имеет древовидную структуру (рис. 2) и включает следующие типы объектов:

Рис. 2. Структура Web-сайта в CMS
  • шаблон (template) - исходный файл в форматах ASPX, ASP или ASCX, который создается для описания общего вида некоторого множества страниц сайта и содержит исполняемый код;
  • контейнер (container) - виртуальные хранилища для организации Web-страниц и содержания (в CMS предусмотрены контейнеры трех типов);
  • канал (channel) - контейнер для хранения структуры страниц Web-сайта;
  • галерея шаблонов (template gallery) - контейнер для управления доступом к шаблонам;
  • галерея ресурсов (resource gallery) - контейнер для хранения графики, аудио и видеофайлов.

Архитектура CMS (рис. 3) включает две основные категории компонентов: средства разработки сайта и средства создания содержания.

Рис. 3. Компоненты CMS

Средства разработки сайта

Инструменты разработки сайта в CMS предназначены для формирования структуры, построения и поддержки работающего Web-сайта. Ядром является Content Server, который динамически создает Web-страницы из объектов содержания и шаблонов. Он включает в себя интерфейсы Internet Server API и Publishing API, которые обеспечивают программируемый доступ к объектам MCMS и предназначены для построения динамических, настроенных на задачи определенных пользователей Web-сайтов и их интеграции с другими приложениями. Для отображения содержания на Web-странице используются компоненты Placeholder Controls (placeholder — текстовый или графический элемент электронного шаблона страницы, заменяемый реальным элементом), которые также могут использовать Publishing API для доступа к определенным версиям содержания. Различные Placeholder Controls отвечают за вывод различных типов содержания — текстов, графики и вложений.

Информацию о структуре и содержимом Web-сайта Content Server получает из централизованного репозитория для хранения содержания Content Repository, построенного на базе Microsoft SQL Server. Разделение хранения объектов содержания, кодов и элементов дизайна сайта упрощает использование содержания в динамическом режиме, например, при решении задач персонализации.

Компонент Site Manager автоматизирует выполнение административных задач по созданию и поддержке Web-сайта, предоставляя средства для организации контейнеров всех типов, определения ролей пользователей и контроля прав доступа. Использование в составе CMS клиента Visual Studio .NET позволяет создавать шаблоны Web-сайтов в этой среде разработки.

Средства создания содержания

Компонент Web Author — основной инструмент создания, редактирования и публикации содержания. Все операции осуществляются через браузер и не требуют специального клиентского программного обеспечения. Web Author дает возможность множеству пользователей одновременно работать над различными элементами одного и того же Web-сайта и оперативно размещать на нем свежую информацию. Консоль Web Author предоставляет пользователям меню средств создания и редактирования содержания, которое может быть соответствующим образом настроено разработчиками шаблонов с помощью Visual Studio .NET.

Дальнейшее упрощение задач создания и публикации содержания обеспечивает компонент Authoring Connector, который автоматизирует процессы утверждения и публикации на Web-сайте документов Word. Любой пользователь, неискушенный в вопросах дизайна и публикации в Web, может создать документ в обычном текстовом редакторе и затем, обратившись к Authoring Connector, отправить его на сайт, сопроводив, при необходимости, дополнительной информацией, например, об ограничениях периода публикации. Никаких других знаний о функциях CMS ему не потребуется. Таким образом, Authoring Connector обеспечивает создание содержания непосредственно в среде Word, причем не только простых текстовых документов, но и более сложных, включающих такие встроенные объекты, как изображения, видеофайлы и таблицы Excel.

Различные компоненты CMS предназначены для поддержки функций четырех основных категорий ролей пользователей этого сервера.

  • Разработчик сайта отвечает за построение инфраструктуры, на базе которой будет развернут Web-сайт, реализует шаблоны для Web-страниц, организационную структуру шаблонов и схему навигации сайта. Эта роль - основной "пользователь" клиента Visual Studio .NET в составе CMS.
  • Системный администратор отвечает за контроль параметров безопасности сайта, включая средства аутентификации, а также за развертывание работающего сайта. Для автоматизации задач этой роли предназначен компонент Site Manager.
  • Менеджер сайта реализует структуру сайта и также использует возможности Site Manager.
  • Автор сайта создает, редактирует и публикует содержание, являясь основным пользователем компонентов Web Author и Authoring Connector.

Кирпичик на фундаменте .NET

Многими своими возможностями CMS обязан интеграции с платформой .NET. На основе .NET Framework поддерживается управление XML-содержанием, обеспечивающее интероперабельность, необходимую для включения в Web-сайты информации из унаследованных систем, бизнес-приложений и систем от партнеров. Специальный тип объекта в CMS позволяет создавать и хранить XML-содержание, а также применять таблицы стилей формата XSLT для вывода содержания и XML Schema Definition для реализации правил проверки данных. Сервер также включает интерфейсы для импорта и экспорта XML-содержания, и может взаимодействовать с использующим XML сервером MS BizTalk Server для интеграции данных из унаследованных систем.

Интеграция с .NET Framework и ASP.NET обеспечивает и такую важную для управления Web-содержанием возможность, как поддержка Web-служб, потенциально открывающую путь к интеграции сайтов и содержания, созданных и управляемых с помощью CMS, с разнообразными приложениями, независимо от платформы и языка их разработки. Для сервера управления содержанием от Microsoft, который по природе своей замкнут на инфраструктуру этой компании, подобные возможности имеют очень большое значение.

Тесная интеграция CMS и Visual Studio .NET формирует единую, динамическую среду разработки Web-сайта, которая обеспечивает доступ к объектной модели CMS, средствам создания и управления шаблонами сервера управления содержанием и одновременно ко всем возможностям по поддержке цикла разработки в Visual Studio .NET, например, средствам отладки кода.

CMS взаимодействует с другими серверами на платформе .NET, обеспечивая формирование единой среды совместной работы для их пользователей. Управление Web-содержанием, например, может стать важным элементом портальных технологий, и не только потому, что позволяет сделать портал информационно насыщенным, но и потому, что дает бизнес-пользователям реальные инструменты для контроля за своими данными, освобождая тем самым администраторов от утомительной работы по ежедневной публикации содержания на портале. Интеграция CMS с SharePoint Portal Server автоматизирует доступ пользователей портала, построенного на базе этого сервера, к содержанию из репозитория CMS и позволяет создавать сайты с интегрированными портальными сервисами — поиском, управлением документами и функциями работы с накопленными знаниями. CMS может служить для пользователей портала не только в качестве централизованного хранилища содержания и инструмента для его создания и публикации. Портал, интегрированный с CMS, получает механизм управления потоками работ, который отвечает за утверждение содержания перед его публикацией на сайте и реализован на ролевой основе.

В CMS реализован также специальный компонент Content Connector для сервера Commerce Server, поддерживающего реализацию систем электронной коммерции. Эта интеграция обеспечивает создание Web-содержания для таких систем, построение Web-сайтов с интегрированной функциональностью электронной коммерции, персонализацию сайтов с помощью выделения содержания для определенных групп пользователей на выбранных страницах, реализацию средств анализа сайтов и т.д.

Среди других возможностей CMS надо отметить средства планирования содержания, которые автоматизируют процесс составления расписания для публикации и архивирования, гарантируя своевременность публикации. Персонализация предоставления содержания поддерживается путем динамической сборки страниц на базе пользовательских профилей и аналитической информации.

Обеспечивая разнообразие возможностей по централизованному управлению Web-содержанием, сервер CMS, однако, не является полнофункциональной системой ЕСМ. Как подчеркивают аналитики Patricia Seybold Group [4], Microsoft пока предлагает только один из строительных блоков для инфраструктуры на платформе .NET, который обеспечивает функциональность WCM и не более. Правда, дополнительные преимущества дает интеграция между разными серверными решениями Microsoft и со средой разработки Visual Studio .NET. Это позволяет получить нужную конфигурацию системы для создания, представления и управления жизненным циклом документов и других типов неструктурированной информации в Web, будь то сервер электронной коммерции, внешний информационный корпоративный портал или портал, нацеленный на поддержку совместной работы. И все это, естественно, в рамках среды, ориентированной исключительно на продукты Microsoft. Хотя на обеспечение гетерогенности направлены включенные в CMS средства поддержки XML и Web-сервисов, однако сильная зависимость от .NET не позволяет предположить, что CMS найдет широкое применение на других платформах.

В настоящее время в Microsoft ведутся работы над новой серверной архитектурой Jupiter, которая должна обеспечить полную интеграцию средств управления Web-контентом с управлением бизнес-процессами и электронными коммуникациями. Однако первоначальные планы по выпуску этого сервера сильно скорректированы и более четкие очертания эти инициативы получат не раньше, чем в конце 2005 года. По прогнозам, до выхода Jupiter от Microsoft не стоит ожидать каких-либо серьезных усовершенствований в области возможностей управления содержанием, хотя компания продолжит развивать свои продукты в рамках общей стратегии развития платформы .NET.

ЕСМ в операционной системе

Помимо отдельного сервера для централизации процессов создания, хранения и публикации Web-содержания Microsoft предоставляет возможности создания Web-сайтов для разделения информации и совместной работы с документами, интегрированные непосредственно в инфраструктуру Windows Server 2003. Сервисы Windows SharePoint Services (WSS) расширяют функциональность MS Office System средствами совместной работы пользователей над документами, задачами и проектами. Таким образом, традиционный инструмент автоматизации индивидуальной офисной деятельности становится инструментом для повышения продуктивности рабочих групп. WSS реализует необходимые атрибуты системы управления документами, включая механизмы блокировки и контроль версий, а также различные средства для организации коммуникаций между пользователями. Кроме того, WSS позиционируется как платформа для разработки дополнительных возможностей и специальных приложений по управлению и совместному использованию документов. Не так давно Microsoft реализовала в CMS специальный коннектор для SharePoint, который упрощает публикацию документов с сайтов рабочих групп на Web-сайтах под управлением CMS и наоборот.

WSS также не является полномасштабной ЕСМ-системой и возможности этих сервисов ограничены базовой функциональностью управления документами в рамках рабочей группы, но примечательно, что WSS, по существу, являются составной частью операционной системы и тесно интегрированы с офисными приложениями от Microsoft, что расширяет круг потенциальных пользователей функций ЕСМ, пусть и достаточно ограниченных. Продвижение WSS в совокупности с другими серверами, обеспечивающими различные аспекты управления содержанием и совместной работы, такими как CMS, SharePoint Portal Server, Commerce Server, будет способствовать не только укреплению позиций Microsoft на рынке ЕСМ, но и активному привлечению к использованию возможностей ЕСМ предприятий малого и среднего бизнеса.

Литература
  1. Planning for an Enterprise Content Management System. AIIM International, 2004.
  2. Document and Web Content Management. AIIM International, 2003.
  3. Content Infrastructure. Meta Group, January 2004.
  4. Geoffrey Bock. Understanding the Strategies of Major Enterprise Content Management Suppliers. Patricia Seybold Group, November 2003.

Продукты Microsoft для управления содержанием и совместной работы

SharePoint Portal Server 2003. Сервер для построения порталов различного назначения. Интегрирует информацию из различных систем по принципу единого входа, реализует функции развертывания и управления порталом, обеспечивает сбор и организацию данных для совместной работы и инструменты поиска, поддерживает возможности персонализации содержания, в том числе с учетом роли пользователя в организации и его персональных интересов, членства в той или иной рабочей группе, параметров безопасности и по другим критериям. SharePoint Portal Server интегрирован с CMS, BizTalk Server и WSS.

Content Management Server 2002. Сервер управления Web-содержанием. Интегрирован с серверами: SharePoint Portal Server для реализации поиска и средств управления потоком работ; BizTalk Server для агрегирования содержания; Commerce Server для персонализации и аналитики.

Commerce Server 2002. Сервер для построения решений электронной коммерции. Предоставляет платформу для разработки сайтов, средства обратной связи и аналитики. Интегрирован с серверами CMS для управления Web- содержанием и BizTalk Server для корпоративной интеграции.

BizTalk Server. Сервер интеграции приложений предприятия (enterprise application integration, EAI) и управления бизнес-процессами, поддерживающий взаимодействие внутри организации и с внешними партнерами. Интегрирован с серверами CMS для управления Web-содержанием и Commerce Server для сквозной обработки транзакций.

Windows SharePoint Services. Средства на базе Web для управления документами и организации совместной работы в рабочей группе.

SQL Server. Сервер управления базами данных и анализа данных, используется всеми решениями по управлению содержанием и организации совместной работы в качестве базового хранилища информации.