XML превращает набор документовв базу данных

XML придает технологии SGML, используемой в корпорации

Boeing для составления документации на свои лайнеры,

дополнительную строгость и точность

Безусловно, глава Sun Microsystems Скотт Макнили прав: сеть очень похожа на большой компьютер. Если продолжить аналогию, то роль операционной системы для этого компьютера выполняет World Wide Web. А языком общения должна стать технология Extensible Markup Language (XML). Данная технология представляет собой нечто большее, чем просто способ представления Web-страниц, ведь с помощью XML набор документов превращается в базу данных.

Технология XML представляет собой нечто большее, чем просто способ представления Web-страниц, ведь с помощью XML набор документов превращается в базу данных. Содержимое документа XML располагается между стандартными тегами; столь строгая структура кода позволяет всем приложениям без труда выбирать и использовать в своих целях это содержимое. Каждый документ XML становится хранилищем данных, к которому можно обращаться с запросами подобно тому, как можно было бы обратиться к любой БД. К сожалению, правила, регламентирующие порядок упаковки данных, на Web-страницах и методы обработки этих данных до сих пор не определены и не систематизированы. Результат? Internet сегодня представляет собой беспорядочную и причудливую смесь технологий HTML, JavaScript и Java на клиентских системах и крайне широкий набор компилируемых языков и языков сценариев на стороне сервера.

XML позволяет разобраться в этих нагромождениях и, упорядочив хаос, организовать его в единую унифицированную сеть. Данные, которые ранее были бессистемно разбросаны по страницам HTML, теперь размещаются на строго структурированных документах XML. Браузеры пятого поколения, выпущенные компаниями Netscape Communications и Microsoft, поддерживают спецификации XML и способны обрабатывать информацию гораздо эффективнее по сравнению со своими предшественниками, которые манипулировали лишь конструкциями HTML.

Приятнее всего то, что эти данные правильно интерпретируются не только браузерами, но и другими XML-совместимыми приложениями. Новое поколение служб электронного обмена данными (EDI) способно связать при помощи средств XML различные бизнес-процедуры, определить соответствующие API-интерфейсы и форматы сообщений.

Чтобы подчеркнуть мощь еще довольно юной технологии XML, ее часто называют «HTML на стероидах». Некоторым же она представляется упрощенной версией доброго старого стандартного языка обобщенной разметки SGML, который, собственно, и положил начало HTML. И хотя и в том и в другом утверждении есть доля истины, XML нельзя считать обычным представителем когорты языков гипертекстовой разметки. Данная технология быстро превращается в основную движущую силу развития объектно-ориентированной Паутины.

Строгая дисциплина управления наборами документов лежит в основе большинства операций, требующих особой точности.

К примеру, в Boeing документация на реактивный лайнер 777 считается такой же важной составной частью будущего самолета, как и любой другой его компонент. Для определения структуры документальной базы данных в корпорации используют средства языка SGML и спецификации определений типов документов Document Type Definitions (DTD). Составление руководств средствами SGML на первый взгляд кажется непростой задачей, но зато документацию легко проанализировать, а впоследствии ее без особого труда можно преобразовать в другую, более удобную форму.

Хотя язык HTML создан на основе спецификаций SGML DTD, браузеры никогда не отличались их однозначной интерпретацией. Впрочем, на начальном этапе развития Internet эту неопределенность можно было считать достоинством. Web-страницы не ограничивали полета творческой фантазии, и любой пользователь мог погрузиться в игру с Web. Но сейчас, когда HTML получил статус официального языка Сети, подобные вольности уже недопустимы.

XML придает технологии SGML дополнительную строгость и точность, не ограничивая возможность манипулирования огромным количеством HTML-страниц, накопленных в Internet к сегодняшнему дню. Этого удалось добиться за счет упрощения правил определения DTD. Таким образом, чтобы добиться совместимости миллиардов уже размещенных в Internet страниц HTML со спецификациями XML, достаточно приложить минимум усилий.

Возьмем, например, типичный фрагмент HTML:

Эквивалентная конструкция на языке XML будет выглядеть так:

Не правда ли, разница невелика? Внесение небольших изменений превращает конструкции HTML в код XML. Заключение атрибута /img/fig1.jpg, представляющего собой ссылку на графический файл fig1.jpg, в кавычки и добавление в конце косой черты позволяет избежать двусмысленности при автоматическом синтаксическом анализе операторов XML. Страницу XML (так же, как и весь документ) можно считать базой данных, поскольку каждое идентифицируемое в процессе синтаксического анализа поле содержит специфическую информацию, которая распознается, обрабатывается и преобразуется в нужный вид другими приложениями.

Internet Explorer 5.0 способен преобразовать страницу XML в объект, который можно непосредственно обрабатывать средствами таблиц стилей Extensible Stylesheet Language (XSL). Допускается также косвенная обработка за счет извлечения нужных фрагментов страницы при помощи сценариев Microsoft VBScript или ECMAscript и последующего встраивания их в модель Document Object Model браузера. Браузер Netscape версии 5.0 обладает аналогичными возможностями.

Однако браузер решает лишь часть задач. Web-узлы обслуживают массу других бизнес-процедур: с их помощью отслеживается доставка экспресс-отправлений, закупаются товары для офиса, проводятся операции с ценными бумагами. Появляются все новые и новые задачи; некоторые из них выполняются без всякого вмешательства человека.

Со временем XML найдет себе применение при определении служебных API-интерфейсов, предназначенных для интеграции информационных систем деловых партнеров.

В качестве примера рассмотрим Web-узел английской компании Harvey Bowring Online, специализирующейся на страховании кредитов. Подключившись к узлу, клиент может выбрать одну из 17 млн. перечисленных на нем компаний и застраховать свою сделку на случай, если данная компания окажется неплатежеспособной или не выполнит своих обязательств.

В Harvey Bowring используют инструментарий GlobalAccess, разработанный компанией Dun & Bradstreet Software (D&B). Запрос в формате XML посылается на узел самой D&B. В ответ система выдает данные, также представленные в формате XML. Полученная информация обрабатывается программой-анализатором рисков, после чего клиентам рассылаются автоматически рассчитанные цифры страховых сумм. Сервер B2B Integration Server компании WebMethod пересылает запросы XML в основное хранилище данных, размещенное на мэйнфрейме D&B, при помощи интерфейса D&B Global Data Authority.


Только факты

Плюсы XML

На Web-узле английской компании Harvey Bowring Online, специализирующейся на страховании кредитов, используют инструментарий GlobalAccess, разработанный компанией D&B. На каждом этапе работы узла как данные, так и протоколы запросов и ответов представляются в терминах XML. Это означает следующее. Система может работать где угодно. В технологии электронного обмена данными (EDI) для D&B нет ничего нового. Компания применяет ее уже в течение многих лет. Однако как D&B, так и ее клиенты не могут и, вероятно, не смогут получить глобальный доступ к сетям EDI.

Для обращения к данным применяется протокол HTTP. Поэтому никаких осложнений с межсетевыми экранами в этом случае не возникает.

Для доступа к данным браузер и приложения используют одни и те же унифицированные технологии. Гарантией совместимости является управление протоколами средствами XML DTD.

Интероперабельность. Несмотря на то что система объединяет сервер WebMethods на узле D&B и набор инструментов D&B на узле Bowring, все ее составные части могут взаимодействовать и с другими средствами, поддерживающими XML.

Для развития объектно-ориентированной WWW предполагалось использовать технологии DCOM, CORBA и Internet Inter-ORB Protocol. Однако им не удалось справиться с тем, что оказалось по силам XML — с его помощью XML можно не только проектировать Web-страницы, но и решать гораздо более сложные задачи.


Применения XML

Channel Definition Format (CDF), http://www.microsoft.com/ workshop/ delivery/channel/ reference/channels.asp. Формат CDF представляет собой словарь XML, предназначенный для определения каналов принудительного распространения информации Internet Explorer Active Channels и PointCast. Financial Information

Exchange Markup Language (FIXML), http://www.fixprotocol.org/cgi-bin/rbox/viewdoc.cgi ?doc=2/ workgroups/standards/ download/wpaper.html. Спецификации языка разметки Financial Information Exchange (FIX) определяют протокол безопасного обмена транзакциями в режиме реального времени. Управление этим процессом осуществляется совместными усилиями непосредственных участников сделки и брокерской конторы. В настоящее время разработчики FIX занимаются написанием приложений, позволяющих проверить структуру сообщений FIX. Стандарт FIXML должен унифицировать процесс обмена сообщениями FIX и обеспечить непроцедурную (на основе технологии DTD) проверку целостности данных сообщений. Первые приложения FIXML были представлены компанией Innovision в феврале.

Resource Description Framework (RDF), http://www.w3.org/ TR/PR-rdf-syntax/. RDF — это метаязык, написанный на XML. RDF определяет ресурсы (узлы, страницы и элементы страниц) и позволяет выразить сложные отношения между ними. Формат RDF применяется, например, в Yahoo-подобном каталоге Netscape OpenDirectory Project (http://directory. netscape.com/).

Open Financial Exchange (OFX), http://www.ofx.net. OFX — это протокол запросов/ответов, предназначенный для выполнения финансовых транзакций и для формирования пакетов финансовой информации, пересылаемой электронным путем. Варианты клиентских программ включают в себя продукты Microsoft Money и Intuit Quicken. Серверная часть может быть реализована, например, средствами Canopy Server компании Canopy Software и Interpose OFX компании Intelidata Technologies.

Web Distributed Data Exchange (WDDX), http://www.wddx.org/. WDDX — одна из нескольких технологий вызова удаленных процедур, созданная на базе XML. Технология WDDX была разработана компанией Allaire и утверждена в качестве открытого стандарта, определяющего нейтральный формат программных переменных, которые могут передаваться между приложениями, написанными на языках JavaScript, Java, Perl, Cold Fusion или на любом языке, совместимом с компонентной объектной моделью Component Object Model.

Open Software Distribution (OSD), http://www.w3.org/tr/note-osd.html, http://www.microsoft.com/workshop/management/osd/osdfaq.asp. Технология OSD представляет собой словарь, предназначенный для описания дистрибутивов программного обеспечения и для определения отношений и зависимостей между их отдельными частями. Для распространения программ на базе OSD можно использовать следующие средства: Marimba Castanet, Microsoft Internet Explorer, Novell ZENworks и ActiveState Tool Win32 Perl.

Web Interface Definition Language (WIDL), http://www.webmethods.com/. Язык WIDL представляет собой словарь XML, описывающий службы на базе Web-серверов, а также структурированные данные. Программное обеспечение B2B Integration Server компании WebMethod использует WIDL для формализации API-интерфейсов, неявно поддерживаемых Web-узлами.