Network World, США
Главным недостатком XML традиционно считается чрезмерно большой объем кода. К счастью, в данной области уже наметились определенные сдвиги

Главным недостатком XML традиционно считается чрезмерно большой объем кода. Текстовый формат ASCII требует пересылки гораздо большего количества битов по сравнению с информацией, представленной в двоичном виде. И эффективного увеличения скорости потоков XML нельзя добиться без универсальных стандартов, описывающих порядок преобразования информационного наполнения в двоичные форматы. Но, к счастью, в данной области уже наметились определенные сдвиги.

Один из возможных путей решения этой задачи основывается на использовании набора различных отраслевых спецификаций, с помощью которых сообщение SOAP, содержащее документ XML, описывает файлы двоичных данных, пересылаемых в пакете HTTP. Технологии SOAP with Attachments (SwA) и Microsoft Direct Internet Messaging Extensions (DIME) позволяют пересылать вместе с XML-файлом нетекстовую информацию — например, изображения или цифровые подписи. Но они не обеспечивают двоичного кодирования всего XML-документа.

Ни SwA, ни DIME не получили в отрасли широкого распространения. Признавая колоссальную важность создания общего стандарта для компактного кодирования документов XML, консорциум World Wide Web (W3C) представил нового кандидата на эту роль. Спецификации SOAP Message Transmission Optimization Mechanism (MTOM) и XML-binary Optimized Packaging (XOP) разрабатывались в рамках проекта SOAP 1.2. Рабочая группа W3C XML Binary Characterization уже опубликовала первый предварительный вариант документа XML Binary Characterization Properties, описывающий свойства, которые должны быть присущи MTOM, XOP или любой другой промышленной модели представления данных XML.

Форматы MTOM и XOP получили гораздо более широкую поддержку со стороны производителей по сравнению с принятыми ранее спецификациями преобразования данных XML в двоичное представление. Технологии MTOM и XOP позволяют оптимизировать процедуру двоичного кодирования XML-информации и сделать код более компактным. MTOM и XOP сохраняют и одну из наиболее сильных сторон XML — прозрачность логической структуры разметки для каждого конкретного документа.

Прозрачность логической структуры достигается за счет ее преобразования в текстовое описание XML Information Set, позволяющее последовательно переводить информационное наполнение документов в любое двоичное представление. В частности, указанные спецификации поддерживают двоичное кодирование информационного наполнения XML (а также описания XML Information Set) в виде компонентов Multipurpose Internet Messaging Extensions Multipart/Related и встраивание этих компонентов в конверты SOAP 1.2. Спецификации описывают также порядок интеграции двоичных компонентов XML непосредственно в пакеты HTTP (в тех случаях, когда SOAP не задействуется). Благодаря этому удается уменьшить размеры XML-файлов при их передаче и хранении.

Одно из ограничений MTOM и XOP заключается в том, что на маршруте передачи сообщения XML/SOAP эти технологии можно использовать только для определения специфичных соглашений о кодировании при пересылке информации между двумя смежными узлами. В спецификациях не указано, каким образом будут определяться глобальные политики оптимизации кодирования XML-файлов, применимые к произвольному количеству промежуточных узлов управления XML/SOAP. А ведь этим политикам отводится очень важная роль.

Стоит заметить также, что спецификации MTOM и XOP пока не имеют статуса стандартов W3C, и в настоящее время число их коммерческих реализаций ограничено. Компаниям, желающим построить свою стратегию оптимизации XML на базе подобных технологий, возможно, еще несколько лет придется ждать появления достаточно распространенных коммерческих прикладных платформ, программного инструментария промежуточного слоя и средств разработки.

В то же время следует признать, что момент для создания спецификаций MTOM и XOP выбран весьма удачно. Ожидается, что к концу текущего десятилетия эффективные схемы кодирования, позволяющие «приручить» XML, будут использоваться уже повсеместно.

Джеймс Кобайлас — независимый консультант по информационным технологиям. Электронную почту ему можно направлять по адресу james_kobielus@hotmail.com

Поделитесь материалом с коллегами и друзьями