InfoWorld, США

Консорциум W3C подготовил новые спецификации эффективной обработки двоичных данных XML-приложениями
Рональд Шмелцер

Консорциум World Wide Web Consortium опубликовал три новые спецификации, призванные упростить добавление объемных массивов двоичных данных, таких как графика и фотографии, к числу типов информации, которыми оперируют приложения Web-сервисов. В частности, W3C предлагает усовершенствованные методы обработки XML-файлов большого объема.

Усилия, предпринимаемые W3C, ставят своей целью решить технические проблемы и вопросы производительности, возникающие в связи с использованием двоичных данных в Web-сервисах. По словам Ивза Лефона, представителя группы специалистов, занимавшихся подготовкой проекта трех спецификаций, они, в частности, позволяют сократить число байт, передаваемых при пересылке двоичного файла на сотовый телефон.

Предложения W3C поддержали, в частности, компании IBM, Microsoft и BEA Systems.

«Основная проблема заключается в следующем. Когда вы хотите погрузить большой двоичный объект в XML, вам приходится закодировать его, вследствие чего сообщение становится намного больше того двоичного файла, который вы хотите отослать. Предложенная нами спецификация решает эту проблему, позволяя сократить размер этого сообщения», — пояснил Лефон.

Публикация трех новых спецификаций с официальным статусом Web Services Recommendations означает, что они были окончательно утверждены W3C.

  • XML-binary Optimized Packaging (XOP) предлагает стандартный метод, позволяющий добавлять двоичные данные в том виде, как они есть, в одну посылку с XML-документом. В результате приложениям требуется меньше пространства для хранения данных и меньшая пропускная способность для их пересылки. Работа на уровне XML Information Set (Infoset), абстрактном представлении XML-документа, может быть реализована различными способами.
  • SOAP Message Transmission Optimization Mechanism (MTOM), который использует возможности XOP для SOAP-сообщений и для ускорения работы функций SOAP 1.2. В частности, MTOM определяет функцию Transmission Optimization, которая поддерживает связи SOAP для оптимизации передачи или формата канала, используемого при передаче SOAP-сообщения. MTOM использует HTTP и XOP для пересылки двоичных компонентов, а также SOAP-сообщения в оболочке MIME для того, чтобы сократить пропускную способность и время, необходимое для кодирования и декодирования данных.
  • Resource Representation SOAP Header Block (RRSHB), позволяющий получателям SOAP-сообщений обращаться к кэшированным представлениям внешних ресурсов. Получатели сообщения могут использовать либо оригинальный файл, определяемый по URI, либо кэшированную копию, соответствующую «подлинному» SOAP-сообщению. Вместе с MTOM он может увеличить скорость передачи и уменьшить время обработки, поскольку внешние данные представляются только тогда, когда получатель начинает обрабатывать сообщение.

Попытки W3C улучшить обработку двоичных данных в XML-средах нашли живой отклик в отрасли.

«Безусловно, все без исключения хотят, чтобы очень полезный, но очень неэффективный язык XML стал лучше, — заметил Рональд Шмелцер, ведущий аналитик компании ZapThink. — Несмотря на то, что на рынке есть множество инструментов для решения этих проблем, новые спецификации и более оптимизированные реализации XML-приложений пойдут на благо всей отрасли в целом».

Как заметил Шмелцер, XOP не требует никаких конкретных преобразований XML как двоичного формата, однако он предусматривает расширение XML, которое позволит поддерживать работу с большими двоичными файлами. Это служит свидетельством популярности XML, который используется в новых приложениях вне той области, для которой он изначально был предназначен.

«MTOM и RRSHB также помогают увеличить эффективность за счет сокращения трафика, который могли бы потенциально создать SOAP-сообщения. Это достигается за счет оптимизации самого сообщения и использовании кэширования. Зачем запрашивать данные, если они у вас уже есть?», — заметил Шмелцер.