Новый язык разметки служит для построения голосовых интерфейсов

Билл Дикас: «К концу года мы должны подойти к финальной стадии разработки второй версии Voice XML»

Вторая версия языка разметки Voice XML уже почти утверждена, но не вводится в действие из-за возникших осложнений, связанных с защитой интеллектуальной собственности. По словам специалистов, принимавших участие в работе Voice XML Forum, все спецификации уже согласованы, однако есть опасение, что разработчики, использующие VXML, будут преследоваться за нарушение авторских прав.

«Такая опасность действительно существует, и участники Voice XML Forum должны прояснить ситуацию с правами на интеллектуальную собственность, — отметил президент компании TMA Associates Билл Мейсел. — Одним из возможных решений здесь могло бы стать соглашение между 55 участниками форума, предусматривающее безлицензионное использование спецификаций или отзыв прав на патент».

Разработчики речевых технологий возлагают на VXML большие надежды, поскольку этот язык содержит стандартные конструкции, уже знакомые создателям приложений для Web.

«Для программ обработки голоса Voice XML представляет собой примерно то же самое, что и HTML для Web-приложений, — подчеркнул вице-президент компании Nuance Communications по маркетингу Стив Эрлих. — Язык разметки гипертекстов HTML позволяет отображать на экране Web-страницы, а VXML используется для построения голосового интерфейса, включающего в себя организацию диалогов и запросов».

«К концу года мы должны подойти к финальной стадии разработки второй версии, — сообщил председатель форума Билл Дикас. — Наиболее существенные изменения в ней связаны с созданием стандарта грамматических форматов».

До сих пор разработчики использовали собственные форматы языковых конструкций. Формализация речевой грамматики необходима для сужения спектра возможных вариантов, анализируемых приложением. Например, в английском языке грамматическая конструкция «да/нет» имеет более десятка различных способов представления. Утвердительный ответ можно выразить словами yeah, yes, okay, allright и др. В конечном итоге все они преобразуются в стандартное yes. Вторая версия языка VXML определяет общий формат, благодаря которому программа обрабатывает только один из возможных вариантов ответа.

Другим серьезным дополнением к стандарту, над которым участники Voice XML Forum работали вместе с консорциумом W3C, является преобразование тегов пересылки вызовов. «В приложении VXML должна присутствовать функция, с помощью которой производится переадресация вызова «живому» (имеется в виду человек) оператору, — пояснил Дикас. — Появление тега пересылки — это еще один шаг к расширению области применения программных средств компьютерной телефонии».

Voice XML Forum состоит из ряда подкомитетов, и каждый из них занимается своими техническими вопросами. На заседании форума определяется, какие технологии подкомитетов появятся в следующей версии.

В настоящее время подкомитеты работают над речевыми компонентами для третьей и более старших версий стандарта. В частности, для телефонии необходимо установить порядок управления голосовой почтой и создать механизм балансировки нагрузки в случае одновременного поступления большого количества звонков.

Из других возможностей применения следует отметить распознавание естественного языка и многорежимные интерфейсы для карманных компьютеров и сотовых телефонов. К примеру, при использовании многорежимного интерфейса мобильный пользователь может обратиться с голосовым запросом к базе данных клиентов, отвечающих определенному набору условий. При этом результаты на экране отобразятся быстрее, чем поступит голосовое сообщение.

По мере того как в VXML появляются все более и более сложные функции, количество приложений, поддерживающих голосовые технологии, будет увеличиваться. «До появления стандарта VoiceXML компаниям-разработчикам программного обеспечения приходилось держать в своем штате отдельных сотрудников, которые занимались только телефонными, речевыми или Web-технологиями, — пояснил Дикас. — Теперь все эти задачи можно решить силами всего лишь одного человека».