Мнения о том, какие голосовые технологии нужны, весьма противоречивы

В то время как Билл Гейтс представлял предварительный вариант спецификаций SALT, консорциум W3C официально утвердил VXML в качестве стандартной технологии распознавания речи
Итак, вот еще одна классическая картинка, столь характерная для отрасли высоких технологий. Одновременно с тем, как Билл Гейтс анонсировал технологию распознавания речи SALT (Speech Application Language Tags), консорциум WC3 (World Wide Web Consortium) объявил о поддержке альтернативного варианта — VXML.

В ходе конференции Professional Developer?s Conference представители Microsoft продемонстрировали предварительный вариант пакета для разработчиков .NET Speech SDK — спецификаций голосовых технологий, появившихся на свет в рамках инициативы .NET и в ходе реализации проектов создания более мощных карманных компьютеров.

С помощью технологии SALT разработчики смогут описывать речевые конструкции на языках HTML, xHTML и XML. По словам вице-президента подразделения Microsoft Natural Interactive Services Division Кай-Фу Ли, спецификации SALT упростят интеграцию речи в различные приложения и будут поддерживаться программами Internet Explorer, Pocket IE, ASP.net и Visual Studio.net.

В то время как Гейтс выступал перед участниками конференции PDC и представлял предварительный вариант спецификаций Microsoft, консорциум W3C официально утвердил Voice XML в качестве стандартной технологии распознавания речи для приложений Web, функционирующих в телефонных сетях.

Отныне спецификациями VXML, предложенными в свое время ассоциацией VXML Forum, будет заниматься W3C. Консорциум W3C уже представил черновой вариант VXML Version 2.

Две альтернативные технологии имеют различное происхождение. Спецификации VXML проектировались для того, чтобы помочь разработчикам Web-приложений обойтись без знания особенностей архитектуры IVR (Interactive Voice Recognition) при создании прикладных программ, которые будут работать как на настольном компьютере, так и на платформах телефонии.

Спецификации SALT, также ориентированные на разработчиков приложений для Web, позволяют проектировать голосовой пользовательский интерфейс при создании сложных мультимодальных (поддерживающих несколько форм представления входной и выходной информации) интерфейсов для карманных устройств. Команды, подаваемые голосом, должны стать одним из способов доступа к информации при помощи карманных устройств.

Хотя VXML и SALT проектировались для двух различных платформ, конкуренция между ними неизбежна. Microsoft заранее обвиняют в том, что SALT помешает дальнейшему развитию технологического направления, которое и так встречает на своем пути много препятствий.

«С появлением SALT мы получаем еще одну концепцию решения определенных задач, — отметил начальник подразделения голосовых систем IBM и член VXML Forum Найджел Бек. — Нам же требуется единый унифицированный подход».

Директор подразделения мультимедийных (телефонных) серверов Intel и член SALT Forum Глен Шайрс полагает, что оба языка имеют свои сильные стороны. VXML лучше подходит для телефонии, а SALT — для мультимодальных устройств. Однако на вопрос о том, придется ли разработчикам изучать две различные среды для создания полнофункционального голосового приложения, он ответил: «Все, что вам необходимо, можно сделать при помощи SALT».

Эту точку зрения разделяет и сотрудник подразделения Microsoft .NET Speech Technologies Джеймс Мастан. Он отмечает, что спецификации VXML создавались для служб на базе IVR. Поэтому неизвестно, подойдет ли VXML для карманных устройств.

«Технически очень сложно обеспечить поддержку мультимодального оборудования, отталкиваясь от функций обработки голосовой информации (VXML), — подчеркнул Мастан. — Гораздо проще взять уже существующий язык разметки HTML и добавить туда несколько несложных элементов».

Найджел Бек тем не менее полагает, что консорциуму W3C удастся создать мультимодальные расширения VXLM.

На начальном этапе авторы стратегии, построенной на основе инициативы VXML, отталкивались от того простого факта, что по темпам развития отрасль сотовых телефонов значительно опережает все остальные сегменты беспроводного рынка. Таким образом, задача VXML заключается в том, чтобы обеспечить доступ Web-служб к этому высокоприбыльному каналу сбыта. Но что если сторонники SALT также замахнутся на этот высокодоходный рынок?

«На самом деле окончательный выбор компаний, специализирующихся на высоких технологиях, будет определяться наличием реальных предложений, — заметил президент компании TMA Associates Билл Мейсел. — Поскольку рынок компактных устройств продолжает развиваться, корпорация Microsoft может позволить себе подождать три-четыре года, пока SALT не выйдет на более высокий качественный уровень. Но для большинства тех, кто занят в телефонном бизнесе, подобный подход неприемлем».