Network World, США

Концепция универсальной обработки сообщений (Unified Messaging, UM) не нова, но в последнее время системы IP-телефонии получили расширенные пользовательские интерфейсы, технологии более точного распознавания голоса и преобразования текста в речь (text-to-speech, TTS)

В большинстве случаев система универсальной обработки сообщений представляет собой дополнительный программный модуль. Он загружается на учрежденческую АТС и обеспечивает эффективные, консолидированные и максимально упрощенные средства доступа к голосовой и электронной почте с любого телефонного аппарата. Как правило, система UM обрабатывает голосовую почту непосредственно на УАТС и выполняет процедуры, необходимые для доставки по локальной сети голосовой и электронной корреспонденции на сервер электронной почты.

Мы протестировали последние версии систем UM от Avaya, Cisco, Nortel и Siemens. Победителем оказался продукт Avaya — благодаря удачно спроектированному Web-интерфейсу для работы с голосовой и электронной почтой, великолепному интерфейсу модуля распознавания речи, высочайшей точности и производительности средств TTS (табл. 1).

Второе место заняла HiPathXpressions — разработка подразделения Siemens Communications. К числу ее безусловных достоинств следует отнести отличные административные средства доступа к среде UM, очень хороший Web-интерфейс для доступа к объединенной голосовой и электронной почте, настраиваемые под потребности заказчика средства распознавания речи.

Продукт Cisco Systems отличается выдающимися функциями защиты голосовой почты. Правда, кое-какая функциональность в нем пока отсутствует: в составе Unity Enterprise 4.0 мы не обнаружили Web-интерфейса для единого доступа к голосовой и электронной почте, как и средств доступа к электронному почтовому ящику при помощи голосовых команд.

Сильные стороны решения Nortel — поддержка большого числа иностранных языков и наличие настраиваемых средств распознавания голоса. Однако ПО CallPilot способно работать только с УАТС производства Nortel. Качество средств TTS (которые «зачитывают» сообщения электронной почты, чтобы вы могли прослушать их по телефону) оказалось посредственным, а патентованный формат кодировки сообщений голосовой почты требует установки на компьютерах пользователей специальных средств воспроизведения, что усложняет работу с системой.

Все протестированные решения включали в себя одно или несколько серверных приложений, клиентское ПО и базовую инфраструктуру телефонии, без которой мы просто не смогли бы полностью протестировать функции универсальной обработки сообщений. Чтобы обеспечить равные условия тестирования, для хранения электронной корреспонденции мы использовали сервер Microsoft Exchange, а на клиентском компьютере было установлено почтовое приложение Outlook. Производители предоставили в наше распоряжение серверы Exchange 2000 и 2003 и необходимые дополнительные модули для Outlook.

Оказалось, что у четырех протестированных продуктов около 80% функций обработки электронных сообщений, помещенных во входной ящик Outlook, и соответствующие пользовательские интерфейсы совпадают. Различия обнаруживаются лишь на уровне самых современных UM-интерфейсов, призванных упростить доступ к корреспонденции и повысить продуктивность работы пользователей. Нас интересовали все поддерживаемые интерфейсы, включая классические средства доступа к входящей почте, интерфейсы на базе Web, а также пользовательские интерфейсы к телефонным системам (Telephone User Interface, TUI) следующего поколения. Причем мы не ограничились стандартной проверкой работы TUI, а попытались добиться полноценного взаимодействия с системой UM при помощи речевых команд, т.е. без применения компьютерной клавиатуры или тастатуры телефонного аппарата. В идеале, пользователь должен общаться с системой на естественном языке, а та обязана точно воспроизводить сообщения электронной почты на том языке, на котором они написаны.

Общий вывод заключается в том, что интерфейс Outlook Inbox обеспечивает наиболее полную функциональность. Зато интерфейс доступа к приложению Outlook средствами Web (поддерживаемый продуктами не всех производителей) поддерживает быстрый доступ к корреспонденции из произвольного места и в любое время. Правда, в последнем случае доступ к среде обработки сообщений оказывается не столь непосредственным, как при работе с папкой Outlook Inbox.

Avaya MMS и UCC

Разработка Modular Messaging System (MMS) от Avaya обеспечивает все функции, которые нас интересовали, за исключением средств распознавания речи. Последние компания реализовала в ПО Unified Communications Center (UCC).

Среди протестированных продуктов у решения Avaya оказался наилучший Web-интерфейс, во многом похожий на интерфейс Outlook Web Access корпорации Microsoft. Он отличается ясностью и простотой в работе, а потому является приемлемой альтернативой средствам доступа к голосовой и электронной корреспонденции напрямую через Outlook Inbox. Небольшой, но требующий упоминания изъян заключается в отсутствии прямого взаимодействия с функцией набора телефонных номеров. В среде Outlook вы не сможете сразу инициировать ответный звонок на оставленное голосовое сообщение, а будете вынуждены воспользоваться «привязанным» к системе телефоном и вручную набрать номер интересующего вас абонента. Впрочем, аналогичные ограничения присущи и продуктам Cisco и Siemens.

Средства распознавания голоса, которые в UCC основаны на ПО Nuance 8.5 компании Nuance Communications, отличаются высочайшим качеством с точки зрения поддержки естественного языка на уровне интерфейса. Работа с системой основана на 40 фиксированных фразах. Этот набор не так-то просто расширить или адаптировать под потребности пользователя, но его более чем достаточно для доступа ко всем неспецифическим функциям обработки голосовых и электронных сообщений. К тому же в любой момент можно произнести слово «help» и получить полезную информацию о дальнейших действиях.

Функции преобразования текста в речь Avaya заимствовала у независимого разработчика Scansoft. Приложение Speechify 2.1.3 оказалось лучшим среди конкурирующих решений и получило наивысшие оценки для четырех из семи тестовых сообщений. Это означает, что все без исключения слова в таких сообщениях были правильно распознаны и произнесены. Основываясь на анализе содержимого тела электронного сообщения, система при необходимости автоматически переходит на другой язык. Стандартный пакет TTS от Avaya включает в себя поддержку одиннадцати языков, девять из которых могут быть активизированы одновременно.

В предоставленной нам конфигурации голосовые сообщения хранились на сервере Exchange, но их можно поместить и на дополнительный сервер голосовой почты Avaya, работающий под ОС Linux. Этот Linux-сервер допускается использовать как резервный, так что голосовые сообщения будут приниматься и сохраняться даже при недоступности сервера Exchange.

Удачно сконфигурированное решение Avaya способно взаимодействовать с множеством УАТС других производителей, в том числе Cisco, Mitel, NEC и Siemens. Этим летом фирма намерена обеспечить взаимодействие своего UM-продукта с телефонными системами Nortel, Cisco и Siemens через интерфейс Q.Sig. Программы MMS и UCC устанавливают связь с УАТС независимо друг от друга; при этом поддерживаются многочисленные варианты соединения — начиная с аналоговых транков и линий T1 с сигнализацией PRI и заканчивая более современным интерфейсом Q.Sig.

Решение Avaya отличает высокий уровень гибкости с точки зрения настроек вокодера для голосовой почты (включены поддержка стандарта G.711 и спецификации GSM 6.10 компании Microsoft). На высоте оказалась и масштабируемость: возможны до 69 одновременных UM-сеансов и поддержка нескольких сотен, а то и тысяч пользователей на одном сервере. В общую систему объединяются максимум десять таких серверов. К сожалению, не обеспечена функция обработки факсимильных сообщений.

Siemens Xpressions

Решение Siemens позволяет хранить голосовые сообщения на сервере HiPath Xpressions или непосредственно на пользовательском почтовом сервере Exchange. При запуске ПО Siemens на серверах под управлением Windows 2003 (рекомендованная версия, хотя поддерживается и Windows 2000) для поддержки избыточности можно прибегнуть к кластерной конфигурации.

Подобно Avaya, корпорация Siemens для универсального доступа к сообщениями предлагает удобный Web-интерфейс. Правда, с разработкой Avaya обращаться несколько легче. Однако реализованный Siemens интерфейс для приложения Outlook порой оказывался более гибким, чем у конкурентов. Например, Xpressions позволяет поместить голосовые сообщения в одну из двух папок среды Outlook, а затем получить полноценный доступ к сообщениям в обеих папках, используя голосовые команды. В остальных решениях полноценный доступ к голосовой почте обычно поддерживается в рамках одной папки.

Впрочем, как и в системе Avaya, пользователь лишен возможности напрямую совершать звонки из среды MS Outlook. Представители Siemens заверили нас, что это можно реализовать при помощи предлагаемого фирмой дополнительного приложения компьютерно-телефонной интеграции SimplyPhone.

Протестированный нами компонент распознавания голоса все еще находился на стадии завершающего бета-тестирования. Предполагается, что он будет добавлен в промежуточную версию UM-решения Siemens текущим летом. Программный модуль распознавания речи SpeechWorks v.3, позаимствованный у одноименного разработчика, устанавливается на отдельном сервере. На наш взгляд, этот компонент UM-системы особенно удачен. В него заложен богатый словарь терминов, который при помощи службы технической поддержки Siemens может быть расширен.

Хотя при реализации функций TTS корпорация Siemens, подобно Avaya, прибегла к помощи фирмы Scansoft, она остановила свой выбор на приложении Speechify более ранней версии — 2.0.2. В результате в каждый момент система поддерживает только один из двух языков — английский или немецкий. ПО Xpressions не может автоматически распознавать и подключать другие языки, основываясь на результатах анализа текстовых сообщений. Представители Siemens пообещали, что поддержка иностранных языков будет расширена в следующей версии продукта.

ПО HiPath Xpressions взаимодействует с УАТС 14 других производителей, включая Ascom, Alcatel, Ericsson и Philips. Однако практически во всех случаях связь устанавливается только по интерфейсу ISDN PRI. Масштабируемость решения Siemens зависит от конфигурации. При наличии достаточных ресурсов Windows-сервера возможна одновременная поддержка до 255 портов. В то же время для голосовых сообщений непременно должно использоваться только одно хранилище. В состав Xpressions интегрированы функции обработки факсимильных сообщений, но лицензируются они отдельно и повышают стоимость решения на 40 долл. в пересчете на рабочее место.

Cisco Unity и Personal Assistant

Систему универсальной обработки сообщений Unity Enterprise компании Cisco отличают прекрасные средства распознавания речи и обеспечения высокой доступности, предлагаемые в качестве самостоятельных компонентов. За распознавание речи отвечает приложение Personal Assistant, базирующееся на ПО Nuance от Scansoft и требующее отдельного сервера. Функции Personal Assistant тесно интегрированы в основную систему, но поддерживают доступ только к голосовой почте. Голосовая навигация по ящикам с электронной корреспонденцией невозможна, как и выборочное прослушивание электронных сообщений средствами TTS. Впрочем, в состав Unity включены средства преобразования текста в речь RealSpeak компании Scansoft. Они функционируют практически так же, как модуль TTS в решении Avaya, но ни для одного из текстовых сообщений не получили высшей оценки. Отметим еще, что Cisco не предлагает Web-интерфейса для унифицированного доступа к почтовым и электронным сообщениям.

Несмотря на эти функциональные пробелы, предложение Cisco достойно внимания хотя бы из-за пары весьма полезных интерфейсных находок. Одна из них — встроенный «плейер» Outlook: среди участников испытаний только продукт Cisco позволяет воспроизводить присоединенные голосовые файлы с помощью нажатия одной кнопки интерфейса Outlook. При работе с другими решениями для достижения того же результата придется идентифицировать, выбрать и открыть соответствующее голосовое сообщение и лишь затем инициировать его воспроизведение.

Кроме того, Cisco реализовала воспроизведение звуковых сообщений в ускоренном режиме, причем пользователь может по-прежнему полностью контролировать их содержимое. Аналогичную функцию предлагает и корпорация Nortel, но качество ее продукта — намного хуже. Речь не идет о быстрой «промотке» сообщения, которую поддерживают все протестированные продукты. Во время такой «промотки» пользователь вообще ничего не слышит, при ускоренном же воспроизведении текст читается без пропусков, но с большей скоростью. Режим ускоренного воспроизведения в той или иной мере поддерживается разработками всех четырех компаний на уровне доступа к голосовой почте средствами TUI.

Продукт Cisco получил высокие оценки по критерию «Конфигурация и архитектура» в значительной мере благодаря средствам обеспечения высокой доступности и устойчивости системы. Одно из них, Unity Messaging Repository, отвечает за резервное копирование голосовой почты в хранилище на базе Exchange. Другое представляет собой бесплатный программный компонент DIRT и поддерживает восстановление работоспособности системы UM после сбоев.

ПО Unity взаимодействует с УАТС 17 производителей. Для связи с ними используются различные средства, в том числе специальный шлюз Cisco. Он преобразует вызовы по протоколу SIP, исходящие от оборудования Cisco, в протоколы, применяемые другими УАТС, и наоборот.

Масштабируемость UM-решения Cisco обеспечивается кластеризацией нескольких серверов. Число портов, одновременно поддерживаемых одним сервером, определяется мощностью аппаратной платформы, на которой функционирует система Unity. Компания утверждает, что один сервер способен обслуживать до 7,5 тыс. рабочих мест. Cisco реализовала самый широкий набор настроек вокодеров голосовой почты, которые позволяют регулировать использование полосы пропускания и объем дискового пространства, отводимого под почтовые сообщения.

Высокие оценки получили и средства защиты голосовой почты. Если какое-то сообщение в системе Unity помечено как защищенное, воспроизвести его можно только с системного телефона, а не при помощи «плейера» Outlook. Кроме того, такое сообщение нельзя скопировать или переслать другому пользователю.

За 25 тыс. долл. Cisco предлагает дополнительный факс-сервер. Понятно, что эта сумма является запредельной, и заплатить ее, по-видимому, смогут только крупные организации, интенсивно пользующиеся факсимильной связью.

Nortel CallPilot

Продукт CallPilot фирмы Nortel является полезным и функционально насыщенным, но способен работать только с телефонными системами того же производителя, что сводит на нет все его достоинства. Данное обстоятельство, а также применение компанией патентованной схемы шифрования голосовых сообщений, для прослушивания которых приходится использовать приложение все той же Nortel, вынудили нас по критерию «Конфигурация и архитектура» поставить CallPilot оценку ниже средней.

Если же отвлечься от указанных ограничений, разработка канадского производителя заслуживает всяческих похвал. Только она позволяет инициировать звонки непосредственно из интерфейса Outlook. Пользователь выбирает одно из недавних голосовых сообщений, нажимает на клавишу обратного вызова, и телефонная система автоматически переводит вызов на телефон, ассоциированный с рабочим компьютером этого потребителя.

Уникальным является и раздельное хранение электронной и голосовой почты. Если первая размещается на почтовом сервере Exchange, то вторая — на сервере CallPilot. Объединение двух типов корреспонденции осуществляется уже на уровне пользовательской папки для входящей почты при помощи дополнительных программных модулей, функционирующих в клиентской среде Outlook. Такое решение имеет свои плюсы и минусы. Но, как бы вы ни относились к идее раздельного хранения почты, система CallPilot не поддерживает размещение всей корреспонденции в едином хранилище под управлением Exchange.

Поддержка иностранных языков средствами TTS в решении Nortel характеризуется той же широтой и динамичностью, что и в продукте Avaya. А вот ее качество оказалось не на высоте. В средствах TTS использован более ранний механизм преобразования текста в речь L&H TTS 3000 Version 6 от Lernout & Hauspie, который отличается отрывистым, несколько механистичным чтением сообщений.

Реализованные в CallPilot средства распознавания речи, основанные на ПО L&H ASR 1500 Version 3 той же фирмы, продемонстрировали меньшую производительность, чем конкурирующие продукты. Время от времени нам даже приходилось повторять речевые команды. Правда, пользователь может настроить модуль распознавания речи на свой тембр голоса и конкретные команды.

Поскольку вся голосовая почта хранится на сервере CallPilot, решение Nortel поддерживает несколько методов обеспечения высокой доступности и восстановления системы после сбоев. Обеспечивается периодическое резервное копирование корреспонденции на вторичный сервер голосовой почты по заданному пользователем расписанию. Эту процедуру следует воспринимать как «теплое» резервное копирование, поскольку полного «зеркалирования» БД голосовой почты не происходит. По утверждению компании, один высокопроизводительный сервер, на котором установлено ПО CallPilot, может одновременно поддерживать до 8 тыс. пользователей.

Итого

Ключевыми факторами, повлиявшими на итоговые оценки (табл. 2), стали простота и скорость доступа конечных пользователей к электронной и голосовой почте, обеспечиваемые интерфейсами UM-систем и соответствующими программными компонентами. Можно предположить, что дальнейшее развитие продуктов этой категории будет связано с совершенствованием средств распознавания речи и их все более органичной интегра?цией в существующие платформы. Мы ожидаем повышения точности функционирования средств TTS и увеличения числа поддерживаемых языков. Кроме того, модули распознавания речи по мере их развития должны становиться более доступными по цене.

Таблица 2. Результаты тестирования

Вряд ли надо доказывать, что системы универсальной обработки сообщений позволяют повысить продуктивность работы сотрудников компаний. Благодаря им персонал, находящийся в разъездах, получает доступ к своей электронной и голосовой почте путем простого набора номера на сотовом телефоне или КПК и может детально контролировать обработку поступившей корреспонденции. Для обеспечения эффективности инвестиций в системы UM заказчикам следует внимательно проанализировать предложения разных поставщиков и разобраться в хитросплетениях взаимосвязей между их компонентами.


Процедура тестирования

Каждого производителя мы просили предоставить для испытаний IP-УАТС в полной конфигурации, ПО Exchange Server 2000 (либо более позднюю версию) и минимум два терминала (аппаратные и программные телефоны). Перечисленные продукты требовалось доукомплектовать клиентскими или серверными приложениями, поддерживающими преобразование текста в речь и распознавание голосовых команд.

Чтобы оценить функции TTS, входящие в состав UM-решений, мы генерировали тестовые электронные сообщения. В них содержались многочисленные опечатки, слова, похожие по звучанию, и аббревиатуры, а также включения на немецком, французском и испанском языках.

Для оценки простоты инсталляции и использования клиентского ПО служил ноутбук Compaq Presario с 2,4-ГГц процессором, ОС Microsoft XP (с дополнением Service Pack 2) и приложением Outlook 2000. В среду тестирования входила одна аналоговая линия, подключенная к IP-УАТС, что позволяло оставлять голосовые сообщения, которые затем использовались при тестировании. К клиентскому ноутбуку были подсоединены внешние динамики и микрофон, предназначенные для оценки качества записи и воспроизведения сообщений.

40% тестов были связаны с интерфейсами, обеспечивающими доступ пользователей к системе UM. Оценивались все поддерживаемые интерфейсы, включая классический доступ к электронным сообщениям через ящик входящей почты, интерфейсы на базе Web и телефонные пользовательские интерфейсы следующего поколения. Еще 30% тестов были направлены на изучение конфигурации и архитектуры продуктов. Основными критериями являлись число и набор серверов, обеспечивающих важнейшие функции системы UM, поддержка разных УАТС и настройка средств кодирования голосовой почты с точки зрения используемой полосы пропускания и занимаемого места на диске.

Следующие 20% тестов мы посвятили собственно функциональности, а точнее — тем специфическим или даже уникальным возможностям, которые свойственны только системам универсальной обработки сообщений. Среди них стоит отметить широту поддержки разных языков, интеграцию функций факсимильной связи, гибкость адаптации и настройки голосовых или аудиоинтерфейсов. Наконец, 10% тестов были посвящены процедурам инсталляции и интеграции. В основном нас интересовала клиентская часть, а именно — установка дополнительных программных модулей для Outlook и работа в среде Microsoft Office. Кроме того, мы протестировали интерфейсы верхнего уровня, обеспечивающие администрирование различных компонентов UM-решений.