Motorola и SpeechWorks демонстрируют новое качество распознавания речи

Motorola и производитель программного обеспечения распознавания речи SpeechWorks International разработали прототип телефона, который, как утверждается, поможет компьютерам лучше расшифровывать радиосигналы, что, в свою очередь, должно сделать передачу голоса чище.

Современная технология распознавания речи в мобильной телефонии требует передачи речевого сигнала по радиосети для обработки на стационарном компьютере. Компьютер расшифровывает речь и отправляет ее по радиоканалу на другой конец соединения.

Опытный образец телефона оснащен специальным приложением для торговых агентов, с помощью которого они могут, находясь в пути, проверять свою бухгалтерию через речевой запрос с портативного устройства

Если пользователь мобильного телефона находится в зоне неуверенного приема, скажем, в здании или на границе зоны покрытия своего оператора, точность воспроизведения речи снижается, возникают разного рода прерывания связи. Стив Чамберс, вице-президент компании SpeechWorks по глобальному маркетингу, утверждает, что при обработке речи, искаженной в процессе передачи, компьютер может не справиться с задачей распознавания.

Проблема осложняется ограничениями, присущими передаче телефонного радиосигнала по сети. Для речевых сообщений нет резервных каналов передачи, подобных тем, что обычно используются для гарантированной доставки пакетов данных по Internet.

По словам Чамберса, механизмы распознавания речи не рассчитаны на расшифровку повторных сигналов. Если вы звоните в авиакомпанию и говорите «Бостон», телефон не может трижды послать сигнал. Сервер услышал бы «Бостон, Бостон, Бостон» и каждый раз воспринимал бы слово как новое.

Модель, предложенная Motorola и SpeechWorks, нацелена на решение проблем в самом их источнике. Процессор по возможности очищает речевой сигнал и формирует его цифровой эквивалент. Очищенный сигнал легче поддается обработке на сервере, использующем программное обеспечение SpeechWorks.

Если технологии Motorola и SpeechWorks используются и в источнике сигнала (телефоне), и на сервере, то сигнал, поступающий на сервер, оказывается намного чище.

Опытный образец телефона оснащен специальным приложением для торговых агентов, с помощью которого они могут, находясь в пути, проверять свою бухгалтерию через речевой запрос с портативного устройства. Имеется и приложение для резервирования мест на самолеты, рассчитанное на всех пользователей.

По словам Чамберса, компании планируют выпустить свою разработку на рынок в ближайшие год-полтора.

Дальнейшее совершенствование цифровых сигнальных процессоров (DSP — digital signal processor) даст возможность переложить на мобильный телефон большую часть вычислений, связанных с распознаванием речи, что позволит избежать потерь сигнала при передаче. DSP-процессоры сигнала для распознавания речи то же самое, что графические платы для видеоигр: чем выше быстродействие и объем видеопамяти, тем лучше результат.

Поделитесь материалом с коллегами и друзьями