Задача VoiceTIMES - разработка стандартов на голосовые технологии


Крис Шипли: "Формирование VoiceTIMES свидетельствует о том, что следующее поколение пользовательских интерфейсов обязательно будет включать средства голосового ввода"
Компании IBM, Intel, e.Digital, Dictaphone, Norcom Electronics, Olympus и Philips образовали альянс с целью совместной разработки стандартов на голосовые технологии для мобильных устройств.

Альянс получил название VoiceTIMES (Voice Technology Initiative for Mobile Enterprise Solutions - Инициатива в области голосовых технологий для мобильных корпоративных решений).

"Задачей VoiceTIMES является определение технических требований, необходимых для интеграции голоса в разнообразные мобильные устройства, например в сотовые телефоны, карманные компьютеры и другие устройства, которые еще только предстоит создать, - сказал Том Хоу, менеджер IBM по корпоративным маркетинговым программам. - Мы намерены совместно с Intel, Olympus и другими компаниями определить перечень характеристик технических средств, предназначенных для применения в различных областях. Мы рассчитываем предложить эталонные модели для каких-то определенных профессиональных сфер. Затем, возможно, кто-то из компаний - членов альянса возьмется производить устройства в соответствии с теми или иными моделями".

Хоу отметил, что устройство со встроенными голосовыми функциями, к примеру, весьма пригодится полицейским, которые не могут носить с собой мобильный компьютер.

Крис Шипли, исполнительный продюсер демо-конференций IDG Conference Management, считает, что формирование VoiceTIMES свидетельствует о том, что следующее поколение пользовательских интерфейсов обязательно будет включать средства голосового ввода.

"Компьютерные процессоры будут применяться в тех случаях, когда намного удобнее осуществлять процесс управления посредством голоса, а не с помощью управляющей панели, клавиатуры или сенсорных экранов. Навигационная система, например, в автомобиле, как мне кажется, действительно должна реагировать на вопрос 'Где расположен местный госпиталь', а не требовать, чтобы я набрал на клавиатуре подробный запрос, при том что в это время мне приходится вести машину на достаточно высокой скорости", - заметил Шипли.

Уильям Мейсел, президент консалтинговой компании TMA Associates, специализирующейся на голосовых технологиях, считает, что такие устройства, как PalmPilot, плохо подходят для ввода длинных текстов.

"Поскольку процесс ввода текста на таких устройствах достаточно трудоемок, на них вы не сможете написать длинный комментарий или письмо для отправки по электронной почте. Они удобны для коротких заметок", - заключил Мейсел.

Он подчеркнул, что продукты наподобие мобильных записывающих устройств компании Dragon Systems предназначены для создания текстов, но не помогают заполнять формы и показывать файлы, как это "умеет" PalmPilot.

"Мне кажется, в перспективе эти устройства будут объединены, - отметил Мейсел. - Если вы намерены работать с небольшими моделями, голосовой интерфейс приобретает особую важность, и начинания типа VoiceTIMES действительно помогают создать новую категорию продуктов для потребительского рынка".

Помимо разработки новой продукции VoiceTIMES будет заниматься подготовкой отраслевых стандартов.

"Мы хотим определить технические требования, позволяющие обеспечить качественную работу с голосом, по крайней мере способность распознавать речь и передавать ее в том или ином виде. Мы определяем стандарты, описывающие порядок сжатия голосовых команд, формирования пакетов и их передачи механизмам, которые действительно будут их распознавать", - подчеркнул Хоу.

Шипли считает, что VoiceTIMES сможет разрешить, в частности, проблему импорта голосовой команды через микрофон.

"Если разработчику программного обеспечения для распознавания речи будет известен определенный стандарт и процедура получения голосовой команды, то он быстро найдет способ эту голосовую команду обработать", - заявил Шипли.

Мейсел придерживается того же мнения. Кроме того, он считает, что стандарты окажутся крайне полезными для создателей и программного, и аппаратного обеспечения, работающих в этой отрасли.

При наличии стандартов такие производители оборудования, как Olympus, могли бы выпускать устройства, способные хранить запись речи, и сделать их дешевле и эффективнее. Более того, вне зависимости от того, кто создал программу, считывающую информацию, пользователи с ее помощью смогут получить данные, хранящиеся в устройстве.

"Разработчики программного обеспечения могли бы, основываясь на стандартах, писать многофункциональные программы, которые получают данные, и не беспокоиться о вопросах совместимости", - утверждает Мейсел.

Он также отметил, что конкуренты компаний - участников VoiceTIMES способны отказаться от работы в альянсе, если почувствуют, что теряют стратегические преимущества.

Однако Шипли считает, что VoiceTIMES сосредоточит свои усилия на таких вопросах, как приложения распознавания речи, которые любая из конкурирующих компаний могла бы использовать для собственной пользы.

Хоу считает, что число участников VoiceTIMES будет по-прежнему расти, поскольку эта инициатива нашла позитивный отклик в отрасли.

"Мы рассчитываем, что в конечном итоге этот стандарт будет представлен широкой публике. Думаю, другие компании смогут без каких-либо серьезных проблем интегрировать решения, подготовленные в рамках VoiceTIMES, в свои средства распознавания речи", - заключил Хоу.