продемонстрировать новые продукты, объявить о создании альянсов и рассказать о перспективных технологиях.

Компания Dragon Systems анонсировала переносное записывающее устройство — Dragon Naturally Speaking Mobile, позволяющее надиктовать целое выступление длительностью 40 минут, которое затем через последовательный кабель можно переписать на персональный компьютер и при неоходимости воспроизвести текст с помощью ПО Dragon. Выпуск этого мобильного устройства весом 100 с небольшим грамм и ориентировочной стоимостью 250 долл. начнется в октябре. В комплект поставки входит последовательный кабель, встроенный микрофон, записывающая головка с функцией шумоподавления и ПО для ПК. Программное обеспечение включает в себя функции управления и поддержки команд для форматирования и редактирования текста. За счет использования карт флэш-памяти устройство может дополнительно хранить записи продолжительностью 81 минута.

Вперед и с... речью

По мере того как реализация технологии становится все дешевле, системы распознавания речи будут играть все более важную роль в нашей повседневной жизни. Согласно недавно опубликованному исследованию, к началу следующего столетия эта тенденция может привести к формированию многомиллиардной отрасли индустрии информационных технологий.

По данным компании Technical Insights, подразделения корпорации John Wiley & Sons, в ближайшие несколько лет системы распознавания речи появятся на домашних ПК весьма средних возможностей и даже бытовых электронных устройствах.

Так, корпоративная Америка уже взяла на вооружение эту технологию. В частности, компания Charles Schwab использует систему VoiceBroker, которая позволяет ее клиентам получать информацию о котировках акций по телефону, а American Airlines разрабатывает аналогичную систему для бронирования авиабилетов.

Гарри Гольдштейн, автор исследования, озаглавленного "Распознавание речи: от интеллектуальных устройств до интеллектуальных сред" отметил, что усовершенствование технологий и снижение стоимости будут способствовать широкому внедрению функций распознавания речи в электронных устройствах домашнего обихода. Так, например, компания Voice Signal Technologies предлагает микросхемы стоимостью всего 4 долл. с "прожженными" на них системами распознавания речи.

"Хотя за последние пять лет точность распознавания речи значительно возросла, а затраты существенно сократились, технологии распространяются очень медленно, поскольку компании основное внимание уделяли Internet и тратили на это большую часть средств, отведенных на развитие", - считает Уильям Мейсел, издатель и редактор ежемесячного бюллетеня Speech Recognition Update.

Дейв Пассморе, аналитик компании NetReference, заметил, что средства распознавания речи, такие как активируемые голосом автоматические системы, сейчас используются крупными компаниями с целью сократить затраты и улучшить обслуживание клиентов. Но он довольно пессимистично отозвался о перспективах подобных технологий на рынке домашних систем: "Неизвестно, действительно ли выгодно пользоваться такими средствами и многие ли захотят их приобрести".

 

Microsoft использовала конференцию AVIOS для анонса четвертой версии своих интерфейсов Speech API (SAPI), которые поддерживаются всеми основными производителями, работающими с голосовыми технологиями, в том числе компаниями Dragon, IBM и Lernout & Hauspie Speech Products.

В состав SAPI 4.0 вошли функции, связанные с поддержкой распознавания слитной речи и непрерывного управления. Версия 3.0 поддерживала распознавание только раздельной речи. Кроме того, по некоторым сообщениям, в SAPI исправлены многочисленные ошибки.

Подразделение IBM, занимающееся голосовыми технологиями, не представило никаких новинок, но активно занимается пропагандой концепции так называемых Transparent Computing ("прозрачных вычислений"). Судя по сообщениям, компания намеревается зарегистрировать этот термин как торговую марку.

Выражением Transparent Computing в корпорации предлагают описывать взаимодействия между человеком и машиной, когда эти взаимодействия станут "полными и повсеместными", так что пользователь сможет обращаться к информации с помощью совершенно прозрачного пользовательского интерфейса.

Хотя "прозрачные вычисления" — это долговременная стратегия IBM, промежуточный этап, который корпорация намерена реализовать на рубеже столетия, связан с разработками, ориентированными на голосовые технологии Internet-коммерции, браузеры и механизмы поиска в Web.

Компания Lernout & Hauspie анонсировала программные системы распознавания речи Voice Xpress Advanced и Voice Xpress Professional, выпуск которых начнется в ближайшее время. Версия Professional стоит 150 долл. и предназначена для корпоративных пользователей. Версия Advanced стоимостью 80 долл. рассчитана на рынок SOHO.

С помощью этой программы пользователи смогут, применяя технологию распознавания слитной речи, вводить тексты в большинстве Windows-приложений, в том числе Lotus SmartSuite, Corel Office и Microsoft Office. Функции контроля и управления дадут, к примеру, возможность создавать и редактировать электронные таблицы, графические презентации и документы Outlook 98 с помощью команд, подаваемых голосом.

Для работы многих программ распознавания речи обычно требуются компьютеры с процессорами Pentium II и оперативной памятью большой емкости. Однако технология преобразования текста в речь и распознавания рукописного текста, разработанная в AcuVoice, подразделении компании Fonix Systems, может быть использована при создании недорогих и требующих невысокой мощности решений на одной микросхеме, предназначенных для рынка встроенных систем. Данная технология уже лицензирована компанией Siemans.

Микросхема производства Siemans, получившая название TriCore DSP, включает DSP-процессор, микроконтроллер и память. TriCore DSP будет предлагаться производителям карманных устройств и сотовых телефонов в качестве встроенного модуля распознавания речи.

Д. Линн Шеферд, старший инженер компании Fonix, принимавший участие в подготовке лицензионного соглашения Fonix и Siemans, считает, что TriCore будет способствовать быстрому развертыванию технологии распознавания речи благодаря своей дешевизне и низкому уровню энергопотребления.

Поделитесь материалом с коллегами и друзьями