Кристина Хиршман, Nuance
Кристина Хиршман демонстрирует возможности распознавания команд с помощью iPhone

«Для нас на российском рынке первым приоритетом является линейка продуктов под торговой маркой Dragon», — отметил Фредерик Делахайс, вице-президент Nuance по решениям для ПК. Сейчас компания ищет партнеров для распространения Dragon NaturallySpeaking на российском рынке.

Технология Dragon была впервые представлена в 1997 году, а после доработки компанией Nuance выведена на коммерческий рынок под торговой маркой Dragon NaturallySpeaking. По заявлению Делахайса, в США этот продукт входит в четверку наиболее популярных коммерческих приложений после Microsoft Office.

В России технология долго не была представлена, и теперь Nuance решила вывести ее и на наш рынок. Она обеспечивает автоматизированный ввод распознаваемых голосовых сообщений со скоростью до 120 слов в минуту, в то время как максимальная скорость набора текста остается на уровне 50 слов. Таким образом, технология может понравиться всем специалистам, где требуется быстрый набор текста: писателям, юристам, офисным работникам и многим другим. Кроме того, она позволяет не использовать руки для работы с различными устройствами, что может быть важно для водителей, врачей и других специалистов. Правда, редактировать полученные таким способом тексты по-прежнему удобнее с помощью компьютера.

Сейчас на русском языке доступна только упрощенная мобильная версия технологии Dragon Dictation, которая работает на платформе iOS и позволяет распознать фразы длиной до 30 секунд с помощью облачных технологий. Это можно использовать для набора коротких сообщений электронной почты или вставить в любое другое приложение. На базе этой же технологии работает и продукт Dragon Search, который позволяет голосом отдавать команды на поиск нужной информации.

Еще одним вариантом использования технологий распознавания речевых команд, который предлагает Nuance, является система Dragon Driver, которая предназначена для встраивания в автомобиль. Она позволяет с помощью голосовых команд управлять мультимедийным центром автомобиля: выбирать музыку, принимать и отправлять SMS-сообщения, контролировать свое местоположение с помощью GPS-навигатора и выполнять другие действия. Сейчас этот продукт уже встраивают в свои автомобили такие производители, как Audi, BMW и Mercedes. Причем, по заверениям Кристины Хиршман, директора Nuance по продажам в регионе EMEA, системы были проданы автопроизводителям в том числе и с поддержкой русского языка. Пока они замечены только в Audi A8, но со временем и другие производители, скорее всего, будут использовать эти технологии в своих продуктах.

Впрочем, и российские разработчики могут использовать разработанные Nuance сервисы в своих мобильных приложениях. Компания обнародовала технологию NDEV, которая включает в себя набор интерфейсов для подключения серверной или клиентской части технологии распознавания голосовых команд. При этом распознавание голоса выполняется в специальном облаке, после чего уже текстовый запрос отправляется на сервер клиента, там обрабатывается и ответ отправляется обратно клиенту.

Компания также занимается синтезом речи по тексту. В частности, в мае 2013 года она готовит к выпуску новую, шестую версию своей программы для синтеза речи Vocalizer, которая будет объединять три принадлежащие Nuance технологии синтеза. Теперь все они будут базироваться на одной платформе, что расширит возможности для создания новых продуктов. Nuance рассчитывает сделать синтезированную речь еще натуральнее за счет дополнительных внетекстовых звуков и эмоциональной окраски. Кроме того, ожидается появление нового русскоязычного голоса под кодовым именем Юрий. Клиенты смогут также заказать индивидуальные голоса, которые максимально соответствуют их требованиям.

Со временем компания рассчитывает вывести на российский рынок и другие продукты из серии Dragon. В частности, ожидается выпуск в ближайшее время телевизора Samsung со встроенной технологией Dragon TV, которая позволяет управлять телевизором с помощью голоса. Ориентация на Dragon с распознаванием русского языка позволяет надеяться на появление в России и других технологий голосового управления, синтеза речи и идентификации пользователей.

Поделитесь материалом с коллегами и друзьями