Петербургская компания «Центр речевых технологий» завершила работу над технологией распознавания слитной русской речи. Работы над проектом «Руссограф» продолжались более трех лет, компания инвестировала в разработку около 5 млн. долл.

Существующие системы распознавания создавались для работы с другими языками и были неэффективны в работе с русским. Это связано с тем, что русский язык принципиально отличается от других языков не только фонетически, но и свободным порядком слов в предложении, что значительно усложняет математическое моделирование речи.

Технология содержит 30 тыс. словоформ. При ее создании использовался набор речевых баз данных, в который вошли записи более чем 3 тыс. дикторов общей длительностью около 300 часов. Они использовались для создания акустических моделей звуков русской речи. Для формирования языковых моделей была собрана текстовая база русского языка объемом 35 млн. слов. Также был разработан базовый речевой декодер, в основу которого легли оригинальные акустические и языковые модели русского языка для преобразования речевого сигнала в текст.

Практическое значение технологии заключается в новых возможностях голосового управления компьютерной и бытовой техникой, управления автоматическими телефонными службами и сервисами, а также обеспечения безопасности людей и объектов. Особенно актуальной новая разработка может стать для людей c ограниченными физическими возможностями.

В 2008 году компания выпустит несколько продуктов, построенных на этой технологии, в частности систему интерактивного голосового управления для контакт-центров, а также голосовые интерфейсы управления промышленными объектами. В планах разработчика - создание карманного переводчика устной русской речи. Возможно, он будет готов к Олимпиаде-2014 в Сочи.

«Технология распознавания русской речи «Руссограф», разработанная в ЦРТ, дает основу для создания целой линейки инновационных продуктов. Думаю, очень скоро общение с компьютером и другой техникой с помощью русской речи будет восприниматься так же естественно, как разговор между двумя людьми», – отметил генеральный директор «Центра речевых технологий» Михаил Хитров.

Поделитесь материалом с коллегами и друзьями