Работы над проектом продолжались более 3 лет, собственные инвестиции компании в разработку составили порядка 5 млн. долл. Технология "Руссограф" обеспечивает распознавание 30 тыс. словоформ. Как поясняют в ЦРТ, русский язык принципиально отличается от других языков не только фонетически (например, звуком "ы"), но и свободным порядком слов в предложении, что значительно усложняет математическое моделирование речи. Разработку в ЦРТ осуществляла научно-исследовательская группа из специалистов по лингвистике, фонетике, математике, обработке сигналов и программированию. Для создания акустических моделей звуков русской речи использовался набор речевых баз данных с записями более чем 3 тыс. дикторов общей длительностью около 300 часов, собранных с учетом 5 диалектных групп русского языка. Для создания языковых моделей была собрана текстовая база русского языка объемом 35 млн. слов. Для проведения экспериментальных исследований в компании развернут вычислительный кластер производительностью около 1012 оп/с. Сейчас ЦРТ работает над аппаратной реализацией технологии. В этом году будут выпущены несколько продуктов на ее основе, в частности, система интерактивного голосового управления для контакт-центров и системы управления промышленными объектами. К Олимпиаде-2014 в Сочи компания планирует создание на базе технологий распознавания и синтеза карманного переводчика устной русской речи.

Поделитесь материалом с коллегами и друзьями