речевой корпус русского языка RuSpeech, достаточный для распознавания естественной речи говорящего в реальном времени. RuSpeech - речевая база данных, с которой компьютер сможет "сверять" естественную речь диктора, распознавая не только слова, уже присутствующие в базе, но и отдельные фонемы и их последовательности, что позволит минимизировать количество ошибок при распознавании новых, отсутствующих в корпусе слов. В состав RuSpeech входит более 50 тыс. предложений с фонетической разметкой каждой произнесенной фразы. Речевой корпус содержит около 50 часов непрерывной речи объемом 15 Гбайт, размещаемых на 30 c лишним компакт-дисках. Эта разработка может быть использована в голосовых порталах, для голосового управления в телефонии (справочные службы, телефонный доступ к электронной почте, голосовой набор номера), а также в системах диктовки.

Поделитесь материалом с коллегами и друзьями