Созданный в Exalead механизм поиска по видео- и аудиофайлам получил название Voxalead. Он действует, автоматически конвертируя речь, звучащую в записи, в текст.

Отныне благодаря Voxalead у посетителей сайта Elysee.fr появилась возможность выполнять поиск по всем хранимым на нем записям выступлений и пресс-конференций Саркози, вводя ключевые слова. Система выполняет переход в точности в то место видео, где президент их произносит. Сделанные системой расшифровки можно накладывать на видео в качестве субтитров.

Как указывают в Exalead, поисковый механизм позволит с легкостью выяснять позицию президента по различным проблемам.

Текстовые расшифровки звукового сопровождения некоторых видеороликов есть и на YouTube,  их тоже можно использовать в качестве субтитров.

Пользователям предоставляется возможность автоматической генерации расшифровки англоязычной речи при загрузке видео на YouTube, правда, результат при этом далеко не всегда оказывается точным. YouTube предлагает и более надежный вариант, когда вместе с видео на сайт можно загрузить собственную текстовую расшифровку, которая затем позволит автоматически переходить в соответствующие точки видео по выбранным ключевым словам.

Специалистам Exalead тоже  есть еще над чем поработать в отношении качества распознавания речи Саркози. Сейчас расшифровки, генерируемые системой, довольно точны, но все же содержат ряд систематически повторяющихся ошибок.

Бета-тестирование Voxalead проходило в течение полугода на сайте создателей системы.

На нем также содержится демонстрация результатов ее работы при расшифровке видеоновостей на английском, французском, китайском, арабском, испанском и русском языках.

Разработка Voxalead проходила при участии сотрудников Французского национального центра научных исследований и компании Vecsys Research, специализирующейся в области систем распознавания речи.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF