Определение местонахождения нужного фрагмента видеозаписи - одна из непростых задач автоматического поиска. Свое решение этой задачи предлагает французская компания Exalead, соответствующая система которой установлена на сайте президента Франции Николя Саркози.
Созданный в Exalead механизм поиска по видео- и аудиофайлам получил название Voxalead. Он действует, автоматически конвертируя речь, звучащую в записи, в текст.
Отныне благодаря Voxalead у посетителей сайта Elysee.fr появилась возможность выполнять поиск по всем хранимым на нем записям выступлений и пресс-конференций Саркози, вводя ключевые слова. Система выполняет переход в точности в то место видео, где президент их произносит. Сделанные системой расшифровки можно накладывать на видео в качестве субтитров.

Механизм поиска Voxalead действует, автоматически конвертируя речь, звучащую в записи, в текст

Как указывают в Exalead, поисковый механизм позволит с легкостью выяснять позицию президента по различным проблемам.
Текстовые расшифровки звукового сопровождения некоторых видеороликов есть и на YouTube,  их тоже можно использовать в качестве субтитров. Пользователям предоставляется возможность автоматической генерации расшифровки англоязычной речи при загрузке видео на YouTube, правда, результат при этом далеко не всегда оказывается точным. YouTube предлагает и более надежный вариант, когда вместе с видео на сайт можно загрузить собственную текстовую расшифровку, которая затем позволит автоматически переходить в соответствующие точки видео по выбранным ключевым словам. 
Специалистам Exalead тоже  есть еще над чем поработать в отношении качества распознавания речи Саркози. Сейчас расшифровки, генерируемые системой, довольно точны, но все же содержат ряд систематически повторяющихся ошибок.
Бета-тестирование Voxalead проходило в течение полугода на сайте создателей системы. На нем также содержится демонстрация результатов ее работы при расшифровке видеоновостей на английском, французском, китайском, арабском, испанском и русском языках.
Разработка Voxalead проходила при участии сотрудников Французского национального центра научных исследований и компании Vecsys Research, специализирующейся в области систем распознавания речи.

Поделитесь материалом с коллегами и друзьями