В Intel разрабатывается набор программных функций для систем аудиовизуального распознавания речи — Audio Visual Speech Recognition (AVSR). Цель проекта — повышение точности компьютерного распознавания речи в сложных условиях, в частности при наличии сильного фонового шума. AVSR синхронизирует информацию, поступающую с подключенной к компьютеру видеокамеры, со звуковыми данными, как бы «читая по губам» говорящего. AVSR входит в состав библиотеки с открытым кодом OpenCV, представляющей собой инструментарий для разработки систем «компьютерного зрения», и реализующей ряд алгоритмов интерпретации мимики лица.

Поделитесь материалом с коллегами и друзьями