В Оксфордском университете заявили о разработке компьютерной программы, которая читает по губам. Университетские ученые, работая над проблемой, воспользовались технологиями машинного обучения компании DeepMind, ранее приобретенной Google. Чтобы научить свою программу распознавать речь по движению губ, разработчики воспользовались записями телепередач и субтитрами к ним — более 5 тыс. новостных выпусков BBC Breakfast и Newsnight, а также аналитическую передачу Question Time. Программа должна была устанавливать соответствие движений на лице говорящего на записи, аналогичную аудиоинформацию и напечатанный текст. Качество работы программы проверили на фильме без звука, показав его компьютеру и профессиональному чтецу по губам. Искусственный интеллект расшифровал 50% текста, а человек — всего 12%.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF