Разрабатываемая в Microsoft технология распознавания голоса впервые достигла уровня, аналогичного человеческому. Для проверки результатов использовался тест Switchboard («Коммутатор») — это общепринятый в индустрии языковой корпус, на котором испытывают работу машинного распознавания английской речи. Он состоит из записей разговоров нескольких человек на определенные темы. Существует и другой, более сложный тест, он называется CallHome («Звонок домой»), где собеседников больше, а тема разговора не задана. В нем нейросетям пока что лишь предстоит сравняться с человеком: частота ошибок машинного распознавания речи Microsoft здесь еще превышает 10%, но, учитывая темпы прогресса в этой области, она тоже скоро может приблизиться к результатам человека.

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF