Сайты смогут поддерживать настоящий голосовой диалог с пользователем, распознавая сказанное им и давая ответы. Эти функции станут стандартными, если «инкубаторная» группа консорциума World Wide Web даст добро на разработку для языка HTML, на котором пишется исходный код страниц сайтов, функций распознавания и синтеза речи. В работе группы принимают участие специалисты из AT&T, Google, Microsoft, Mozilla Foundation и других компаний.

В W3C уже был разработан другой стандарт для реализации голосовых функций в сети под названием VoiceXML. Недавно опубликована его третья версия. Однако VoiceXML предназначен скорее для приложений, управляемых голосом – например, для телефонных систем с голосовым интерфейсом, где и используется в настоящее время. Для веб-страниц VoiceXML подходит не очень хорошо, считают участники рабочей группы. Голосовые функции HTML, как и сам язык HTML, должны быть бесконтекстными, то есть не требовать наличия постоянного канала связи пользователя с сервером.