В 1994 году он основал компанию Voice Pilot Technologies, а недавно создал Bay Area Science Center (BASC). Редактор InfoWorld Эфраим Шварц в беседе с Грантом попытался выяснить перспективы развития голосовых технологий.

Многих пользователей смущают термины "распознавание речи" и "понимание естественного языка". Не могли бы вы объяснить разницу между ними?

Профессионалы используют термин "моделирование естественного языка". Распознавание речи представляет собой довольно обширное подмножество данной технологии. К этому подмножеству относится все, что связано с речью, в том числе обработка голосовых команд и макросов, которые дополняют команды, вводимые с клавиатуры или при помощи мыши. Модель естественного языка позволяет человеку излагать свои мысли компьютеру в наиболее удобной форме. Компьютер, в свою очередь, должен распознать и выполнить переданные ему команды.

Повлияет ли (и если повлияет, то как) понимание компьютерами естественного языка на деловые процессы?

Допустим, пользователю необходимо прочитать какой-то конкретный файл.

Он просто говорит компьютеру: "Мне нужен файл Jones". В результате машина избавляет человека от выполнения утомительной операции открытия файла - шаг за шагом, через многоступенчатую иерархию меню.

Модель естественного языка - это как раз то, чего давно уже ждут корпоративные заказчики. Ведь данная технология позволяет значительно повысить производительность труда пользователей и упростить компьютерную обработку новых процессов.

Какое влияние технология понимания естественного языка окажет на информационные службы предприятий?

Она позволит уменьшить расходы на информационную систему и ускорить выполнение различных операций, поскольку пользователю достаточно будет всего лишь сказать компьютеру, что в конце концов от него нужно. Для этого вовсе не обязательно заучивать сложные последовательности команд. Не нужно даже знать, какие управляющие элементы отвечают за обработку речевого ввода. В результате пользователи получают возможность выполнить поставленную задачу простым способом. Со справочной системой также можно общаться на естественном языке. Вместо того чтобы обращаться к специалистам информационной службы и запоминать последовательность их действий, достаточно задать интересующий вас вопрос компьютеру, который и представит в наиболее удобной форме все необходимые сведения.

С другой стороны, на этапе перехода к модели естественного языка стоимость приложений увеличится.

И сколько же придется заплатить?

Для того чтобы в полной мере воспользоваться всеми преимуществами технологии обработки речи, нужны высокопроизводительные процессоры. Чем больше мощность центрального процессора, тем быстрее доступ к данным. Чем больше установлено оперативной памяти, тем проще управление приложениями и точнее результат.

А мощности Pentium II достаточно?

Наиболее высокопроизводительные на сегодня процессоры можно взять за точку отсчета. Появление новых процессоров Digital Alpha и процессора Merced с тактовой частотой 400 МГц значительно повысит быстродействие систем обработки речи.

Можете ли вы привести пример повседневного использования ваших технологий?

Настанет день, когда вы сможете прийти на работу и спросить у своего компьютера: "Что новенького?" Компьютер повернется к вам и ответит, что на сегодняшнее утро были назначены две встречи, одну из которых пришлось перенести. Ознакомившись с этими сведениями, можно обратиться к компьютеру с просьбой выдать более подробную информацию по интересующему вас вопросу. При этом вас совершенно не должны интересовать внутренние процессы, происходящие в компьютере. Достаточно задать вопрос, и вы получите ответ.

Поделитесь материалом с коллегами и друзьями