" - "Я что-то об этом слышал - это плата, которая сама может позвонить человеку и передать информацию". Вопросы очень разные - но речь идет об одном и том же.

Компьютерная телефония - технология, позволяющая интегрировать все услуги, которые можно получить благодаря наличию телефонной линии связи, в единое целое. Технология эта двунаправленная. Во-первых, она позволяет автоматизировать процесс взаимодействия между человеком где-нибудь у телефона и компьютером в офисе. Эта сторона применения компьютерной телефонии поможет упорядочить и облегчить обслуживание входных звонков.

Второе направление - работа с исходящими сообщениями. Можно, например, обзванивать абонентов или рассылать факсимильные сообщения по списку. Можно и заранее записывать сообщения для абонентов, а потом воспроизводить их по телефону.

Помимо этих двух применений, имеющих отношение к взаимодействию офиса с внешним миром, имеется и третье - внутреннее. Средства компьютерной телефонии позволяют устраивать конференции между сотрудниками, переключать внутренние звонки и так далее. Если вернуться к началу, то сразу видно - здесь все, как в старой индийской притче про слона и трех слепцов, один из которых держал слона за ногу, другой за хобот, третий - за хвост.

Продолжим аналогию дальше - у компьютерной телефонии тоже должен быть свой "слон", объединяющий все три направления ее применений.

На Западе уже несколько лет существует телефонно-компьютерная технология под названием "unified messaging". Как это перевести на русский - не совсем ясно. Можно попытаться использовать термин "унифицированная связь", а можно, более вольно, назвать эту технологию "информационная мультимедиа". Почему мультимедиа - станет ясно из дальнейшего.

Идея информационного мультимедиа состоит в следующем. В современном офисе приходится иметь дело с большим количеством разнообразных сообщений, как входящих, так и исходящих. Информационный поток буквально захлестывает сотрудников, и им приходится значительную долю усилий и времени тратить на упорядочение этого потока. И все равно случается, что важная информация теряется (положил секретарь бумагу не в ту ячейку - она и пропала) или ответ на важный запрос отправляется несвоевременно.

Одна из причин состоит в том, что приходящая и исходящая информация разнородна - есть телефонные звонки, есть факсимильные сообщения, письма, сообщения по электронной почте и так далее. Удержать все это в голове крайне трудно, поэтому нужна ОДНА программа, не выходя из которой можно прослушать сообщение голосовой почты, просмотреть факсы, ознакомиться с содержанием электронных писем и ответить на все эти сообщения. Вот это и есть unified messaging, или информационная мультимедиа.

Работа с информационной мультимедиа выглядит следующим образом. На экране компьютера появляются графические меню, соответствующие разным коммуникационным средствам, к которым может быть осуществлен доступ из программы. При этом ИЗ ОДНОГО И ТОГО ЖЕ МЕСТА видны и факс, и электронная почта, и голосовая почта. Очень легко просмотреть, например, ВСЮ переписку с одним и тем же адресатом, независимо от того, в какой форме она велась. Утром, придя на работу, можно сразу увидеть ВСЕ сообщения, полученные за ночь, опять же, независимо от их формы.

Просмотрев, можно немедленно отправить ответы, на ходу решив - кому звонить, кому отправлять факс, а кому посылать электронную почту. И все это - с помощью одной и той же программы, просто выбираются соответствующие пункты из меню. Если для решения проблем, возникающих по ходу дела, необходимо посовещаться с сотрудниками, не надо вставать со своего места - достаточно просто отметить необходимых людей в списке, хранящемся в памяти компьютера.

Кроме того, системы информационной мультимедиа позволяют просматривать пришедшую корреспонденцию, находясь далеко от офиса, - надо просто позвонить по заранее установленному номеру. Система сообщит звонящему о пришедших на его имя сообщениях, зачитает голосовую почту, факсы и электронные письма и сможет воспринять от звонящего, кому и какие сообщения нужно послать (электронные адреса и номера телефонов при этом выбираются из заранее введенного списка).

Информационная мультимедиа - это пример компьютерно-телефонной интеграции, направленной так сказать, вовнутрь организации. Другое направление - наружу, во внешний мир. В первую очередь это относится к организациям, применяющим телефонную связь для оказания различного рода услуг населению. Наиболее простым примером здесь являются справочно-информационные системы.

Пользуясь такими системами, человек может затребовать необходимую ему информацию при помощи системы голосовых меню. Голосовое меню - способ взаимодействия между человеком у телефона и компьютером в офисе. Компьютер "задает человеку вопросы" голосом, а человек отвечает на них, пользуясь своим телефонным аппаратом (набирая соответствующие цифры или комбинации цифр или просто голосом; в последнем случае в дело включается система распознавания речи). Голосовое меню - основа всего диалога: пользуясь им, можно дойти до любой функции обслуживания, имеющейся в системе.

Например, работа справочно-информационной системы на основе компьютерной телефонии где-нибудь в аэропорту может выглядеть следующим образом: человеку зачитывается список действий, которые он в данный момент может выполнить (например, узнать о вылете и прилете рейсов, прослушать общее расписание рейсов определенной компании в определенный промежуток времени и так далее). Подав соответствующую команду, человек переходит к следующему меню. В какой-то момент ему выдается необходимая информация (если речь идет о расписании с большим числом рейсов, он может затребовать высылки ему соответствующей информации по факсу).

На Западе, особенно в США, технология компьютерной телефонии применяется настолько широко, что трудно даже найти компанию, позвонив в которую вам не придется вначале столкнуться с компьютерным диспетчером. Американцы даже смеются на эту тему. - В популярном мультфильме: герой звонит в полицию, чтобы сообщить о нападении, а в ответ слышит что-то вроде: "Здравствуйте! С вами говорит компьютер полицейского участка. Наберите "0", если вас убивают, "1" - если грабят..."

Я Вас знаю!

Продвижение компьютерной телефонии на российский рынок сдерживается одним весьма существенным обстоятельством: вся эта технология рассчитана прежде всего на работу с тоновым набором номера, и все стандартные решения предусматривают именно эту систему. А в России принята другая система набора - импульсная. Поэтому надо либо использовать специальные платы, воспринимающие им пульсивный набор номера, либо пользоваться системами распознавания речи для телефонного взаимодействия с компьютером.

Основным мировым производителем аппаратных средств для систем компьютерной телефонии является американская компания Dialogic. Помимо прочего, Dialogic производит специальные платы для распознавания голоса - как в режиме speaker-dependent, так и в режиме speaker-independent. Для создания систем компьютерно-телефонной интеграции нужны оба. Первый предоставляет возможность "хозяину" информационного мультимедиа легко общаться с ней по телефону, отдавая голосом необходимые команды (одновременно гарантируется, что системой не сможет воспользоваться никто другой - компьютер просто "не узнает его по голосу"). Режим speaker-independent (в котором распознаются только числительные и четыре-пять простых слов, например: "да, "нет" и другие) позволяет постороннему абоненту обращаться к системе голосовой почты и работать с голосовым меню системы.

Проблема распознавания голоса популярна и на Западе. Правда, там, в отличие от России, распознавание является просто дополнительным удобством. Тем не менее, на последней всемирной выставке телекоммуникационных технологий Telecom-95, где компьютерной телефонии был отведен целый павильон, ощущался большой интерес к этой технологии. Наиболее продвинутыми поставщиками технологий в этой области на Западе являются компании Lernout & Hospie Speech Products, Voice Control Systems и Voice Processing Corporation.

В российских условиях работа над системами компьютерной телефонии на основе распознавания голоса имеет свою специфику. Во-первых, это связано с низким качеством телефонных линий. Однако проблема не только в этом. Дело осложняется еще и тем, что средства разработки приложений, имеющиеся на рынке, рассматривают распознавание голоса именно как дополнительное удобство, а не как основное средство взаимодействия абонента с системой. Работы над этой проблемой уже ведутся. Например, компания CompTek International, российский дистрибьютор Dialogic, недавно продемонстрировала работу системы компьютерной телефонии на основе распознавания голоса в режиме speaker-independent. Использование подобной техники позволит российским пользователям получить доступ ко всем возможностям интегрированных телефонно-компьютерных систем, которые могут существенно облегчить жизнь всем деловым людям.


Александр Крейнис - научный сотрудник Института кристаллографии РАН, с ним можно связаться по телефону: (095) 334-2913.

Поделитесь материалом с коллегами и друзьями