Объединение голоса и данных

Использование одной и той же сети для передачи голоса и данных позволяет сократить расходы при условии правильного выбора стратегии интеграции.

РЕВОЛЮЦИЯ T-1

МЕЛИ, ЕМЕЛЯ

FRAME RELAY

ШВЕЙЦАРСКИЕ ЧАСЫ

НА ГОРИЗОНТЕ

ЗА РАЗЪЯСНЕНИЯМИ ОБРАЩАТЬСЯ...

ОЦИФРОВКА ГОЛОСА
Развивающаяся технология

При традиционном подходе к телекоммуникациям, сети для передачи голоса и данных рассматриваются (и реализуются) совершенно независимо друг от друга. К сожалению, это приводит к большим затратам, поскольку для эксплуатации двух разных сетей и поддержания их в работоспособном состоянии требуются многочисленный персонал и значительные вложения в оборудование. Использование одной и той же сетевой инфраструктуры для передачи голоса и данных обеспечивает значительную экономию материальных ресурсов, а сама эта идея способна вызвать радостную улыбку у самого сурового директора по финансам.

За последние несколько лет было предложено несколько путей решения этой задачи, так что организации могут выбрать тот из них, который в наибольшей степени отвечает их практическим задачам и финансовым возможностям.

Ниже приводится обзор различных подходов к проблеме с их достоинствами и недостатками.

РЕВОЛЮЦИЯ T-1

В 80-е годы появились мультиплексоры для линий T-1 и специально разработанные для них платы оцифровки речи. Они стали одной из первых аппаратных платформ для интеграции голоса и данных в частных сетях. В настоящее время использование мультиплексоров T-1 - один из наиболее распространенных способов передачи трафика двух типов по одной и той же сети. Прежде чем обсуждать мультиплексоры T-1, мы рассмотрим вкратце принципы работы линий T-1.

Линия T-1 обеспечивает одновременную передачу 24 голосовых переговоров между двумя станциями оператора сети связи (Carrier Office, CO). Голосовой сигнал оцифровывается посредством импульсно-кодовой модуляции, или ИКМ (Pulse Code Modulation, PCM). Это соответствует потоку данных интенсивностью в 64 Кбит/с для каждого телефонного разговора (при работе по методу ИКМ, звуковой сигнал дискретизируется 8000 раз в секунду, а значение его мгновенной амплитуды выражается 8-битным числом - получается 8000 байт в секунду, или 64 Кбит/с). Банки каналов - прототипы современных мультиплексоров для T-1 - преобразуют 24 телефонных разговора в последовательность из 24-х 8-битных чисел 8000 раз в секунду для каждого разговора. Для синхронизации работы передающего и принимающего устройства, а также для выделения разговоров из общего потока данных, передаваемого по линии T-1, к каждой группе из 24-х 8-битных чисел добавляется один бит обрамления, что дает последовательность из 193 бит (24х8 плюс единица). Таким образом, пропускная способность линий T-1 должна равняться 24 (количество 8-битных чисел, представляющих амплитуду голосового сигнала), помноженным на 8 бит, плюс один бит обрамления, и все это надо еще умножить на 8000 (раз в секунду) - получаем 1,544 Мбит/с.

Мультиплексор T-1 позволяет задействовать всю доступную пропускную способность 1,536 Мбит/с для передачи голоса и данных. Однако многим организациям для передачи всей необходимой информации не хватает одной линии T-1. Уменьшить число необходимых каналов можно с помощью модулей оцифровки речи для мультиплексоров T-1. Они позволяют снизить интенсивность потока данных, генерируемого при оцифровке речевых переговоров, тем самым увеличивая число вызовов, передаваемых от одной станции к другой. Снижение пропускной способности, резервируемой под передачу голоса, позволяет либо избежать использования нескольких линий T-1, либо отвести для передачи видео и данных более значительную часть линии T-1. (Обзор различных методов оцифровки речи и требования к пропускной способности приведены во врезке "Развивающаяся технология".)

Из Рисунка 1 видно, насколько разнообразно применение мультиплексоров T-1: они позволяют интегрировать приложения передачи голоса, данных и видео в одной и той же сетевой инфраструктуре. На Рисунке изображена частная сеть, содержащая большое число узлов, соединенных линиями T-1; детально показано подключение к сети узла, находящегося в Лос-Анджелесе. На этом узле используются специальные модули оцифровки речи, обеспечивающие сжатие 24 каналов PCM, которые, если бы этих модулей не было, заняли бы линию T-1 целиком. Предположим, что применяется оцифровка по одной из версий метода CELP (Code Excited Linear Prediction), обеспечивающей сжатие 64-килобитного временного слота PCM в 8 Кбит/с. Благодаря чему 24 речевых вызовов можно передать по каналу с пропускной способностью 192 Кбит/с вместо 1,536 Мбит/с. Если еще использовать сжатие данных, то 12 из оставшихся 64-килобитных временных слотов (т. е. пропускную способность 768 Кбит/с) можно отвести для обмена данными между локальными сетями Ethernet через маршрутизаторы. Далее, шесть 64-килобитных временных слотов (384 Кбит/с) можно отвести под видеоконференцию, а оставшиеся 192 Кбит/с (три временных слота) - для обмена данными между системами SNA.

Picture_1 (1x1)

Рисунок 1.
Использование мультиплексоров T-1 с модулями для оцифровки речи позволяет сузить пропускную способность, необходимую для передачи речи. При этом удается увеличить либо число одновременных вызовов, либо долю пропускной способности линии, выделяемую под передачу данных и видео.

Итак, модули CELP позволяют значительно смягчить требования к пропускной способности. Однако и стоят они недешево. Например, модуль CELP-24 от Network Equipment Technology, поддерживающий 24 канала, стоит 25 000 долларов. Таким образом, за пару мультиплексоров, необходимых для организации связи между двумя офисами, придется заплатить 50 000 долларов. Цифра сама по себе не маленькая, однако срок окупаемости подобного вложения составит 10 месяцев (чувствуете, как обрадуется финдиректор). Например, если использование модулей CELP позволит отказаться от аренды дополнительных линий T-1 между Лос-Анджелесом и Нью-Йорком, то экономия средств может достичь (и даже превысить) 5000 долларов в месяц. (В наших оценках мы исходили из того, что стоимость линии T-1 составляет примерно от 2 до 3 долларов за милю в месяц. Реальная стоимость зависит от расценок конкретного оператора сети связи и условий заключаемого соглашения. Как правило, чем больше срок контракта, тем меньше ежемесячные платежи, однако долгосрочный контракт ограничивает свободу выбора.)

МЕЛИ, ЕМЕЛЯ

Мультиплексоры T-1 - довольно популярная техника для интеграции голоса, данных и видео, однако далеко не все организации нуждаются в передаче таких объемов информации, при которых использование каналов T-1 оказалось бы оправданным. С другой стороны, большой энтузиазм вызывает тот факт, что применение алгоритмов сжатия типа CELP (благодаря которому голос удается сжимать до 8 Кбит/с и менее) позволяет использовать для передачи голоса сети, изначально рассчитанные на передачу данных. За последние годы были разработаны устройства, обеспечивающие передачу голоса по frame relay, низкоскоростным арендованным линиям вроде Switched-56 и даже сетям на основе IP, в частности через Internet.

Движущей силой интеграции являются экономические соображения: применение любого из вышеперечисленных подходов позволяет значительно сократить расходы. Насколько ощутима экономия, зависит от целого ряда параметров, среди которых - стоимость оборудования для оцифровки речи и размеры ежемесячных платежей за низкоскоростные арендованные линии, а также тип используемой для передачи сети (например, frame relay или Internet). Следует также принять во внимание частоту телефонных вызовов и продолжительность переговоров. Простые расчеты показывают, что стоимость речевых переговоров по сети frame relay или корпоративной IP-сети составляет менее цента в минуту. Согласитесь, это не слишком дорого; во всяком случае, администратор, добившийся такого результата, будет не без гордости ловить на себе завистливые взгляды коллег.

Особенно большой шум был поднят вокруг Internet-телефонии, поскольку именно эта технология обеспечивает наибольшую экономию. Однако конкретные реализации технологии "голос поверх IP", в основном, связаны с частными IP-сетями, поскольку в данном случае распределением пропускной способности можно управлять. Кроме того, в рамках частных сетей значительно упрощается решение проблем производительности и защиты информации, возникающих при организации виртуальных сетей на основе Internet. Ниже приводится обзор подходов к передаче речи через сеть передачи данных.

FRAME RELAY

Для передачи оцифрованной речи по сетям frame relay требуется специальная аппаратура: обычные устройства доступа к frame relay (Frame Relay Access Device, FRAD) для этой цели не годятся. Конечно, ничто не мешает просто подключить к портам FRAD один или несколько цифровых потоков, содержащих оцифрованную речь, и сконфигурировать устройство таким образом, чтобы эти потоки воспринимались просто как синхронные входные данные. Однако при этом передаче речевой информации будут "мешать" проходящие через устройство другие синхронные и асинхронные потоки данных.

Рассмотрим ситуацию, когда кто-то из пользователей локальной сети инициализирует загрузку файлов с сервера другой локальной сети, а кто-то одновременно с этим отправляет запросы к приложению, работающему на удаленном сервере: все эти пакеты проходят через тот же самый FRAD, который занимается и передачей кадров данных с оцифрованной речью. В результате между кадрами данных с оцифрованной речью могут вклиниться содержащие межсетевой трафик кадры переменной длины. При приеме переменные интервалы между кадрами приведут к появлению значительных пауз в восстановленной речи, и качество звука будет, мягко говоря, невысоким.

Чтобы решить возникшую проблему, компания ACT Networks разработала устройство под названием Integrated FRAD, или IFRAD, позволяющее сократить разрывы между кадрами за счет ограничения размеров всех отправляемых в сеть кадров. Фрагментация пакетов данных сглаживает негативное влияние разрывов на передачу голоса и факсимильных сообщений. При этом некоторый разброс по времени поступления пакетов с оцифрованной речью еще остается, однако устройство IFRAD компании ACT Networks обеспечивает дополнительное повышение качества передачи речи за счет использования очередей с приоритетами и буферов для подавления дрожания речи (jitter buffer).

IFRAD распределяет все поступающие сигналы по трем, имеющим разные приоритеты очередям, благодаря чему чувствительные к задержке речевые пакеты поступают в сеть frame relay раньше всех прочих пакетов. Поскольку размеры очередей конечны, а большинство абонентов сети frame relay общего доступа не могут, как правило, управлять задержками в сети, к моменту прибытия в пункт назначения речевые пакеты (в лучшем случае) не будут следовать с теми же временными интервалами, как это было в момент передачи. Решить эту проблему помогает настраиваемый буфер для подавления дрожания речи, обеспечивающий сглаживание интервалов между пакетами, в результате чего воспроизводимая речь звучит гладко и без пауз.

IFRAD можно сконфигурировать таким образом, чтобы все данные, поступающие через определенный порт или канал, упаковывались в пакеты с выставленным битом разрешения на отбраковку (discard eligibility). В результате администратор сети может сам решить, для каких приложений допустимы задержки; в случае затора в сети этим приложениям придется передавать данные повторно.

Еще одно важное свойство IFRAD - поддержка технологии Digital Speech Interpolation (DSI) - позволяет использовать паузы в одном разговоре для передачи речи, относящейся к другому разговору. Применение технологии DSI, которую иногда называют также подавлением молчания, может вдвое сократить необходимую пропускную способность. В качестве опции эта технология используется также во многих мультиплексорах T-1.

ШВЕЙЦАРСКИЕ ЧАСЫ

Обсуждение проблем передачи голоса по каналам глобальной сети нельзя считать полным без упоминания о семействе устройств, которое для многих служит таким же эталоном в телекоммуникациях, как швейцарские часы для часовщиков. Речь идет о мультиплексорах Marathon компании Micom. Эти устройства можно использовать для интеграции голоса, данных и факсимильных сообщений по арендованным линиям или сетям frame relay. Мультиплексоры представляют собой модульные устройства, способные поддерживать до 30 речевых и факсимильных каналов, до 41 асинхронного и 12 синхронных каналов обмена данными. Поступающую на вход информацию можно передавать по трем арендованным линиям или четырем соединениям frame relay. Компания Micom первой из производителей реализовала сжатие речи по стандарту ITU G.729 и первой стала применять подавление молчания. При совместном использовании этих двух технологий пропускную способность в расчете на один речевой канал удается довести до 4 Кбит/с.

Большое внимание привлек к себе продукт V/IP Phone/Fax Gateway - недавнее пополнение семейства продуктов Micom. Акроним V/IP в наименовании означает Voice over IP. Это набор аналоговых и цифровых интерфейсных плат, позволяющих осуществлять бесплатный речевой обмен и пересылку факсимильных сообщений по частной IP-сети. Для этого платы надо установить в персональные компьютеры в филиалах (по одному компьютеру на каждый филиал) и в один ПК в центральном офисе компании. Далее все платы следует подключить к соответствующим УАТС.

На Рисунке 2 показано, каким образом можно использовать V/IP Phone/Fax Gateway для передачи оцифрованных речевых переговоров по частной IP-сети. В рассматриваемом примере УАТС необходимо запрограммировать таким образом, чтобы вызовы переключались на V/IP Gateway при наборе определенного входного номера, скажем "5". Далее вызывающий абонент должен набрать внутренний номер нужного ему филиала и добавочный номер вызываемого сотрудника. Получив набранный номер, V/IP Gateway обращается к базе данных, транслирует набранный номер в IP-адрес и устанавливает соединение с удаленным V/IP Gateway. После чего пакеты с оцифрованным голосом передаются по локальной сети на маршрутизатор для передачи через глобальную сеть.

Picture_2

Рисунок 2.
Продукт V/IP Phone/Fax Gateway обеспечивает передачу оцифрованных речевых переговоров по частной IP-сети.

Продукт V/IP Gateway поддерживает протокол RSVP, обеспечивающий резервирование определенной пропускной способности в IP-сети для приоритетной передачи чувствительного к задержкам трафика (например, оцифрованной речи). В принципе поддержка RSVP позволяет рассчитывать на использование V/IP Gateway для передачи голоса через Internet; неясно, однако, каким образом провайдеры будут взимать плату за резервирование пропускной способности, и в итоге появление таких приложений может несколько задержаться. Пока эта и подобные ей проблемы не решены, область использования V/IP Gateway и аналогичных продуктов будет сводиться к частным IP-сетям, где администратор может в значительно большей степени управлять распределением пропускной способности и защитой информации.

Чтобы понять, насколько сильно применение V/IP Gateway может сэкономить средства организации, проделаем ряд несложных вычислений. Двухпортовая плата V/IP стоит 1540 долларов. Поскольку на ней имеется свой собственный процессор, в качестве платформы можно использовать старый 486-й компьютер или любую систему на базе Pentium. Добавим 1500 долларов за ПК; с учетом стоимости платы общие затраты на точку составят 3040 долларов. Допустим, некто собирается передавать речь по IP-сети между Сан-Франциско и Нью-Йорком - организация такого канала обойдется в 6080 долларов.

Пусть, например, каждый из портов платы используется для речевого обмена 30 минут в день; в результате продолжительность переговоров по коммутируемой телефонной сети удается сократить на 60 минут в день. В расчете на 22 рабочих дня в месяц получаем 1320 минут ежемесячно. Небольшой или средней компании при цене междугородных переговоров в рабочее время примерно 15 центов в минуту использование V/IP Gateway позволяет сэкономить 198 долларов в месяц, или почти 2400 долларов в год. Получается, что за год сделанные вложения окупятся на 40% - да возрадуется твое сердце, о финдиректор!

Вышеприведенные подсчеты базировались на ряде допущений. Не следует забывать, что работа с речевым трафиком в течение всего одного часа в день составляет лишь шесть с небольшим процентов от максимально возможной нагрузки на двухпортовую плату V/IP Gateway в расчете на восьмичасовой рабочий день. Удвоив нагрузку на V/IP Gateway (доведя ее до 12,5%), получаем 80-процентную окупаемость в течение года. Хотите, чтобы финдиректор от радости пошел по своему кабинету вприсядку? Предложите ему установить парочку V/IP Gateway на международной линии.

НА ГОРИЗОНТЕ

Технология передачи речи по глобальным сетям развивается очень быстро. На горизонте маячит много разнообразных новшеств. Не так давно Frame Relay Forum утвердил документ под названием Voice over Frame Relay Implementation Agreement, где сформулированы стандарты для передачи голоса по сетям frame relay с общим доступом. В данном соглашении имеются также рекомендации для производителей, следуя которым они могут выпускать совместимые продукты. В связи с этим широкого распространения Internet-телефонии можно ожидать скорее, чем казалось еще совсем недавно.

ЗА РАЗЪЯСНЕНИЯМИ ОБРАЩАТЬСЯ...

Имея доступ к Internet, вы можете сами получить информацию о появляющихся стандартах, а также рабочие характеристики оборудования для передачи голоса по сетям IP и frame relay. Текст документа FRF.11, содержащего Voice over Frame Relay Implementation Agreement, находится на Web-узле Frame Relay Forum (www.frforum.com). Можно привести адреса еще парочки-тройки интересных узлов Web, где приведены технические описания продуктов для передачи голоса по сетям IP и frame relay с рекомендациями по их использованию: www.acti.com (ACT Networks), www.fastcom.com (Fast Comm Communications), www.micom.com (Micom Communications).

Джилберт Хелд - известный автор и лектор, получивший ряд наград за свои статьи. Недавно в издательстве John Wiley&Sons вышли такие его книги, как "Virtual LANs", "Ethernet Networks", "The Complete Modem Reference", "LAN Performance: Issues and Answers", а также "LAN Testing and Troubleshooting". С ним можно связаться через Internet по адресу: 235-8068@mcimail.com.

ОЦИФРОВКА ГОЛОСА

Развивающаяся технология

Все методы оцифровки речи можно разделить на две категории: кодеры формы сигнала и вокодеры. Методами кодировки формы сигнала (к которым, в частности, относится и импульсно-кодовая модуляция) осуществляется прямая оцифровка аналогового голосового сигнала путем периодического измерения его амплитуды с последующим округлением полученного значения до числа из заранее заданного дискретного набора. Данная процедура носит название дискретизации; разность между истинным значением аналогового сигнала и получаемым дискретным значением представляет собой ошибку дискретизации.

Вокодеры, напротив, основаны на моделировании человеческой речи с учетом ее характерных особенностей. Вместо непосредственного измерения амплитуды вокодер преобразует входной сигнал в некий другой, похожий на исходный. Причем измеряемые характеристики речевого сигнала используются для подгонки параметров в принятой модели речевого сигнала. Именно эти параметры и передаются приемнику, который по ним восстанавливает исходный речевой сигнал. По существу, здесь речь идет о синтезе речи.

Импульсно-кодовая модуляция - основной метод оцифровки речи при передаче ее по коммутируемой телефонной сети общего доступа. Тем не менее нигде не сказано, что при передаче голоса по частным или общедоступным сетям передачи данных (например, frame relay) нельзя использовать другие, более экономичные методы. За последние 30 лет был разработан целый ряд методов кодировки речи. Одной из первых производных ИКМ стал метод адаптивной дифференциальной импульсно-кодовой модуляции - АДИКМ (Adaptive Differential PCM, ADPCM). В основе АДИКМ лежит оцифровка речи по методу ИКМ, однако далее используется предположение, что амплитуда сигнала не может сильно измениться за период от одного измерения до другого. Вместо того чтобы кодировать каждое значение амплитуды восьмибитным словом, в АДИКМ вычисляется разность между предполагаемым и фактическим значением, а получившееся число кодируется четырехбитным словом. Принимающей стороной это четырехбитное число складывается с вычисленным по точно такому же алгоритму предполагаемым значением, и в результате удается воспроизвести амплитуду голосового сигнала. Метод АДИКМ был стандартизирован ITU в Recommendation G.721; его использование позволяет ограничиться каналом на 32 Кбит/с для передачи одного речевого вызова.

Еще один популярный метод кодирования формы сигнала - дельта-модуляция с непрерывно меняющейся крутизной (Continuously Variable Slope Delta Modulation, CVSD). Этот метод кодировки изначально применялся в военных целях, поскольку его использование упрощает шифрование аналогового сигнала. В CVSD каждое измеренное значение сравнивается с неким опорным сигналом. Если уровень речевого сигнала выше опорного, то это состояние кодируется как "1", если ниже - "0". В первых военных образцах оборудования сигнал оцифровывался 8000 раз в секунду, в результате получался поток данных интенсивностью 8 Кбит/с, поскольку для кодировки каждого значения использовался один бит. В современных цифровых модулях CVSD, предназначенных для мультиплексоров T-1, оцифровка производится чаще, а значит, для передачи оцифрованных переговоров может потребоваться пропускная способность 12 Кбит/с, 16 Кбит/с или 24 Кбит/с.

В одном из популярных вокодеров, носящем название вокодер с линейным предсказанием (Linear Predictive Vocoder, LPV), используется метод линейного предсказания, благодаря которому удается добиться более естественного звучания синтезируемого голоса. Применявшиеся в прошлом методы вычисления параметров моделей не обеспечивали высокого качества воспроизведения голоса, да и сами эти модели были не совершенны.

Именно в LPV впервые стали анализироваться относительно длительные (20 миллисекунд) речевые фрагменты, по которым вычисляются необходимые коэффициенты предсказания. Значения этих коэффициентов затем дискретизируются и передаются на приемник, который синтезирует по ним исходный речевой сигнал.

На основе алгоритмов линейного предсказания и последних достижений в цифровой обработке сигнала был разработан ряд методов линейного предсказания, дающих низкоинтенсивные цифровые потоки и при этом обеспечивающих высококачественную передачу речи. Одним из таких методов является вокодер с линейным предсказанием в соответствии с кодом (Code Excited Linear Prediction, CELP), в котором речевые фрагменты сопоставляются с заранее заготовленными элементами кодовой таблицы; для кодировки используется элемент, дающий минимальную невязку. Вокодер CELP, рассчитанный на 4,8 Кбит/с, описан в федеральном стандарте США 1016, а его модификация, носящая название Conjugate-Structure Algebraic Code Excited Linear Prediction (CS-ACELP), в ноябре 1995 года была стандартизирована ITU в документе под названием ITU Recommendation G.729. В соответствии с этим документом коммерческое качество передачи речи достигается при скорости передачи данных в 8 Кбит/с.

Другая разновидность LPV - алгоритм Low Delay-Code Excited Linear Prediction (LD-CELP), позволяющий обеспечить коммерческое качество передачи речи по каналу 16 Кбит/с. Алгоритм был стандартизирован в документе ITU Recommendation G.728. Другие версии LPV гарантируют коммерческое качество передачи речи по каналу 6,3, 4,8 или 2,4 Кбит/с.