Соглашения об уровне сервиса с провайдерами услуг глобальной сети оговаривают конкретные характеристики работы сети. Как проверить, что вы получаете то, за что платите?

Заказчики могут без труда составить себе впечатление о качестве обслуживания, которое они получают в случае выделенных линий на базе TDM, таких, как T-1/E-1. Коммутируемый канал либо доступен, либо нет, и он либо передает биты с заданной скоростью, либо вообще их не передает. В этой ситуации соглашения об уровне сервиса оговаривали бы главным образом доступность линии.

С другой стороны, сети с коммутацией кадров и ячеек — иными словами, frame relay и ATM, основные на сегодняшний день сети виртуальных каналов, — не резервируют определенных интервалов времени для конкретного заказчика, как TDM. Стоимость канала связи может быть, таким образом, распределена между несколькими заказчиками, причем они могут даже платить только за объем передаваемых данных или по крайней мере за конкретные услуги, а не как в случае выделенной линии — за линию целиком.

Однако, даже в случае наиболее добросовестных провайдеров услуг, неизбежной платой за разделяемый канал связи является потенциальная опасность периодических перегрузок. Менее добросовестные провайдеры, по своей некомпетентности или жадности, усугубляют эту опасность, когда набирают больше абонентов, чем позволяют их ресурсы, в надежде, что никто этого не заметит.

Если провайдеры услуг заключают соглашения об уровне сервиса (Service Level Agreement, SLA) со своими заказчиками, где оговариваются предельные значения для доступности (точнее, недоступности) услуги, доли потерянных данных и задержки, тогда наличие системы для контроля этих параметров является обязательным — у заказчика нет никакого иного способа проверить, как провайдер выполняет условия соглашения. Получать информацию в реальном времени о перегрузке, потере данных, задержке и отсутствии доступа — в интересах провайдера, так как в этом случае он имеет возможность вовремя предпринять меры при первых признаках опасности. Мониторинг в реальном времени позволяет также провайдерам услуг собирать статистические данные о функционировании сервиса, на основании которых они могут при необходимости предоставить заказчику отчет о качестве обслуживания.

Кстати, как правило, заказчики требуют такие отчеты от провайдера, так как для них это часто единственный способ убедиться, что они не зря платят ему деньги. Кроме того, отчеты об утилизации сети нужны заказчикам для выяснения адекватности услуги, в частности недостаточности или чрезмерности пропускной способности, т. е. соответствия/несоответствия его реальным потребностям.

Однако возможны ситуации, когда провайдеры услуг не могут или не желают предоставлять заказчику запрашиваемую им информацию или когда у заказчика есть основания не доверять цифрам провайдера. Кроме того, иногда провайдер услуг глобальной сети перекладывает вину на разработчиков приложения, так что определить, кто действительно виноват, нет никакой возможности.

В таких случаях у заказчиков нет иного выбора, как установить собственные измерительные системы. В конце концов, даже простые услуги frame relay со сравнительно небольшой пропускной способностью обходятся в несколько тысяч долларов в год, а услуги T-3 и OC-3 ATM могут вообще стоить несколько тысяч долларов в месяц. Компании платят такие суммы только потому, что эти сетевые каналы обеспечивают их деятельность. Во многих случаях вложения в оборудование и программное обеспечение для мониторинга и подготовки отчетов окупаются уже через полгода.

МНОГОЧИСЛЕННЫЕ РАЗЛИЧИЯ МЕЖДУ ПРОДУКТАМИ

Возможно, первое, на что надо обратить внимание при выборе средств мониторинга характеристик глобальной сети, — это краткосрочность или долгосрочность задач диагностирования. Анализаторы протоколов с надлежащими интерфейсами производства Network Associates, Shomiti Systems, Hewlett-Packard, GN Nettest, Wandel and Goltermann и других способны осуществлять мониторинг трафика frame relay или ATM и собирать достаточно большой объем необработанной информации. Специализированный инструментарий, в частности ATM Analyzer от Fluke и разнообразные предложения HP Test and Measurement Division, также предназначен для мониторинга глобальных сетей, диагностирования проблем и, по крайней мере в теории, проверки соответствия уровня сервиса заявленному.

Подобные диагностические средства стоят весьма дорого, в особенности если они предназначены для скоростей свыше T-1/E-1. Как правило, компании используют их для диагностирования возникших проблем, а не для постоянного мониторинга уровня сервиса.

Далее, даже если ваши специалисты знают, как использовать эти средства для мониторинга уровня сервиса и составления отчетов, их программное обеспечение не всегда оптимизировано для генерации отчетов и размещения их в Web. Такой инструментарий иногда незаменим для выявления причин нетипичных проблем, до которых другие средства не в состоянии докопаться, но все же анализаторы протоколов и специализированные тестеры больше подходят для оперативного диагностирования, нежели для постоянного мониторинга уровня сервиса.

Второе различие касается периода времени, за который они составляют свой отчет. Некоторые продукты предназначены для составления статистических отчетов, т. е. они пополняют базу данных о характеристиках сети с течением времени и поддерживают запросы, печатные отчеты и публикацию статистики в Web как для указанных групп, так и для предприятия в целом. Эти отчеты полезны, в частности, для проверки выполнения SLA. Кроме того, они оказывают существенную помощь в определении типичных характеристик, планировании емкости и необходимого бюджета и распределении ресурсов.

С другой стороны, некоторые продукты способны выполнять мониторинг в реальном времени, предоставляя диагностическую информацию эксплуатационникам. Эти продукты также поддерживают запросы к создаваемым ими базам данных и составление отчетов на основании содержащейся в них информации. Однако с точки зрения обслуживания более важное значение имеет то, что продукт способен генерировать тревожные сообщения при наступлении событий и изменении состояния канала глобальной сети и подавать предупреждения на основании анализа пополняемой базы данных. Средства мониторинга реального времени нужны прежде всего оператору — конечные пользователи вряд ли будут предпринимать какие-либо действия по исправлению ситуации, если только они сами не являются владельцами глобальной сети.

Никакие измерения невозможны без измерительной аппаратуры. Здесь, опять же, мы сталкиваемся со множеством классов продуктов, каждый из которых имеет свои преимущества. Для frame relay большинство крупнейших производителей DSU/CSU выпускают продукты с поддержкой SNMP. Другой возможный вариант — пассивный зонд глобальной сети, обычно он устанавливается между DSU/CSU (или маршрутизатором со встроенным DSU/CSU) и точкой входа в сеть провайдера услуг. (В ATM DSU/CSU обычно не используется, но, например, NetScout производит зонд ATM, устанавливаемый между портом ATM в помещении заказчика и точкой входа в сеть провайдера.)

Конечно, те прогрессивные операторы, кто разрешает заказчикам доступ к тем же самым программному обеспечению и статистике, которые они используют для биллинга и мониторинга SLA, оснащают свою сеть измерительной аппаратурой по другую сторону от точки входа.

Если у вас нет зонда или агента в точке входа, то вы все же имеете возможность получить информацию о каналах глобальной сети либо от SNMP-совместимых портов маршрутизатора или коммутатора, либо от зондов RMON на магистрали локальной сети. В случае, если скорость каналов не превышает Т-1/Е-1, данные о доступности в состоянии предоставить даже программный агент на сервере. Однако в общем случае получить подробную, независимую, достоверную информацию о функционировании канала можно только при установке измерительной аппаратуры в непосредственной близости от точки входа. Если между измерительной аппаратурой и каналом глобальной сети имеется маршрутизатор, то вы не сможете получить точные данные о конкретных виртуальных каналах, задержке, перегрузке и потерянных пакетах.

Приложения для измерения производительности собирают данные от агентов SNMP посредством их постоянного опроса. Зонды RMON способны обрабатывать и хранить управляющие данные самостоятельно, но приложение управления должно забрать их прежде, чем у них будет заполнена вся свободная память. Результаты опроса помещаются приложением управления в базу данных. Механизм составления отчетов часто имеет в качестве дополнения сервер Web и поддерживает незапрограммированные запросы, а также вывод в виде графиков и таблиц.

Правильно составленное SLA позволяет определить отчет или совокупность отчетов, на основании которого заказчик может однозначно видеть, как оператор справляется с выполнением условий соглашения. Приложения управления с функциями реального времени генерируют также события или предупреждения и либо посылают сообщения непосредственно на консоль, адрес электронной почты, пейджер или телефонный номер, либо передают события платформе управления.

СТАТИСТИЧЕСКИЕ ОТЧЕТЫ

Лучшим продуктом среди программного обеспечения для составления статистических отчетов о функционировании каналов глобальной сети является линия Network Health компании Concord Communications (http://www.concord.com) со специальными модулями для frame relay и ATM. Сила Network Health — в его гибкости и мощных генераторах отчетов с сотнями предопределенных графиков и табличных представлений. Статистика может собираться для указанных группы, места, виртуального канала, протокола и любых других элементов основной реляционной базы данных. Некоторые из предопределенных шаблонов предоставляют типичную для SLA информацию.

Concord не производит своих собственных зондов для глобальных сетей, но его совместимость с агентами и зондами SNMP других производителей не имеет себе равных. Помимо стандартных баз управляющей информации MIB II, frame relay MIB, RMON MIB и RMON2 MIB Concord поддерживает нестандартные расширения MIB компаний Cisco Systems, HP, 3Com, Nortel Networks, NetScout, Motorola, Paradyne, General DataComm, Alcatel/Xylan, Olicom и Visual Networks, помимо прочих.

Trend от DeskTalk Systems (http://www.desktalk.com) функционально схож с Network Health, в том числе наличием модулей для frame relay и ATM. Система Trend поддерживает иерархический сбор данных (до четырех уровней), благодаря чему она пригодна и для очень крупных систем. Кроме того, Trend группирует свои отчеты по категориям — общие отчеты Executive Summary, превышение порогов Hot Spots, лидеры по объемам и ошибкам Top Ten, вероятное превышение порогов Forecasts. Конечно же система имеет и модуль для отчетов по SLA.

Как и Concord, DeskTalk предпринимает специальные усилия для поддержки нестандартных расширений SNMP MIB. Как утверждается, Trend способна справляться со своей задачей без помощи зондов RMON, хотя (при наличии) она может их использовать.

МОНИТОРИНГ В РЕАЛЬНОМ ВРЕМЕНИ

Visual UpTime от Visual Networks (http://www.visualnetworks.com) дополняет средства составления статистических отчетов компаний Concord и DeskTalk развитыми средствами мониторинга реального времени. Если Trend и Network Health подготавливают отчеты как по локальной, так и по глобальной сети, то Visual UpTime задействует исключительно для глобальных сетей.

Для измерения функциональных характеристик каналов глобальной сети Visual UpTime задействует собственные компоненты службы анализа (Analysis Service Element, ASE). ASE представляет собой либо DSU/CSU со встроенным агентским программным обеспечением, либо автономный пассивный зонд, подключаемый вблизи точки входа в глобальную сеть. Помимо сбора статистики, как это делает агент SNMP, ASE могут перенаправлять трафик на консоль для декодирования. (Перехват трафика — одна из возможностей полнофункциональных реализаций RMON, однако Visual не относит свои ASE к зондам RMON.)

База данных Visual UpTime (называемая Performance Archive Manager, PAM) может использоваться несколькими пользователями, причем данные из одного раздела надежно защищены от пользователей других разделов. Эта ее черта особенно привлекательна для провайдеров услуг, потому что они могут ввести централизованное управление и в то же время предоставить заказчикам доступ к статистике о работе сети.

Традиционно мониторинг сети в реальном времени представляет собой вотчину платформ управления и систем RMON. В отличие от Visual Networks, их разработчики занимаются не только глобальными, но и локальными сетями, причем в случае RMON их интересует весь стек протоколов, от физического до прикладного уровня.

NetworkIT Pro (и Unicenter TNG, включающая функции NetworkIT Pro) от Computer Associates могут быть оснащены Frame Relay Option, Frame Relay Services Option и ATM Option для управления каналами глобальной сети в реальном времени и сбора статистических данных для проверки SLA. Cabletron предлагает Frame Relay Management Application для Spectrum для мониторинга постоянных виртуальных каналов frame relay.

Лидер среди разработчиков систем RMON, компания NetScout, также выпускает полную линию зондов для глобальных сетей, в том числе для frame relay и ATM со скоростями до OC-3c включительно (http://www.netscout.com).

Разнообразный выбор зондов frame relay и RMON предлагает HP OpenView NetMatrix вместе с приложениями для мониторинга и составления отчетов на основании собираемых этими зондами данных.

Apptitude (ранее Technically Elite, http://www.apptitude.com) также включила сети frame relay в сферу своих интересов.

InfoVista (http://www.infovista.com) предлагает специальные пакеты отчетов для каналов frame relay и ATM. Хотя она и не производит собственных зондов RMON, но тем не менее ее продукт может извлекать данные из стандартных устройств RMON и RMON2.

NextPoint Networks специализируется на измерении характеристик работы приложений. Она продает Frame Relay Manager для приложений реального времени и сбора статистики (http://www.nextpoint.com).

Хотя консоли управления RMON и зонды RMON для глобальной сети способны совместными усилиями составлять отчеты по типу SLA, все же эти продукты ориентируются прежде всего на разновидности SLA для прикладного уровня, а не на заключаемые с провайдером услуг контракты (см. врезку «Две разновидности соглашений об уровне сервиса»). Тем не менее, имея средства RMON, компании могут приспособить их и для контроля за выполнением SLA.

ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ И АГЕНТЫ SLA

DSU/CSU является последним устройством со стороны заказчика перед точкой входа в сеть провайдера услуг (или иногда первым устройством со стороны провайдера), поэтому многие ведущие производители DSU/CSU оснащают свои устройства агентами SNMP. Многие из них также предусматривают возможность использования браузеров Web для мониторинга характеристик каналов frame relay.

ADC Kentrox (http://www.kentrox.com) называет свое программное обеспечение FrameVision Reporter. Оно предназначено для сбора данных о параметрах от многочисленных моделей DataSmart DSU/CSU. FrameVision специализируется на SLA, где используются шесть конкретных характеристик frame relay — доступность сегментов, занимаемая пропускная способность, перегрузка, длительность передачи, задержка и потерянные пакеты. FrameVision Reporter способен поддерживать до 50 источников данных, а FrameVision Reporter Enter-prise — до 300. Программное обеспечение управления frame relay компании Sync Research (http://www.sync.com) называется Envisage, а ее собственные контрольно-измерительные DSU/CSU — Frame Relay Access Probes (FRAPs). D-FRAP работает с линиями на 56 и 64 Кбит/с, а T-FRAP — с линиями Т-1; S-FRAP представляет собой чистый зонд, подключаемый между портом маршрутизатора и любым DSU/CSU; M-FRAP содержит DSU/CSU для Е-1 вместе со средствами мультиплексирования/демультиплексирования для поддержки голосового трафика.

Контрольно-измерительные DSU/CSU и зонды для frame relay выпускаются компанией Adtran (http://www.adtran.com) в рамках серии IQ вместе с программным обеспечением IQ-View. Paradyne (http://www.paradyne.com) производит линию FrameSaver SLV SNMP-совместимых DSU/CSU и зондов, ее программное обеспечение управления называется OpenLane Network Management System. WANview Network Management System компании Digital Link (http://www.dl.com) собирает данные frame relay от линии DSU/CSU под названием Solo 2000, в том числе по четырем базовым группам RMON, а также SNMP.

ПРИНЯТИЕ ПОЛИТИКИ

При таком разнообразии продуктов создание полезной системы управления уровнем сервиса для каналов вашей глобальной сети может представлять собой непростую задачу. Однако все может оказаться не так сложно. Во-первых, провайдер услуги может предоставить вам доступ к своему собственному программному обеспечению управления. (Некоторые провайдеры не сообщают заказчикам, что они предоставляют такой доступ, так что имеет смысл спросить.) В этом случае дублировать измерительную аппаратуру не имеет смысла, разве только если вы сомневаетесь в компетентности и честности провайдера.

Во-вторых, если у вас уже есть платформа управления или решение управления на базе RMON для всего стека протоколов, то вы имеете все необходимое для мониторинга и определения характеристик глобальной сети, в том числе агентов, консоль управления, базу данных и механизм составления отчетов. Возможно, вам потребуется новое программное обеспечение для составления отчетов, но оно быстро окупится, к тому же вы можете обойтись имеющимся оборудованием и применить накопленный опыт.

Если ваша глобальная сеть не насчитывает несколько сотен или хотя бы несколько десятков узлов, тогда программного обеспечения одного из производителей DSU/CSU должно быть вполне достаточно для контроля уровня сервиса, тем более что оно стоит относительно недорого. Во многих случаях эти программные пакеты могут передавать предупреждения в системы управления старшего класса или поставлять данные для Network Health или Visual UpTime, если вы впоследствии решите взять их на вооружение.

Наконец, некоторые поставщики услуг наотрез отказываются сравнивать ваши отчеты со своими и даже продавать услугу, если вы собираетесь установить собственную систему управления. Это связано с тем, что из-за различий в системах управления измерение одних и тех же характеристик может приводить к разным результатам вследствие статистической вариации, неодинаковости интервалов опроса и других невинных причин. В такой ситуации сопоставление отчетов не стоит потраченных на него усилий, если только на кону не стоят большие деньги — значительно большая сумма, чем стоимость времени, которое сторонам придется потратить на анализ расхождений в отчетах.

Основу для измерения уровня сервиса должно составлять соглашение об уровне сервиса. При этом иногда SLA составляются достаточно казуистически. Например, если таймер простоя включается провайдером только после того, как вы его об этом известите, то тогда имеет смысл установить автоматизированную систему оповещения за свой счет. Однако ничто не может быть важнее хороших отношений с провайдером, тем более если на его услуги вы тратите свыше половины своего бюджета ИТ.

Стив Штайнке — главный редактор Network Magazine. С ним можно связаться по адресу: ssteinke@mfi.com.

Рассматриваемые продукты

Программное обеспечение для мониторинга и составления отчетов
Apptitude

Apptitude Reporter

http://www.apptitude.com
Cabletron

Spectrum Frame Relay Management Application

http://www.cabletron.com/products/items/SM-CSI1072/
Computer Associates

NetworkIT Pro,

Unicenter TNG,

Frame Relay Option,

Frame Relay Services Option,

ATM Option

http://www.cai.com
Concord Communications

Network Health-Frame Relay,

Network Health-ATM

http://www.concord.com
DeskTalk Systems

Trend

http://www.desktalk.com
Hewlett-Packard

HP OpenView NetMetrix WAN Probes,

ATM Probes

http://www.openview.hp.com
NetScout

NetScout WAN Probes,

OC-3c ATM Probe,

NetScout Manager Plus

http://www.netscout.com
Visual Networks

Visual UpTime

http://www.visualnetworks.com
Контрольно-измерительные DSU/CSUs с программным обеспечением SLA
ADC Kentrox

FrameVision Reporter,

DataSMART DSU/CSUs

http://www.kentrox.com
Adtran

IQ-View, IQ series DSU/CSUs

http://www.adtran.com
Digital Link

WANview Network Management System,

Solo 2000 DSU/CSUs

http://www.dl.com
InfoVista

InfoVista, VistaView for Frame Relay,

VistaView for ATM Switches

http://www.infovista.com
NextPoint Networks

Frame Relay Manager

http://www.nextpoint.com
Paradyne

OpenLane Network Management System,

FrameSaver SLV DSU/CSUs

http://www.paradyne.com
Sync Research

Envisage, D-FRAP, T-FRAP, S-FRAP, M-FRAP

http://www.sync.com
 

Две разновидности соглашений об уровне сервиса

Свою историю соглашения об уровне сервиса (Service Level Agreement, SLA) ведут от эры мэйнфреймов, когда стало необходимо четко оговаривать приемлемые уровни производительности приложений. В те дни интерактивные приложения выполнялись с терминалов, и время реакции на ввод, т. е. время обновления экрана после нажатия клавиши Enter, было наиболее распространенной характеристикой его работы. Такого рода параметры оговаривались в SLA между подразделениями ИТ и пользователями централизованных приложений. Однако измерить время отклика на прикладном уровне не так-то просто (см. статью Д. Эйнджела «ПО для управления производительностью приложений» в июньском номере LAN).

Измерить характеристики канала глобальной сети на канальном или физическом уровне существенно проще, чем производительность приложения, потому что в этом случае нет множества нижележащих уровней. Канал либо функционирует, либо нет; пропускная способность равна X, задержка — Y, потеряно столько-то кадров и ячеек — и все. Провайдеры услуг без колебаний подписывают SLA, предусматривающие реальные штрафные санкции (в виде компенсаций или скидок), когда речь не идет об измерениях для определенных уровней.

Для сравнения, даже провайдеры сетевых услуг на базе IP, всего на один уровень выше в стеке протоколов, с неохотой идут на подписание подробных соглашений об уровне сервиса. Как показывает печальный опыт таких известных узлов электронной коммерции, как eBay и Charles Schwab, карьера у руководителя отдела ИТ будет недолгой, если он рискнет предоставить гарантию на уровень сервиса для приложений.

Когда дело касается соглашений о сервисе, нет никаких причин ограничиваться седьмым уровнем. В конце концов, ваших заказчиков и ваших боссов (если это не одни и те же люди) мало заботит время реакции на ввод или обновление экрана — для них куда более важно успешное проведение деловых операций. С переводом же все большего числа операций в интерактивный режим процессы становится возможным измерять и контролировать целиком без помощи дополнительной измерительной аппаратуры. Так, справочные службы и отделы по работе с клиентами на базе операторских центров часто заключают бизнес-ориентированные SLA.

Прежде чем придет время, когда вся наша жизнь будет описана в SLA, низкоуровневые SLA стоит тем не менее заключать, даже если frame relay или ATM не связаны напрямую с конечным бизнес-процессом. Ввиду наличия четкой разграничительной линии между провайдером и заказчиком и ввиду дороговизны высокоскоростных услуг передачи данных компании следует дважды подумать, прежде чем приобретать услуги глобальной сети у провайдера без четких, прозрачно контролируемых SLA.


Ресурсы Internet

Библиотека управления уровнем сервиса на узле Web компании Visual Networks имеет хорошую подборку информации о соглашениях об уровне сервиса для каналов глобальной сети, включая примеры контрактов. (Для получения доступа вам придется заполнить интерактивную форму, но после ее заполнения вы получите доступ к информации без дальнейших задержек или какой-либо оплаты.) http://www.visualnetworks.com/corp/corpslaform.htm.

NetScout предлагает несколько ценных технических статей об управлении производительностью сети и контролю за глобальной сетью по адресу: http://www.netscout.com/Products/White_Papers/white_papers.html.

Помимо технических статей вы можете найти интерактивную демонстрацию и примеры отчетов Network Health на http://www.concord.com/library/wpapers.htm.