С чего начинается контроль арендованных услуг связи? Многие считают, что с приобретения и развертывания на сети инструментов для организации такого контроля, но на самом деле — с приобретения самой услуги связи, а именно с формирования требований к ее качеству и производительности.

 

Деятельность современной компании зачастую оказывается недостаточно эффективной из-за низкой производительности или недоступности корпоративных ИТ-сервисов, поскольку своевременное выполнение важных задач различными сотрудниками и подразделениями компании оказывается затруднено или вовсе невозможно. Поэтому быстрая локализация и устранение неисправностей становятся наиболее важными для ИТ-отдела показателями KPI.

Проблемы доступа к корпоративным сервисам могут подстерегать на разных уровнях цепочки предоставления услуги (канал связи в офисе, доступность центра обработки данных, ошибки в самом приложении). Однако контроль за состоянием канала связи как базовой услуги доступа к ресурсам имеет первостепенное значение. Он позволяет четко разграничить ответственность и выявить, виноват ли в случившемся оператор связи или неполадки возникают из-за особенностей работы корпоративного приложения. В результате значительно сокращается время локализации проблем, повышается производительность корпоративных приложений, обеспечивается гарантированное качество сеансов видео-конференц-связи и передачи голосового трафика.

С чего начинается контроль арендованных услуг связи? Многие считают, что с приобретения и развертывания на сети инструментов для организации такого контроля, но на самом деле — с приобретения самой услуги связи, а именно с формирования требований к ее качеству и производительности.

От правильности составления требований к качеству услуги зависит многое: ее стоимость, уровень компенсаций за нарушение показателей качества, точность и релевантность измерений и определение зон ответственности. Набор требований для конкретной услуги может быть уникальным, так как зависит от тех пользовательских и корпоративных сервисов верхнего уровня, для которых она будет являться транспортом. Например, при обеспечении работы склада предъявляются одни требования, а в случае центрального операционного офиса банка — другие.

Когда пользователя не удовлетворяет качество услуги, в первую очередь встает вопрос о наличии соответствующих законодательных требований. Текущие нормы на показатели качества, действующие на территории РФ, утверждены Приказом № 113 Министерства информационных технологий и связи РФ от 27.09.2007 «Об утверждении Требований к организационно-техническому обеспечению устойчивого функционирования сети связи общего пользования». В целом они носят информативный характер и задают нижнюю границу уровня обслуживания (минимально допустимое качество предоставляемых услуг). Однако на практике выполнение этих норм не гарантирует ожидаемого качества услуги.

В рамках работ по созданию нормативной документации в области качества телекоммуникационных услуг Роскомнадзор выпустил серию методик по измерению и расчету показателей производительности (метрик). В них приводится список измеряемых метрик и способов вычисления на их основе показателей качества, однако требования к граничным значениям метрик опираются на Приказ № 113 (http://rkn.gov.ru/communication/p714/).

В отсутствие нормативной базы урегулирование взаимоотношений оператора и клиента, нормирование показателей качества и реализация политики в области контроля и обеспечения качества могут производиться только на основе договора об уровне обслуживания Service Level Agreement (SLA) между поставщиком услуги и потребителем. Договор SLA не является нормативным документом, однозначно определяющим уровень качества выполнения услуги конкретного вида, так как этот уровень определяется субъективным восприятием сервиса клиентом.

Структура типового соглашения SLA подробно описана в рекомендации МСЭ.Т M.3342 (07/06) — Guidelines for the definition of SLA representation templates — и должна содержать:

  • общую информацию о бизнесе и описание деловых процедур, относящихся к услуге, которую предоставляет поставщик услуги (деловая часть);
  • подробную информацию об оказываемой услуге, где конкретизируется содержание договорной услуги и согласованный уровень ее предоставления (часть, относящаяся к услуге);
  • детальный перечень параметров качества обслуживания, важнейших характеристик и некоторой инфраструктуры технической поддержки (техническая часть);
  • данные, входящие в отчет о качестве обслуживания, на основании которого клиент и поставщик оценивают уровень выполнения услуги, закрепленный в SLA (описание отчета SLA).

Согласно этим рекомендациям, требования к качеству услуги являются обязательным приложением к договору об оказании услуг и представляют собой техническую часть соглашения об уровне обслуживания (SLA).

Выдвижение требований к качеству услуги оператора связи должно подкрепляться тремя ключевыми пунктами договора:

  1. перечень показателей качества и нормированные значения;
  2. методика и средства контроля показателей;
  3. штрафные санкции за нарушение показателей качества.

ПЕРЕЧЕНЬ ПОКАЗАТЕЛЕЙ КАЧЕСТВА УСЛУГИ

Для каждой услуги связи должны быть определены ключевые показатели качества. Это обязательное и главное условие требований к качеству арендуемой услуги. Показатели должны быть объективны, измеряемы и вычисляемы, и кроме того, необходимо определить их пороговые значения.

Перечень показателей качества для каналов связи представлен в рекомендации Международного союза электросвязи Y.1540 «Internet protocol data communication service — IP packet transfer and availability performance parameters». В данной рекомендации выделяются следующие основные показатели производительности IP-соединения:

  • коэффициент потери пакетов (IP Packet Loss Ratio, IPLR);
  • задержка передачи пакетов по сети (IP Packet Transfer Delay, IPTD);
  • изменение (вариация) задержки пакетов (IP Packet Delay Variation, IPDV, Jitter);
  • доступная пропускная способность (throughput).

Это измеряемые показатели — метрики (KPI), обычно получаемые с помощью измерительного оборудования. На их основании рассчитываются показатели качества — Key Quality Indicators (KQI), которые и определяют собственно качество услуги связи, а отнюдь не метрики, которые операторы зачастую пытаются продать в договорах на услуги связи.

Для определения итогового качества обслуживания, согласно стандарту TM Forum GB917 — SLA Management Handbook v3.2, при помощи измеряемых метрик рассчитываются итоговые показатели качества услуги:

  • коэффициент готовности услуги (Service Availability, SA);
  • время, в течение которого метрики не соответствовали граничным значениям (Service Degradation Period);
  • среднее время между отказами услуги (MTBF);
  • среднее время восстановления услуги (MTTR).

Зачастую при заключении SLA операторы связи идут на хитрость, указывая в договоре пороговые значения для показателей качества за весь отчетный период — например, среднее значение времени задержки передачи пакета за месяц 100 мс, при средней задержке передачи пакета по данному направлению 20 мс.

Для наглядности рассмотрим следующую ситуацию. На некотором направлении используются чувствительные к задержке передачи пакетов корпоративные приложения, которые считаются неработоспособными при задержках более 300 мс. В течение стандартного восьмичасового рабочего дня задержка регулярно превышает допустимое пороговое значение, а среднее (за 10-минутный оценочный интервал) составляет 375 мс, тогда как в остальное время — 20 мс. В результате за календарный месяц (~720 часов) сервис будет неработоспособным более 140 часов, то есть свыше 87,5% рабочего времени. При этом средняя задержка за месяц при 10-минутном оценочном интервале составит (1400×375+5800×20)/7200=89?мс и формально соглашение SLA не будет нарушено.

При подобном подходе оказывается практически бессмысленным одно из важнейших понятий SLA — деградация качества услуги. Деградацией считается такое состояние услуги, когда значения параметров качества находятся за пределами пороговых значений, но условия отказа еще не наступают.

Отказом же услуги считается полная или частичная неработоспособность в течение контрольного срока — например, за полчаса теряется более 50% пакетов. Именно из этих интервалов складывается общее время неготовности услуги и формируется значение итоговой доступности за отчетный период.

Во избежание подобных ситуаций западные поставщики услуг указывают, сколько времени (в процентном отношении) показатели качества должны находиться в пределах нормальных значений. В случае нарушения этого требования назначаются штрафные санкции.

Одним из ключевых моментов для определения качества услуги связи являются правила расчета параметра готовности услуги как основного показателя выполнения обязательств оператором связи. При неправильном подходе может сложиться ситуация, аналогичная указанной выше (со средним показателем параметра за отчетный период), когда услуга, которой невозможно пользоваться, считается предоставленной в полном объеме, то есть без нарушения SLA.

В требованиях к качеству услуги должны учитываться и планово-профилактические мероприятия. Их продолжительность, как и количество, должно быть строго регламентировано. Кроме того, следует указать и допустимое число отказов.

Нередко заказчики задают вопрос о способах определения граничных значений параметров качества каналов связи. С переходом от технологии передачи данных TDM к технологии Ethernet, ввиду огромного разнообразия пакетных сервисов, множества семейств протокольных стеков пакетной коммутации и несчетного числа производителей оборудования, нормы качества на каналы связи и методология их измерения перестали соответствовать единым стандартам.

Как показывают результаты исследований, в ходе которых изучалось влияние качества каналов на функционирование корпоративной видео-конференц-связи (ВКС), для достижения наилучших показателей необходимо контролировать уровень потерь пакетов. Поскольку системы видео-конференц-связи имеют большой буфер обмена, задержка и ее вариация (jitter) фактически не оказывают влияния на качество ВКС, как и задержка пакетов. Вместе с тем при задержке пакетов в буфере дольше предельного значения пакеты считаются потерянными, что тоже ухудшает качество услуги. Иначе говоря, даже в случае невыполнения требований к задержке качество видеосвязи может восприниматься пользователем как приемлемое. И наоборот, для других сервисов, например сервисов с гарантированной доставкой данных, потеря пакетов имеет меньшее значение, чем задержка и ее вариация.

В Таблицах 1 и 2 приводятся примеры требований к качеству услуг, включенные в договоры разных операторов связи. На основании приведенных данных можно сделать вывод о том, что состав показателей SLA, их пороговые значения и классы обслуживания не имеют единого стандарта. Нормы на показатели качества устанавливаются для каждого конкретного случая, а их определение требует проведения лабораторных испытаний.

Таблица 1. Требования к показателям качества компании «МТС».
Таблица 1. Требования к показателям качества компании «МТС».

 

Таблица 2. Требования к показателям качества компании «Ростелеком».
Таблица 2. Требования к показателям качества компании «Ростелеком».

 

В первых версиях требований к услуге связи важен сам факт наличия показателей качества (KQI) и методов их контроля. А в последующих договорах, после накопления определенного объема статистических данных, нормы могут быть ужесточены. Для установления в SLA адекватных — применительно к каждому заказчику — показателей KPI необходимо проведение испытаний в специально оборудованных метрологических лабораториях.

МЕТОДИКИ И СРЕДСТВА КОНТРОЛЯ КАЧЕСТВА

На данный момент отсутствуют единые стандарты на методологию измерения показателей производительности (метрик) связи в пакетных сетях передачи данных. К примеру, для расчета показателя вариации задержки передачи пакета (Jitter) применяются четыре основные методики: MEF 10.2, Y.1731, RFC 3550 и Y.1541. Отсутствуют и единые методики расчета показателей качества услуг связи.

Невозможно сказать, какая из методик точнее или у какой результат более релевантный — эталона здесь нет. Однако очень важно четко формализовать конкретную методику в договоре SLA, так как при отсутствии определенности результаты измерений, выполненных клиентом, будет практически невозможно коррелировать с результатами измерений, проведенных оператором с применением другой методики.

Соответственно, выбор и согласование конкретной методики измерения метрик является одной из главных задач составления SLA и формулирования требований к качеству услуги. Идеально, если оператор предложит использовать сертифицированную и наиболее распространенную (являющуюся стандартом де факто) систему мониторинга и измерений.

Для каждой контролируемой метрики должен быть указан интервал усреднения показателей производительности услуги. Чтобы обеспечить корректное сравнение результатов, рекомендация Y.1541: Network performance objectives for IP-based services предлагает делать его не слишком коротким — на практике около 5 мин.

Измерение метрик должно осуществляться в непрерывном «сквозном» режиме мониторинга качества клиентских услуг (end-to-end, «от порта до порта»). При таком подходе тестовый трафик подмешивается в активное соединение без ущерба для пользовательского трафика, а результаты агрегируются за заданные интервалы оценки (5–10 мин), после чего данные передаются в систему мониторинга для отображения результатов.

Измерительное оборудование должно обладать соответствующими сертификатами в области связи и метрологии, а также обеспечивать функции демаркации (разграничение зоны ответственности между оператором и клиентом вне зависимости от типа применяемого активного сетевого оборудования), то есть четко определять, где находится проблема — в сети оператора или у клиента.

Кроме того, оборудование должно поддерживать функции нагрузочного тестирования контролируемой услуги связи по стандарту МСЭ Y.1564 «Service Activation Test» для определения соответствия предоставляемой пропускной способности гарантированному значению.

Система мониторинга выполняет проактивный сбор информации (в режиме «псевдореального времени»), детально анализирует ее и отображает результаты в виде графиков и диаграмм. Главной же задачей этой системы является формирование периодических отчетов SLA, которые должны включать в себя подробную информацию об изменении качественных характеристик за отчетный период, содержать статистику произошедших аварийных событий, отражать периоды проведения планово-профилактических работ.

Система мониторинга качества услуг связи является пограничным решением, так как результаты измерений необходимо предоставлять как потребителю, так и оператору услуг связи, то есть обеим сторонам нужен доступ к соответствующему интерфейсу, а сама система должна быть многопортальной.

Эта же система отвечает за оперативное информирование службы эксплуатации и ответственных лиц о случаях снижения качества или отказа услуги — путем отправки уведомлений по электронной почте, посредством SMS, а также с помощью приложений для планшетов и смартфонов (для обеспечения возможности доступа к информации о качестве услуги в режиме 24×7 из любой точки земного шара).

СКИДКИ ЗА НАРУШЕНИЕ ПОКАЗАТЕЛЕЙ КАЧЕСТВА

Согласно рекомендациям M.3342 (07/06) — Guidelines for the definition of SLA representation templates — и стандарту TM Forum GB917 — SLA Management Handbook, обязательным пунктом SLA является определение правил расчета компенсаций в случае нарушения гарантированного уровня качества услуги.

Таблица 3. Пример линейной скидки.
Таблица 3. Пример линейной скидки.

В России в основном применяется простой линейный подход к расчету компенсаций за нарушение гарантированного качества, при котором за каждый полный час недоступности услуги из итогового счета вычитается 1/720-я часть ежемесячной абонентской платы.

Данный подход отличается простотой и прозрачностью, однако он не всегда отражает интересы клиента, так как отказ на 15 минут и на 5 часов представители бизнеса воспринимают по-разному. Специально для таких случаев ряд западных операторов связи применяют модель прогрессивной скидки, когда уровень компенсации возрастает с увеличением продолжительности аварии.

Таблица 4. Пример прогрессирующей скидки.
Таблица 4. Пример прогрессирующей скидки.

Возможные размеры скидок по причине нарушения уровня обслуживания представлены в Таблицах 3 и 4.

Нередко для особо важных для деятельности предприятия точек в SLA предусматривают дополнительные санкции, если услуга пребывает в деградированном состоянии.

ЗАКЛЮЧЕНИЕ

Широкое распространение SLA дало новый импульс бизнесу операторов в корпоративном и государственном сегментах. Благодаря возможности гарантировать уровень обслуживания и мониторингу качества предоставляемой услуги, они получили шанс добавить еще 10–30% к той цене, по которой они продают свои обычные услуги VPN. Однако из-за недостаточной осведомленности клиентов подписанные соглашения SLA не приводят к реальному повышению качества услуги и не позволяют требовать компенсации за невыполнение обязательств. Поэтому к заключению таких соглашений целесообразно привлекать независимых экспертов, которые помогут подготовить необходимые требования и согласовать финальный текст документа.

Более того, перед публикацией требований целесообразно провести аудит и определить действительные значения показателей, которые сейчас предлагает оператор (для существующих услуг). Такой аудит не занимает много времени, но позволяет существенно расширить знания об уровне качества уже предоставляемых услуг и правильно определить границы допустимых значений для новых. Аудит следует поручать компаниям, обладающим необходимой экспертизой, и выполнять его с применением сертифицированных измерительных средств. В идеале результаты этого аудита должны приниматься операторами связи.

Денис Дякив — руководитель департамента разработки и развития продуктов в компании Wellink.