Руководители отделов ИТ могут без особого труда рассчитать производительность системы с учетом соглашения об уровне обслуживания. Они знают систему и пользователей, им известны периоды простоев. Несколько операций с Excel, и все в порядке. Однако при переходе на уровень около 100 млн пользователей с распределением службы по всему миру и разделением на девять регионов трудно определить показатели SLA, имеющие смысл для отдельных клиентов. На мой взгляд, публикуемые Microsoft отчеты SLA интересны, но малоприменимы из-за популярности Office 365.

Недавно я прочитал отчет об Office 365, в котором содержалось следующее утверждение:

«Несмотря на заверения в стабильности, надежности и высокой доступности «облачных» служб, Office 365 по-прежнему свойственны периодические отказы. Причиной может быть недостаточно хорошо проверенное исправление, незамеченные особенности настройки, отказ компонента или неисправность сети. Office 365 не обеспечивает стопроцентной доступности службы».

Будем откровенны. Пока подключение пользователей к «облачным» службам выполняется через Интернет, невозможно ожидать от такой службы постоянной доступности. Вероятно, по этой причине Microsoft дает финансовые гарантии обслуживания на уровне 99,9%. Автор отчета, видимо, упустил из виду этот факт.

Но если углубиться в тему, то, с одной стороны, представители Microsoft утверждают, что уровень обслуживания Office 365 очень хорош (99,99% в первом квартале 2015 года и 99,95% во втором квартале), а с другой — клиенты постоянно жалуются на прерывания в обслуживании и испытываемые неудобства. Примерно такие же упреки высказываются и в отношении локальных ИТ-систем, так как восприятие надежности и качества обслуживания часто сильно отличается при взгляде со стороны ИТ-подразделения и с точки зрения пользователей.

Я уже указывал на Интернет как на важный фактор качества обслуживания в «облаке». Компания Microsoft прилагает все усилия, чтобы снизить влияние этого фактора, развертывая сеть локальных точек подключения по всему миру, чтобы избежать подключения с несколькими перенаправлениями к центру обработки данных Office 365, содержащему учетную запись пользователя. Предполагается, что локальные точки подключения направят трафик на сайты компании кратчайшим путем. Идея не нова, так как в службах коммутируемого доступа CompuServe и America Online использовался очень похожий подход с организацией локальных «точек присутствия».

Более крупные компании могут использовать Azure ExpressRoute для подключения корпоративных сетей WAN к сети Microsoft. Для этого требуются сравнительно дорогостоящие выделенные каналы связи, но у ExpressRoute есть огромное преимущество: сеть Office 365 выглядит как расширение корпоративной сети WAN.

Это замечательно, однако Microsoft уже исключает сбои Интернета из расчетов SLA. В соглашении об условиях обслуживания для служб Microsoft Online Services (http://bit.ly/1zh1ckZ) говорится, что уровни обслуживания не применяются «из-за факторов, находящихся вне нашего контроля, или отказа сетей и устройств, внешних относительно наших центров обработки данных, в том числе на вашем сайте или между вашим сайтом и нашим центром обработки данных». Это справедливо, так как даже Microsoft не в состоянии контролировать Интернет. В том же документе указывается, что местные условия, не ограничиваясь проблемами, вызванными недостаточной полосой пропускания, также исключены. Другими словами, если вы подключены к медленной Wi-Fi сети, не надейтесь на высокое быстродействие Office 365.

Для Exchange Online время простоя определено как «любой период, в течение которого пользователи не могут отправить или получить сообщения электронной почты с помощью Outlook Web Access» (да, потребуется время, чтобы юристы Microsoft привыкли к новому имени OWA). Уравнение для расчета SLA следующее:

((Минуты использования - Простои)/(Минуты использования)) × 100

Выглядит справедливо. Но почему столько пользователей жалуется на проблемы с Office 365, а Microsoft продолжает публиковать превосходные показатели качества обслуживания? Причина в быстром росте армии пользователей Office 365. Чем больше мы используем Office 365, тем меньше влияние каждого отдельного сбоя на общие показатели качества обслуживания.

Взгляните на пример, данные для которого приведены в таблице. В его основе лежит статистика отключений для некоторого числа пользователей Exchange Online в Северной Америке в июне 2014 года. Предположим, что отключение затронуло 2 млн пользователей, а его длительность составила почти 7 часов. На первый взгляд это почти катастрофа, но статистически отключение едва отразилось на качестве обслуживания Office 365. Большое число потерянных минут использования (1310,4 млн) представляет 0,01% минут использования за квартал (13 104 000 млн), если к Office 365 обращаются 100 млн подписчиков.

 

Пример статистики отключений

Во втором квартале 2015 года показатель качества обслуживания Office 365 достиг 99,95%. Это потеря 4 550 000 дней для 100 млн пользователей за квартал, или всего одного часа для каждого отдельного пользователя. В этот период случались многочасовые отключения, в основном в Северной Америке, но все же многочисленная армия пользователей позволяет сгладить общий результат для всей службы Office 365.

По мере роста общего числа пользователей Office 365 влияние отдельных отключений будет снижаться. Чтобы снизить квартальный SLA для службы со 100 млн пользователей на 0,01%, требуется отключить 2 млн пользователей на 655 минут, но для службы со 150 млн пользователей для такого же эффекта потребуется отключение длительностью 982 минуты. Учитывая существующие тенденции, Office 365 достигнет этого состояния в течение 2016 года.

Все это означает, что и в будущем Microsoft сможет публиковать отличные показатели качества обслуживания для Office 365. Отдельные клиенты могут быть недовольны (если происходят отключения) или вполне довольны (если нет), но им будет трудно сопоставить свой опыт с отчетами Microsoft. Мониторинг продуктов, в частности Office365 Mon, поможет получить данные клиентского уровня об отключениях. Но даже в этом случае гибкость соглашения об уровне обслуживания такова, что компании Microsoft удастся списать множество грехов.