При выборе центра обработки данных для размещения своих информационных систем ИТ-директору необходимо решить сложную задачу — оценить, готов ли ЦОД обеспечить многолетнюю бесперебойную работу оборудования при любых обстоятельствах. Один из главных практических помощников в этом деле — стандарт «Tier Standard: Topology», предложенный и детализированный Uptime Institute. За годы существования отрасли вокруг классификации Tier возникло множество мифов и легенд. Начнем с того, что в России это слово часто произносят как Мифология ЦОД, хотя в значении «уровень, класс, разряд» оно читается чем на практике различаются уровни Tier?. Это, конечно, мелочь, существуют гораздо более серьезные заблуждения.

СТАНДАРТ UPTIME INSTITUTE

Консалтинговая организация Uptime Institute была основана в США в 1993 году. Она входит в The 451 Group и занимается улучшением производительности, эффективности и надежности ключевой инфраструктуры бизнеса с помощью инноваций, сотрудничества и независимых сертификаций. Компания стала признанным общемировым центром экспертизы в сфере стандартов проектирования, строительства и эксплуатации ЦОД.

Классификация Uptime Institute — далеко не единственная. Например, существует во многом схожий японский стандарт JDCC, в котором, однако, сильный акцент делается на сейсмической устойчивости. Европейские аналоги, в частности немецкая TÜV Süd, не идут дальше терминов и определений. Главное же преимущество шкалы Tier — проработанная сертификация на соответствие четкому набору требований.

ПРОЦЕСС СЕРТИФИКАЦИИ

Консультанты организации начинают взаимодействовать с будущим владельцем ЦОД еще на стадии проектирования. Этот этап, в ходе которого эксперты стремятся выявить единичные точки отказа, неполноту в документации и другие проблемы, называется Tier Certification of Design Documents (TCDD). Перед открытием ЦОД они проверяют установленное оборудование на соответствие проектной документации, проводят испытания и приемку объекта — это этап Tier Certification of Constructed Facility (TCCF).

В дальнейшем с помощью стандарта «Tier Standard: Operational Sustainability» оценивается, насколько качественно организована эксплуатация. На этом этапе проверяется работа с эксплуатационной документацией, а также процессы обслуживания оборудования и обучения персонала. На основании полученных результатов присваиваются рейтинги соответствующего уровня: Gold, Silver и Bronze. По сути, это отдельная сертификация, которую нужно регулярно подтверждать.

I, II, III, IV

Шкала Tier — прогрессивная: требования последующих уровней включают в себя требования предыдущих. Уровни нумеруются с первого по четвертый, где Tier I — базовая топология инженерной инфраструктуры без резервирования, когда серверы запитываются от одного ИБП и имеется один дизель-генератор. Вариант вполне жизнеспособный для некритичной нагрузки или в ситуации, если резервирование осуществляется на уровне ИТ-инфраструктуры.

Tier II предполагает резервирование критически важных компонентов электроснабжения и охлаждения, а Tier III — возможность их обслуживания без перебоев в оказании услуг. Это, пожалуй, ключевое отличие между ними и главная «фишка» правильно построенного ЦОД Tier III: в его работе не предусматриваются плановые перерывы с отключением оборудования клиентов.

Помимо этого, выдвигаются требования к запасам топлива для обеспечения работы без внешних источников электроснабжения в течение неограниченного времени. Если в центре обработки данных Tier III что-то произойдет с внешней энергосетью, дизель-генераторные установки (ДГУ) позволят ему продержаться до возобновления подачи питания. Каждую ДГУ можно выключать по отдельности, менять масло и заправлять подвозимым дизтопливом по мере его расходования.

Топологическая схема ЦОД уровня Tier IV предусматривает его полную отказоустойчивость. Это означает, что сбои отдельных единиц оборудования или перебои в работе каналов не должны оказывать влияния на функционирование ЦОД. Построенные в соответствии с этим стандартом ЦОД иначе называют Fault Tolerance — устойчивыми к сбоям. Они способны функционировать без участия обслуживающего персонала.

Такие центры обработки данных очень дороги, поэтому обычно они небольшие по размерам и используются в силовых структурах или для сверхдорогих финансовых транзакций, когда нужно свести к минимуму человеческий фактор и сделать ЦОД почти необслуживаемым. Если на таком объекте что-то выходит из строя, ремонтная бригада может приехать без спешки — через несколько часов или даже на следующий день.

Основные отличия разных уровней Tier

 

ЦОД БЕЗ СЕРТИФИКАТА ≠ ПЛОХОЙ ЦОД

Отсутствие официальной сертификации не обязательно означает, что центр обработки данных ненадежен. Причин для отказа от сертификации довольно много, и первая из них — финансовая. Для относительно небольшого ЦОД расходы в пересчете на одну стойку оказываются весьма чувствительными, к тому же в нашей стране Uptime Institute активно работает только последние пять лет и более старые центры обработки данных строились не в «эпоху UI».

Собственник серьезного коммерческого ЦОД должен предоставить клиенту убедительные аргументы, подтверждающие, что площадка соответствует требованиям стандарта для определенного уровня Tier. В частности, техническим специалистам следует быть готовыми к тому, чтобы продемонстрировать инженерам клиента необходимые доказательства.

МАРКЕТИНГОВЫЕ СКАЗКИ ПРО 99,88%

Ближе к концу девяностых сотрудники UI собрали статистику о простоях, опросив достаточно большое количество существующих центров обработки данных. Этот документ с разбиением по уровням Tier был опубликован как справочный материал. На тот момент для ЦОД уровня Tier III готовность составила 99,982%, и у многих появился соблазн просто внести эту цифру в контракт на SLA, в чем, конечно же, мало смысла. Самый главный и самый вредный миф состоит в том, что в массовом сознании глубоко отпечаталось: выполнив требования Tier III, мы получаем коэффициент готовности 99,982% (99,741% для Tier II и так далее).

Естественно, на такой сложный вопрос, как определение уровня готовности большого объекта, оснащенного разнообразным оборудованием, не может быть простого ответа. Чтобы просчитать его априори для каждого конкретного центра обработки данных, нужно проделать очень большую работу, а главную сложность в таких расчетах представляет получение исходных оценок по каждому компоненту.

В любом случае сама по себе эта цифра значения не имеет. Например, готовность 99,982% формально может указывать на то, что за год (31,5 млн сек) случится 5600 перебоев питания длительностью в 1 сек. На самом деле главная интрига состоит в том, как красивую цифру превратить в финансовые компенсации.

ПУТАНИЦА МЕЖДУ TIER И TIA 942

Многие считают, будто стандарт Tier определяет буквально все аспекты деятельности центра обработки данных, но это не соответствует действительности, поскольку регламентируются вещи фундаментальные, но весьма узкие по своему охвату: главным образом все, что касается топологии инженерных систем ЦОД и достаточной производительности критического оборудования. Например, нет никаких требований в отношении высоты потолков или количества охранников.

Исторически сложилось так, что шкалу из четырех уровней Tier «одолжили» (официально, безвозмездно и на ограниченный срок) авторы стандарта TIА-942 (Ассоциация телекоммуникационной отрасли США) для информационного приложения. Это приложение содержит множество рекомендаций по разным аспектам ЦОД (включая телекоммуникационные) с разбивкой по уровням Tier. Однако речь идет именно о рекомендациях, которые не являются критериями сертификации. Эта путаница до сих существует в массовом сознании, хотя срок «аренды» шкалы уже закончился и в новой редакции TIА-942 терминология уже другая (вместо Tier используется термин Rated или Rating).

В требованиях Tier есть определенные указания на необходимость резервирования линий связи, но без конкретики. Безопасность (контроль доступа и прочее) в стандарте Uptime Institute тоже выносится за скобки. На уровне ИТ-нагрузки этот вопрос решается клиентом, а с точки зрения владельца ЦОД, сервер — это еще один прибор, на который нужно подать питание и холод (отвести тепло), а также подвести к нему линии связи. Нормы безопасности детализированы, например, в стандарте PCI DSS, где есть разделы, связанные с физическим доступом и другими уровнями защиты. Tier Standard фокусируется только на топологии инженерных подсистем, и такие вопросы он не регулирует.

МИФ О ДВУХ ЭНЕРГОВВОДАХ

Принято считать, что, согласно требованиям Tier III, у центра обработки данных обязательно должны быть два независимых энерговвода. Это настолько распространенное заблуждение, что на нем стоит остановиться отдельно.

Схемы подключения к внешним сетям нормируются по категориям присоединения потребителей, принятым еще при построении советской энергетической системы. В рамках Tier Standard Topology любая внешняя сеть рассматривается как всего лишь экономичная альтернатива, а ЦОД уровня Tier III и выше должен иметь локальную генерацию, от которой он мог бы работать произвольное время. У нас в стране это может показаться избыточным, особенно в промышленных центрах, где и строятся крупные центры обработки данных. Но на самом деле такая избыточность энергоресурсов необходима для обеспечения надежности и реальной независимости от внешних обстоятельств.

Путаницу добавляет и история с уже упомянутым TIА-942, где очень много рекомендательных положений, в том числе о двух независимых источниках электроэнергии. Но это не требование Uptime Institute.

ВЫБИРАЕМ ЦОД

С практической точки зрения для размещения важных систем обычно выбирают между центрами обработки данных Tier III и Tier II. Наиболее популярен Tier III: он обходится ненамного дороже, но обладает ценным качеством — отсутствием сервисных окон.

Остановить ИТ-нагрузку на несколько часов очень непросто, а построение резервной площадки с возможностью горячего переключения — слишком дорогое удовольствие для большинства компаний. Зачастую выгоднее использовать надежный ЦОД, чем создавать распределенную систему из нескольких менее надежных, поэтому клиенты предпочитают центры обработки данных уровня Tier III.

В ряде случаев можно выбрать менее надежные варианты, но лучший способ сэкономить — арендовать место в стойках проверенного ЦОД Tier III, хоть и не прошедшего формальную сертификацию. Разумеется, предварительно следует ознакомиться с отзывами о качестве предоставляемых услуг, узнать о реальной продолжительности периода бесперебойной работы и, возможно, посетить площадку.

Михаил Золотарев, руководитель проектного отдела дата-центра Xelent