Система обеспечения непрерывности бизнеса
СТИХИЯ ПОМОГЛА выявить наиболее существенные проблемы и недостатки систем обеспечения непрерывности бизнеса

Оказалось, что классическое высказывание Уоррена Баффета о финансовом кризисе в полной мере применимо и к ЦОД. «Только когда волна отступает, становится видно, кто плавал голым», — говорил когда-то мультимиллиардер.

Ураган «Сэнди» принес гигантскую волну в буквальном смысле этого слова. После наводнения в нижнем Манхэттене появилась возможность взглянуть на индустрию ЦОД под тем же углом, что и на сферу финансовых услуг в период кризиса. Стихия помогла выявить наиболее существенные проблемы и недостатки систем обеспечения непрерывности бизнеса.

Центры обработки дан­ных выходили из строя один за другим. Причины были самыми разными, начиная от затопления зданий и отключения ЦОД от систем подачи топлива и заканчивая неработоспособностью резервных генераторов. Проблемы приняли массовый характер.

Компания Zayo, обслуживающая один из наиболее мощных ЦОД, направила клиентам «срочное сообщение»: температура в одном из помещений ЦОД достигла 34 °C. Почти сразу вслед за этим последовало другое сообщение, в котором говорилось о повышении температуры до 38 °C.

Zayo продолжала поддерживать связь с клиентами, информируя их о принимаемых мерах и о предполагаемом времени доставки генератора мощностью 2 МВт, застрявшего в нью-йоркских пробках. Неисправность возникла в результате поломки клапана системы подачи топлива в генератор. Вскоре ее удалось устранить без каких-либо негативных последствий для клиентов, и температура вернулась к своему нормальному уровню.

ЦОД Peer1 был близок к отключению, после того как вода затопила подвал и отрезала генератору доступ к источнику подачи топлива. Откликнувшись на просьбу о помощи, сотрудники компаний Squarespace и Fog Creek Software, являющихся клиентами Peer1, выстроились в цепочку, передавая к генератору емкости, наполненные топливом.

Сообщалось и о множестве других проблем в ЦОД. Компания Internap констатировала остановку ЦОД из-за отказа системы подачи топлива. Компания Equinix сообщила о выходе из строя генератора и прекращении обслуживания ряда клиентов. В конечном итоге неисправности эти удалось устранить.

Компания TDS Telecommunications признала факт «двойного отказа» двух разных маршрутизаторов на магистрали, проходящей через Нью-Йорк. В первом случае произошло отключение ЦОД делового партнера TDS в Нью-Йорке, а второй был связан с обрывом кабеля AT&T. В результате неисправностей пострадало 9 тыс. клиентов.

По данным Renesys, ураган разрушил около 10% всех сетей в Нью-Йорке.