Источник: aeroexpress.ru

«Аэроэкспресс» построил катастрофоустойчивую виртуализованную ИТ-инфраструктуру для размещения бизнес-систем. Вычислительный комплекс развернут на двух площадках — в случае аппаратных сбоев на возобновление работы сервисов в резервном ЦОД требуется в среднем около 40 минут. Решение поддерживает около 10 приложений: ERP, BI, систему для планирования продаж, а также инфраструктурные сервисы. Отказоустойчивость серверной инфраструктуры в основном ЦОД обеспечивается за счет кластерной конфигурации. В частности, при выходе из строя одного из серверов СУБД вычислительные задачи перейдут на другой без остановки сервиса. Кроме того, данные СУБД реплицируются на резервную площадку с интервалом не более 15 минут, что обеспечивает минимальные потери транзакций в случае отказа. Сетевые балансировщики, которые распределяют запросы пользователей между вычислительными ресурсами ЦОД, также резервируются. Для систем хранения реализована репликация «моментальных снимков»: на резервную площадку передаются только происходящие в базах данных изменения. Такое решение позволяет существенно экономить место на дисковых массивах, разгрузить каналы связи, а также добиться высокой скорости восстановления сервисов. Для специалистов ИТ-службы «Аэроэкспресса» прописаны планы аварийного восстановления, включающие управление перезапуском виртуальных машин и репликацией данных между ЦОД. «Инфосистемы Джет» также предоставили на базе своего виртуального ЦОД тестовую среду для отладки приложений, что в итоге почти на полгода сократило сроки проекта.