Сегодня уже нет крупных компаний, у которых в том или ином виде не было бы централизованной системы хранения данных, серверной инфраструктуры, средств виртуализации, и одна из задач подразделений ИТ состоит в повышении надежности этой существующей конфигурации. Для решения этой задачи компания EMC предлагает класс продуктов по обеспечению непрерывности бизнеса (Business Continuity).

Облака, будь то частные или публичные — это не только новые возможности, но и новые проблемы. Например, виртуализация породила новые требования к способу взаимодействия компонентов ИТ-инфраструктуры — мобильные данные и приложения, миграция в один клик, прозрачная катастрофоустойчивость, но для обеспечения такой функциональности требуются новые решения по хранению, защите, резервному копированию и повышению доступности. Несмотря на высокую надежность систем VNX и VMAX, в большинстве случаев требуется обеспечивать устойчивость относительно отказа ЦОД целиком. Кроме того, сегодня защита данных — это не только защита собственно оборудования, но и логической структуры данных. В этой связи в портфеле продуктов компании EMC имеются решения, направленные на увеличение доступности как уже существующих у пользователей систем, так и вновь создаваемых инфраструктур, работающих с облачными сервисами. Речь идет о VPLEX — программно-аппаратном комплексе для виртуализации хранения, обеспечения катастрофоустойчивой работы гетерогенных разнесенных ЦОД и RecoverPoint — программно-аппаратном комплексе «непрерывной» защиты данных и гетерогенной репликации, обеспечивающем устойчивость работы приложений путем сохранения логической структуры данных при авариях. В 2012 году оба решения были интегрированы с целью упрощения развертывания и управления.

Назначение VPLEX — построение катастрофоустойчивых ЦОД высокой доступности, поэтому ключевым элементом решения является объединение распределенных массивов хранения данных, которые начинают работать как единое виртуальное пространство. По сути, VPLEX дает возможность иметь в точности одинаковые данные в двух разнесенных ЦОД, доступные для работы одновременно. Кроме того, решение позволяет виртуализовать разнородные системы хранения с целью повышения их уровня утилизации.

Существуют три режима работы VPLEX: Local — локальное объединение ресурсов в пределах одной площадки; Metro — удаленное объединение (полностью синхронный режим, расстояние 1 км); GEO — удаленное объединение для асинхронных расстояний (асинхронный режим, расстояние 10 км). В рамках VPLEX приложения, физически находящиеся в разных ЦОД, работают как бы с единой системой хранения через одну точку входа. Список поддерживаемых систем хранения, а также серверных систем достаточно велик — достаточно, чтобы они поддерживали протокол Fibre Channel, а предлагаемая в VPLEX дисциплина работы хорошо вписалась в структуру компаний; например, для финансовых организаций наличие двух резервных непрерывно доступных ЦОД является корпоративным стандартом.

Решение RecoverPoint позволяет исключить потерю данных при восстановлении после сбоев оборудования или ПО — логическая структура гарантированно возвращается в заданное состояние. Работа RecoverPoint напоминает механизм мгновенных снимков с «нулевой» гранулярностью так, как если бы снапшоты делались каждый раз когда меняется хотя бы один бит информации. Благодаря программам Appsynс и Replication manager, устанавливаемым на серверы баз данных и приложений, поддерживается консистентность файловых систем и структур данных на каждый конкретный момент времени (контрольную точку). Такие точки помечаются как «закладки», и при восстановлении данных после сбоев администратор или «откатывает» состояние на конкретную «закладку», или, в случае необходимости более точного восстановления, работает на уровне отдельных транзакций системы хранения. Есть и другой режим работы Recoverpoint — гетерогенная репликация, в которой могут принимать участие системы хранения сторонних производителей. Наиболее интересная конфигурация — трехсторонняя каскадная репликация между тремя ЦОД, которая нереализуема стандартными механизмами репликации систем хранения. Данные из первого ЦОД реплицируются на второй, со второго — на третий, и при отказе первого данные продолжают реплицироваться со второго на третий, тогда как в случае обычной двусторонней репликации такого не произойдет. Такая схема позволяет добиться высоких показателей защиты данных.

RecoverPoint — это кластер, содержащий от двух до восьми узлов на платформе x86, подключаемый в сеть хранения посредством интерфейсов Fibre Channel. Также есть интерфейсы Ethernet, которые используются для репликации по IP-каналам. RecoverPoint построен по принципу журналирования изменений на логических томах. Для организации журналирования на этапе записи происходит зеркалирование трафика в специальный журнал. Возможно три варианта зеркалирования:

  • средствами сервера за счет установки специального драйвера;
  • через коммутаторы сетей хранения, поддерживающие функцию зеркалирования портов;
  • средствами самого массива за счет сплиттера. Сплиттер представляет собой выделенный порт, на который система хранения зеркалирует весь приходящий поток — этот трафик и журналируется средствами RecoverPoint.

Существует четыре режима журналирования:

  • CDP (Continuous Data Protection) — локальный режим, при котором журнал транзакций и все реплики данных размещаются на той же системе хранения, что и продуктивный набор данных;
  • СDP/EX — локальный режим, при котором репозиторий находится в том же ЦОД, что и продуктивная система хранения, но сама эта система выделена;
  • CRR (Continuos Remote Replication) — режим, при котором реплика находится на удаленной системе хранения в удаленном ЦОД, причем этот режим нечувствителен к ширине канала, в отличие от VPLEX, которому требуются высокоскоростные каналы.

Для репликации может использоваться как прямой оптический канал FC, так и любой IP-канал. Объем передаваемого трафика можно сократить за счет встроенного механизма дедупликации в канале. Четвертый режим CLR (Continuos Local Replication) — это смешанный режим работы с локальной и удаленной репликой (CDP+CRR).

Решение RecoverPoint поставляется как в виде отдельного продукта с поддержкой систем хранения от сторонних производителей, так и в виде модуля, встроенного в системы хранения EMC VNX. Отметим, что RecoverPoint — менее универсальное решение, чем VPLEX, и его внедрение требует более скрупулезной подготовки и планирования, однако его возможности существенно шире. Функционал RecoverPoint востребован в ретейловых компаниях и в банках для поддержки систем ERP и CRM, в которых идет постоянное изменение продуктивных данных, что повышает риск потери логической структуры данных. RecoverPoint предпочтительнее использовать при наличии медленных каналов связи.

После интеграции recoverpoint и VPLEX появилась возможность реализовывать более интересные конфигурации, сочетающие в себе функционал обоих. Предприятия, которым требуются непрерывная защита и непрерывная доступность, обычно развертывают два ЦОД, расположенных на небольшом расстоянии, и в этом случае VPLEX используют в режиме METRO — системы хранения данных на обеих площадках виртуализованы и объединены в единый пул ресурсов. Настроена полная синхронная репликация между массивами, причем для приложения система хранения едина. При отказе любого аппаратного компонента приложение продолжает работать в обычном режиме — неисправность виртуализованной системы хранения не влияет на доступность. В случае нарушения логической структуры данных можно с помощью RecoverPoint «откатиться» на любую точку назад, подключив реплику с журналом в качестве продуктивного хранения на одном из ЦОД. Данная организация работы (рис. 1) называется «Непрерывная доступность» (AccessAnywhere), а логика работы RecoverPoint — «Непрерывная защита» (ProtectAnywhere).

 

Рис.1. Режим AccessAnywhere + ProtectAnywhere
Рис.1. Режим AccessAnywhere + ProtectAnywhere

 

Сегодня все чаще заказчикам требуются три ЦОД: два — рядом друг с другом, например в пределах одного города, а третий — на значительном удалении. В случае неисправности переключение между первыми двумя происходит автоматически без прерывания доступа к приложениям, а переключение на третий ЦОД осуществляется только при серьезной проблеме и выполняется вручную(рис. 2 ).

 

Рис. 2. Тройной синхронно-асинхронный ЦОД
Рис. 2. Тройной синхронно-асинхронный ЦОД

 

На первых двух ЦОД, как и в предыдущем случае, функционирует VPLEX в синхронном режиме METRO с гарантией непрерывности при сбоях в одном из ЦОД. При повреждении логической структуры данных или полной потере сразу двух ЦОД происходит переключение на удаленный резервный, в котором хранятся все журналы RecoverPoint и имеется возможность оперативного восстановления структуры данных на определенный момент времени и перезапуска приложений. Для платформы VMware первый и второй ЦОД работают как одна кластерная инсталляция vSphere, а резервный ЦОД работает под управлением VMware SRM. Такая схема защиты будет работоспособна и без виртуализации — в этом случае для каждого приложения по отдельности необходимо будет разрабатывать сценарий восстановления (Disaster Recovery Plan).

Кроме VPLEX и RecoverPoint в портфеле EMC есть решения по обеспечению информационной безопасности и организации единой оперативной системы мониторинга и управления.

Евгений Пухов (Evgeniy.Pukhov@emc.com) — менеджер по развитию направления унифицированных систем хранения, «EMC Россия и СНГ» (Москва).