Любая компания или организация стремится к полному контролю над своими активами и к надежной защите основных ценностей, в частности информации. Ведь даже уход ключевых сотрудников обычно означает лишь финансовые потери и замедление развития, но при утере бизнес-критичных данных компания может оказаться на грани выживания. По данным аналитиков Gartner, три из пяти компаний, потерявших бизнес-критичные данные, прекращают свою деятельность. Однако в России еще далеко не во всех организациях серьезно относятся к резервному копированию, а там, где понимают важность деятельности по сохранности данных и принимают соответствующие меры, часто допускают ошибки. Например, резервным копированием различных серверов и приложений занимаются администраторы этих серверов, и нет единого процесса сохранения данных (то же касается и филиалов компаний, когда копии не консолидируются в центре). Очень часто для резервного копирования используют только ленточные библиотеки, несмотря на наличие большого числа приложений и виртуальных машин, забывая, что окно для проведения операций копирования по мере развития бизнеса будет только уменьшаться. И даже в тех случаях, когда резервирование делается регулярно, тестовое восстановление не проводится, и в результате неизвестно, получится ли вообще «поднять» данные после сбоя, особенно если для резервирования используется сама рабочая система хранения. И что произойдет при выходе из строя всего массива, никто не задумывается. Весьма часто бывает, что после окончания периода поддержки старого оборудования его приспосабливают под задачи резервирования, складывая на такую систему копии данных и наивно считая, что теперь они в безопасности. Встречается и другая ситуация, когда строится вторая удаленная площадка, все данные зеркалируются в режиме реального времени, но больше никаких действий по защите информации не предпринимается.

Сегодня имеется множество производителей, которые предлагают решения по защите данных, как правило, отлично выполняющие какую-то определенную функцию. Обычно это поставка дисковых библиотек с дедупликацией, ленточных хранилищ или ПО поддержки процесса резервного копирования. В том случае, когда заказчик под свои нужды подбирает компоненты комплексного решения от разных поставщиков, обязательно возникнут трудности интеграции, что приведет к урезанию функционала и дополнительным сложностям при эксплуатации. Построенная система будет работать, но лишь до тех пор, пока не произойдут какие-то изменения в системе резервного копирования или ИТ-инфраструктуре. Чаще всего заказчик не сможет сам устранить неполадки и обратится к поставщикам, и тут окажется, что новая версия ПО резервирования, полученного от компании Х, частично несовместима с текущими драйверами библиотеки от компании Y. Либо поставщик ПО ссылается на проблемы оборудования, производитель которого, наоборот, указывает на ошибки в программах. В результате заказчик оказывается один на один со своей проблемой, причем помочь не может даже интегратор.

Рекомендуется подбирать элементы системы по их наибольшей совместимости, что, как правило, возможно при приобретении решения от одного поставщика. Например, в компании Hewlett-Packard имеется специальное подразделение BURA (BackUp, Recovery and Archiving), отвечающее за комплексные системы резервного копирования и архивирования, которые включают в себя программно-аппаратные компоненты, изначально разрабатываемые с целью достижения полной совместимости.

Программные решения

В программную часть комплексного предложения компании по резервному копированию и архивированию входят такие решения, как HP Data Protector, HP Connected Backup и HP Consolidated Archive.

HP Data Protector — система организации резервного копирования предприятия, поддерживающая множество ОС, приложений и сред виртуализации. Data Protector подойдет для защиты ИТ-инфраструктур любого масштаба и сложности — интеграция с системами хранения резервных копий в дедуплицированном виде HP StoreOnce позволяет реализовать произвольные схемы защиты данных для территориально распределенных инфраструктур, передавая между площадками только уникальные блоки. Начиная с версии 8.1, вышедшей в январе 2014 года, в HP Data Protector предлагается новый подход к защите данных — HP Adaptive Backup and Recovery, выходящий за рамки построения традиционных систем резервного копирования и позволяющий обеспечить необходимую гибкость и масштабируемость использования ресурсов хранения в условиях ЦОД. Учет взаимосвязи данных, приложений и аналитических механизмов позволяет определить, какие именно данные, когда, где и как должны быть защищены и доступны. Лежащий в основе данного подхода аналитический «движок» адаптирует и подстраивает политики резервного копирования в соответствии с меняющимися видами данных, приложениями и бизнес-требованиями. HP Adaptive Backup and Recovery предусматривает несколько последовательных фаз.

  • Приоритизация. Принятие решений по резервному копированию на основе приоритетов.
  • Прогнозирование. Для повышения качества принимаемых решений система анализирует оперативные данные, включающие сведения о загрузке ресурсов и их утилизации различными приложениями из виртуальных и физических сред, а затем выдает прогнозы по улучшению работы. В результате, благодаря обучению на данных мониторинга, каждая последующая сессия копирования/восстановления становится «умнее» предыдущей.
  • Рекомендация. Формирование советов администратору по изменению настроек системы для снижения риска потенциальных конфликтов ресурсов и выполнения требований соглашения об уровне обслуживания (Service Level Agreement, SLA).
  • Автоматизация. Регулировка политик резервного копирования, основанная на аналитических данных, с целью сделать систему самоуправляемой и адаптируемой, что позволит ИТ-службам значительно упростить традиционно сложный и затратный процесс подгонки и «тюнинга» имеющейся стратегии защиты данных.

HP Connected Backup — система резервного копирования и восстановления данных рабочих станций и мобильных компьютеров. Выполняя резервное копирование в фоновом режиме, Connected Backup гарантирует защиту информации без прерывания работы пользователей. Масштабируемая архитектура, возможность организации копирования как в ЦОД пользователя, так и в облако, позволяют гибко организовать защиту данных. Функционал доступа к резервным копиям с внешнего мобильного устройства предоставляет дополнительный уровень защиты, позволяя пользователю получить доступ к своим данным в случае поломки своего мобильного устройства. HP Connected Backup передает для создания резервных копий только измененные данные, благодаря чему обеспечивается экономия времени, пропускной способности сети и пространства для хранения.

Одним из подходов к оптимизации хранения информации в средних и крупных организациях является архивирование, при котором объекты переносятся в недорогое хранилище, индексируются и могут быть быстро найдены и восстановлены в случае необходимости. Архивирование также может быть полезным с точки зрения оптимизации процессов резервного копирования — настроив архивирование одновременно в несколько репозиториев, можно получить отказоустойчивый архив.

HP Consolidated Archive — система организации архивирования данных, позволяющая переносить редко востребованные данные (старые сообщения электронной почты, файлы, объекты Microsoft SharePoint и т. п.) в единый архив, снижая нагрузку на продуктивные серверы, упрощая и ускоряя процедуры резервного копирования и восстановление их данных. При этом для пользователей доступ к архивированным данным можно сделать прозрачным за счет установки ссылок на архивные объекты, например, в почтовом клиенте или на файловом сервере. Для быстрого поиска объектов в архиве используется аналитический движок HP Intelligent Data Operating Layer (IDOL) [1], позволяющий организовать индексирование и аналитическую поисковую обработку практически неограниченных массивов структурированных и неструктурированных данных.

Аппаратные компоненты

Оборудование для резервного копирования и архивирования включает в себя ленточные библиотеки, дисковые библиотеки с дедупликацией и дисковые системы, подключаемые к сети (Network Attached Storage, NAS).

Ленточные библиотеки до сих пор пользуются популярностью в качестве недорогого средства копирования. Существуют различные форматы лент, но самым распространенным является открытый стандарт LTO, поддерживаемый ведущими ИТ-производителями. Рекомендуется использовать именно его, так как соблюдается преемственность поколений и есть возможность выбора поставщика. HP производит широкий спектр ленточных устройств — от отдельных приводов и систем для небольших компаний до библиотек корпоративного класса HP ESL G3. На предприятиях среднего и малого бизнеса наибольшей популярностью пользуется линейка MSL, модели которой позволяют хранить до 3,5 Пбайт данных в одной стойке. В ленточных накопителях HP Ultrium имеется функция, позволяющая сравнивать и корректировать скорости записи на ленту в зависимости от входящего потока данных, динамически синхронизируя скорость библиотеки со скоростью передачи данных от сервера. Другой функционал — утилита HP TapeAssure, позволяющая повысить эффективность использования ленточных библиотек и картриджей за счет проактивного мониторинга состояния, производительности, степени загрузки и исправности накопителей, а также средств резервного копирования. Ленточные библиотеки хороши для резервирования больших приложений и долгосрочных архивов (картриджи LTO-6 могут хранить данные до 30 лет), а для быстрого восстановления и одновременной записи множества приложений рекомендуется использовать дисковые библиотеки.

Дисковые библиотеки с дедупликацией предназначены для оперативного резервного копирования и быстрого восстановления бизнес-критичных данных. Обычно дедупликация устраняет до 95% повторяющихся данных, которые всегда присутствуют при резервировании, что позволяет до 20 раз сократить потребность в дисковой емкости, существенно экономя бюджет. Компания HP выпускает линейку библиотек StoreOnce, использующих тот же алгоритм дедупликации, что и Data Protector. Библиотеки StoreOnce совместимы с большинством популярных программных решений для резервного копирования, поддерживают интерфейсы iSCSI и Fibre Channel, эмулируют ленточные библиотеки (Virtual Tape Library) и выступают как NAS, предоставляя файловый доступ по протоколам CIFS, NFS и поддерживая OST (OpenStorage Technology). Cистема может эмулировать сотни и тысячи ленточных приводов, что позволяет осуществлять одновременную многопоточную запись и существенно сократить окно на резервное копирование. Имеется виртуальная версия библиотеки — StoreOnce VSA, работающая под гипервизором и превращающая обычный сервер в дисковую библиотеку StoreOnce, что может быть полезно для филиалов крупных организаций, у которых нет бюджетов на выделенную библиотеку.

Функционал HP StoreOnce Catalyst дисковых библиотек реализуется программным агентом, который устанавливается на медиасерверы и выполняет дедупликацию данных прямо на них, а уже дедуплицированные данные отправляет на систему HP StoreOnce. Это разгружает сеть и позволяет добиться высоких скоростей резервного копирования, так как пул серверов может быть производительнее, чем целевое устройство. Главным отличием HP Catalyst является работа не только по локальной, но и по глобальной сети, что позволяет не устанавливать в малых региональных офисах выделенную библиотеку HP StoreOnce — резервное копирование в дедуплицированном виде будет функцией библиотеки HP StoreOnce в центральном офисе.

Старшая в линейке система HP StoreOnce 6500 не имеет единой точки отказа — даже начальная конфигурация состоит из двух контроллеров, объединенных в отказоустойчивый кластер типа active-active, когда оба устройства активны и принимают участие в работе, а нагрузка делится между ними. При этом вместе с увеличением емкости увеличивается и производительность за счет параллельной работы — можно нарастить количество контроллеров до восьми.

Дисковые системы NAS обычно используются для архивов, хранения видео- и аудиоконтента, графической информации. Для этих целей компания HP предлагает линейку StoreAll, которая может масштабироваться до тысячи узлов хранения емкостью 16 Пбайт в рамках единой файловой системы. Система предназначена для хранения структурированных и неструктурированных данных, к которым можно применять всевозможные политики доступа и хранения.

Резервирование в облако

ЦОД HP предоставляют облачный сервис резервного копирования (Backup as a Service, BaaS). Заказчик может резервировать и архивировать файлы, приложения, почтовые сервисы и виртуальные машины, выбирать регулярность копирования, сроки хранения, тип носителя, политики доступа и возможности внесения изменений, количество копий и т. д. Шифрование ключами различной длины на площадке заказчика позволяет защитить данные от постороннего доступа. Обычно использование облачных сервисов для копирования является дополнительным средством защиты данных, а изначально резервирование делается на локальных носителях, что ускоряет процесс резервирования и не ставит компанию в зависимость от доступности каналов связи.

Комплексная система

Для эффективной защиты данных крупные организации должны использовать все упомянутые решения — в конфигурации резервного копирования и архивирования должно быть как минимум два ЦОД с репликацией или с зеркалированием данных (см. рисунок), при этом в каждом ЦОД необходимо установить систему резервного копирования (зеркалирование спасает лишь от аппаратных сбоев, но не от программных). В особых случаях используются три и более площадок — несколько основных и одна резервная, что повышает сохранность данных в случае крупных катастроф. Отдельно следует обратить внимание на используемую систему хранения, так как данные часто теряются вследствие ее неполадок, причем надо учесть, что наиболее распространенные на рынке двухконтроллерные массивы не обладают необходимой надежностью. Как показывает практика, при высокой нагрузке и выходе из строя одного контроллера, второй может не справиться с потоком данных и приложения аварийно завершатся, поэтому на рынке появились массивы среднего уровня с большим числом контроллеров, такие как HP 3Par StoreServ, HP StoreVirtual, Dell Equallogic.

Пример комплексной системы
Пример комплексной системы

 

В соответствии с политиками управления жизненным циклом информации редко востребованные данные переносятся в архив, где распределяются по различным устройствам хранения. Оставшиеся продуктивные данные классифицируются с учетом их критичности. Резервирование самых важных систем и данных рекомендуется производить с использованием мгновенных снимков на дисковых массивах в сочетании с последующим копированием на диск и/или ленту. Менее важные системы можно копировать на дисковую библиотеку, а затем на ленту. Наименее критичные к скорости копирования и времени восстановления системы допускается копировать только на ленту. Для обеспечения катастрофоустойчивости решения ленточные накопители можно хранить на отдельной площадке, регулярно проводя их ротацию. 

Интеграция HP Data Protector и HP 3Par StoreServ позволяет реализовать различные сложные сценарии защиты файловых систем и приложений.

  • Резервирование с нулевой нагрузкой на продуктивную систему. На дисковом массиве HP 3Par StoreServ создается мгновенный снимок, который передается хосту. Резервное копирование данных на момент создания снимка производится с этого хоста, позволяя продуктивному серверу продолжить работу без снижения производительности. После окончания резервного копирования созданный снимок удаляется с дискового массива.
  • Мгновенное восстановление. Сценарий аналогичен предыдущему за исключением того, что созданные снимки с массива не удаляются сразу после резервного копирования и могут быть использованы для мгновенного восстановления. При восстановлении происходит переключение томов на массиве, и текущие диски восстанавливаемого сервера заменяются на ранее сохраненные. Такой процесс позволяет быстро производить восстановление больших объемов данных.

Важным функционалом системы защиты данных является обеспечение быстрого восстановления наиболее критичных систем после аппаратных сбоев. HP Data Protector позволяет восстановить не только информацию из резервных копий, но и операционную систему, драйверы устройств и любую другую информацию, необходимую для загрузки сервера с нуля (Bare Metal Recovery). При этом поддерживается восстановление на оборудование, не идентичное исходному, а также восстановление из резервных копий физических серверов в виртуальные среды и наоборот.

Небольшим компаниям необязательно реализовывать все эти решения, им достаточно выбрать самые необходимые компоненты, а вторую площадку заменить резервированием в облако.

***

Построив правильную систему резервного копирования и архивирования, компания или организация может исключить риск потери информации и минимизировать простои ИТ-инфраструктуры, и хотя затраты на развертывание такого решения могут быть довольно существенными, они несопоставимы с возможными потерями из-за недоступности данных.

Литература

  1. Антон Иванов. Комплексный анализ неструктурированных данных // Открытые системы.СУБД. — 2013. — № 6. — С. 23–25. URL: http://www.osp.ru/os/2013/06/13036848 (дата обращения: 21.05.2014)

Алексей Поляков (Aleksey.Polyakov@hp.com) — менеджер по системам резервного копирования, Максим Луганский (Maxim.Lugansky@hp.com) — технический консультант по решениям управления информацией, компания «HP Россия и СНГ».