До сих пор многие предприятия хранят резервные копии своих данных на магнитной ленте. Эта технология проверена годами, но организация соответствующих процессов очень сложна и трудоемка, в особенности если необходимо обеспечить защиту данных на случай возникновения чрезвычайных ситуаций. Более современные концепции предусматривают возможность автоматизированного резервного копирования посредством специализированных устройств с использованием жестких дисков, а также технологии дедупликации данных и их репликации в облако.

Работа по созданию резервных копий на ленточных накопителях вряд ли сможет принести лавры специалистам из отдела ИТ. Необходимая для этого инфраструктура должна включать в себя программное обеспечение для резервного копирования, ленточный накопитель, собственно ленты и специально обученных сотрудников, регулярно осуществляющих резервное копирование данных (в идеале это должно происходить в нерабочее время). Кроме того, записанные ленты надо регулярно перевозить в различные хранилища, располагающиеся за пределами предприятия, что требует организации полноценной логистической цепочки. В общем и целом объем физических усилий по работе с цифровыми данными достаточно велик, а если никаких катастроф не случится, эти ленты никогда никому не понадобятся, поэтому затраты на них вряд ли удастся внятно обосновать.

Но основная работа начинается как раз в том случае, когда данные с ленты действительно потребуются. Затраты усилий на поиск и восстановление отдельных файлов могут оказаться чрезвычайно высокими. Нередко случается так, что резервная копия оказывается устаревшей или лента повреждена. Даже при самом благоприятном раскладе такая работа занимает долгие часы, так как при обращении с лентами, которые сами по себе являются достаточно надежными, часто допускаются ошибки. Кроме того, поврежденные ленты не всегда удается сразу идентифицировать, а резервные копии некоторых файлов могут отсутствовать, если отвечавший за их создание сотрудник находился на больничном или в отпуске.

Восстановление всей системы с лент занимает слишком много времени, чтобы можно было вести речь о непрерывности деловых процессов. А уж необходимость регулярной перевозки носителей данных на автомобиле — это вообще настоящий анахронизм. При нынешней стоимости широкополосных соединений и систем хранения подходящее программное обеспечение позволит в значительной мере автоматизировать этот процесс.

РЕЗЕРВНОЕ КОПИРОВАНИЕ НА ЖЕСТКИЕ ДИСКИ

На крупных предприятиях повседневной практикой стало сохранение резервных копий на жестких дисках. Реализовать это очень просто: например, подсоединив жесткий диск SATA к серверам через разъем USB, администратор может регулярно проводить синхронизацию новых документов. Вот только ему придется выполнять некоторые действия вручную.

К тому же невозможно гарантировать, что подключаемые жесткие диски будут пригодны для использования в будущем, ведь неизвестно, будут ли они совместимы с новыми операционными системами.

Кроме того, открытым остается вопрос об эффективности аварийного восстановления данных (Disaster Recovery), то есть восстановления целых систем в случае чрезвычайных происшествий, когда инфраструктура ИТ пострадала от наводнения, пожара, диверсии или природной катастрофы. Чтобы гарантировать сохранность данных в таких ситуациях, администратору пришлось бы постоянно вручную копировать содержимое резервного жесткого диска на другие физические диски и вывозить их в хранилища, расположенные за пределами предприятия, — это столь же трудоемко, как и архивирование на ленту.

НА СМЕНУ ЛЕНТАМ ПРИХОДЯТ УСТРОЙСТВА РЕЗЕРВНОГО КОПИРОВАНИЯ

Профессиональные варианты систем для резервного копирования на жесткие диски позволяют автоматизировать этот процесс. Они объединяют сервер резервного копирования, специализированное программное обеспечение и процедуру сохранения файлов в разных местах в единый пакет. В качестве центрального элемента среды хранения выступает установленное в ЦОД устройство резервного копирования (Backup Appliance), которое буквально за несколько минут интегрируется в локальную сеть через консоль Web. Обычно такие серверы вмещают от 250 Гбайт до 25 Тбайт данных. Емкость систем хранения должна примерно в два раза превышать объем информации, который необходимо сохранить. При росте потребности в ресурсах хранения можно объединить несколько таких устройств.

Такие устройства автоматизируют локальные процессы резервного копирования, а кроме того, сокращают потребность в ресурсах хранения за счет использования технологии дедупликации данных и осуществляют контроль за репликацией данных во внешние хранилища. В отличие от традиционного резервного копирования на ленточные накопители, сервер резервного копирования выполняет полное сохранение данных лишь один раз. Затем данные обновляются инкрементально: программа ищет добавленные, измененные и удаленные файлы и вносит соответствующие изменения в резервные копии. Все данные, сохраняемые на жестком диске сервера резервного копирования, подвергаются дедупликации и сжатию, причем первый из этих процессов наиболее важен. Например, файл MPEG, упакованный в архив ZIP, занимает примерно столько же места на диске, сколько незаархивированный вариант, то есть сжатие файла не приносит особой выгоды. Но если один и тот же файл MPEG будет сохранен десятью пользователями, сервер резервного копирования сделает это лишь один раз, а для всех остальных случаев создаст ссылки, указывающие на местоположение файла, что позволит сэкономить 90% дискового пространства.

Однако дедупликация может осуществляться не только на уровне целых файлов (как при реализации концепции однократного сохранения данных — Single Instance Storage). Алгоритм дедупликации анализирует файлы, разделяя их на множество отдельных блоков, как правило, размером в несколько килобайтов. Эти блоки, в свою очередь, снабжаются значением хэшфункции. Блоки с одинаковыми значениями хэш-функции практически наверняка будут идентичны. Теперь, вместо того чтобы каждый раз повторно сохранять уже знакомые блоки, система просто оставляет ссылку на уже имеющиеся. В результате сервер резервного копирования записывает только новые, еще не знакомые ему битовые последовательности. Таким образом, дедупликация данных позволяет предотвратить чрезмерный рост объемов сохраняемых данных, а также избежать увеличения окна резервного копирования когда:

  • разные пользователи или конечные устройства сохраняют одни и те же данные;
  • одни и те же данные находятся на разных конечных устройствах и системах;
  • в нескольких последовательно созданных моментальных снимках (Snapshots) большая часть данных остается без изменений;
  • на многих конечных устройствах выполняются одни и те же программы;
  • сотрудники предприятия постоянно работают с большим количеством схожих файлов — к примеру, с различными версиями файлов PowerPoint или Word.

По сравнению с традиционными полными резервными копиями серверы резервного копирования способны снизить потребность в ресурсах хранения данных вплоть до одной пятидесятой. Изменение объема сохраняемой информации при использовании технологии дедупликации данных зависит от типа данных. Так, видеофайлы поддаются дедупликации, только если они полностью идентичны, в то время как сервер резервного копирования действительно лишь однократно сохраняет повторяющиеся элементы в измененных или дополненных электронных письмах.

Как правило, чем больше сеть, тем выше в ней доля избыточных данных. Один из важнейших эффектов дедупликации — сокращение окна резервного копирования. Если на некоторых предприятиях ленточным накопителям приходится работать всю ночь, то для этой технологии, записывающей лишь изменения, одного часа оказывается более чем достаточно. А поскольку личного участия сотрудников не требуется, система может делать резервные копии по нескольку раз в день.

РЕПЛИКАЦИЯ В ОБЛАКО

Логичный способ снизить стоимость хранения резервных копий за пределами предприятия (на случай чрезвычайных ситуаций) состоит в репликации данных в облако — вместо размещения их в корпоративных ЦОД в других филиалах (см. Рисунок 1). При таком подходе данные отправляются в различные места хранения после дедупликации и шифрования.

 

Рисунок 1. На случай возникновения чрезвычайных ситуаций и аварийного восстановления информации сервер резервного копирования автоматически реплицирует сохраняемые данные в различные места хранения: либо в облако производителя, либо к сервис-провайдеру.
Рисунок 1. На случай возникновения чрезвычайных ситуаций и аварийного восстановления информации сервер резервного копирования автоматически реплицирует сохраняемые данные в различные места хранения: либо в облако производителя, либо к сервис-провайдеру.

 

Если в процессе их сохранения возникает нарушение целостности файлов или какие-то из них теряются во время передачи, система автоматически уведомляет об этом администратора.

Ассортимент таких услуг достаточно широк, однако не все они пользуются благожелательным отношением со стороны потребителей. Многие предприятия не готовы передать свою ценную и конфиденциальную информацию для размещения в каком-то довольно расплывчато очерченном облаке. Кроме того, федеральный закон США, принятый в октябре 2001 года, так называемый «Патриотический акт», ставит американских сервис-провайдеров в сложное положение, поскольку он противоречит европейскому законодательству в отношении доступа спецслужб к личной и корпоративной информации.

Поэтому лучшим вариантом зачастую оказывается внутреннее облако (Private Cloud) местного провайдера услуг безопасности. Тому, кто отвечает за управление брандмауэром, можно доверить и хранение резервных копий. Многие устройства резервного копирования предусматривают возможность создания из нескольких таких устройств внутреннего облака между поставщиком ИТ-услуг и его заказчиком. К тому же с помощью мощного многопользовательского устройства сервис-провайдер способен одновременно обслуживать несколько клиентов.

Те, кто хотели бы полностью отказаться от размещаемых на предприятиях серверов резервного копирования, чтобы сделать ставку на резервное копирование в облако, должны понимать, что в таком случае восстановление файлов будет занимать намного больше времени. Для большинства организаций наиболее удобным вариантом является использование локального устройства с возможностью автоматизации процессов и поддержкой функций дедупликации и репликации данных.

Простота администрирования процессов сохранения данных при использовании специализированных устройств резервного копирования может значительно облегчить труд сотрудников отдела ИТ. Консоль Web позволяет администратору управлять настройками и получать текущую информацию о состоянии процессов резервного копирования. Восстановление данных с локального сервера резервного копирования тоже требует лишь нескольких щелчков мышью: достаточно выбрать версию сохраненного файла, которую необходимо восстановить, и указать, куда нужно записать данные.

Виланд Альге — генеральный менеджер по региону ЕМЕА в компании Barracuda Networks.