Последние разработки в области технологий резервного копирования помогают компаниям защитить постоянно растущие массивы данных.

Кому бы ни принадлежала фраза "чем больше — тем лучше", очевидно, что этому человеку никогда не приходилось копировать за ночь базу данных размером 300 Гбайт с критически важной информацией. Хотя наличие больших объемов данных позволяет повысить эффективность работы и сохранить конкурентоспособность компании, необходимость обработки и сохранения моря информации заставляет забыть об отдыхе тех, кто отвечает за доступ к этим данным.

В поиске идеальных решений для резервного копирования и хранения данных отрасли удалось добиться немалого успеха в разработке соответствующих систем, носителей информации и продуктов. Между тем с увеличением сложности и объемов данных растут и требования, предъявляемые к работе с ними.

В данной статье мы рассмотрим три основные области резервного копирования информации в сети: технологии накопителей на магнитных лентах, методологии для баз данных и резервное копирование данных с настольных систем. Наблюдаемый в каждой из них значительный прогресс позволяет компаниям увеличить емкость хранения своих сетей для сбережения бесценных информационных ресурсов.

Кроме рассмотрения перечисленных технологий мы коснемся некоторых новых методов и расскажем о том, какие типы систем могут стать широко доступными в не столь отдаленном будущем.

ОБРАБОТКА ДАННЫХ



Рисунок 1. Информационные ресурсы больших объемов, такие, как базы данных, служат одним из стимулов увеличения емкости систем резервного копирования. Согласно прогнозам компании Strategic Research, к 2000 г. объемы подлежащих копированию данных превысят 1 Тбайт для одного узла.
Взрывообразный рост объемов используемых данных привел к тому, что организации остались без подходящих решений масштаба предприятия для задач резервного копирования всей этой информации. Базы данных объемом от 200 до 300 Гбайт стали широкораспространенным явлением, и, как ожидается, в ближайшие несколько лет эти объемы вырастут до терабайта и даже более (см. Рисунок 1). Приведенные цифры объясняют, почему технологии резервного копирования и хранения информации отстают от нынешних требований. К счастью, прогресс наблюдается и здесь: производители предлагают некоторые интересные решения трудных сегодняшних задач.

История развития средств резервного копирования и хранения информации отмечена созданием целого ряда разнообразных, не похожих друг на друга продуктов и процессов, которые разрабатывались для достижения по сути одной и той же цели — сохранения ценных информационных ресурсов. Одним из таких носителей, претерпевшим в последнее время ряд усовершенствований, является магнитная лента. Основные достижения связаны с двумя форматами магнитной ленты: Advanced Intelligent Tape (AIT) и Travan Network Series.

Формат AIT был разработан компанией Sony как набор стандартов для увеличения скорости передачи и степени сжатия данных. Эта технология предусматривает использование в накопителе на магнитной ленте встроенного микропроцессора. 3,5-дюймовый накопитель с 8-миллиметровой лентой может вмещать до 50 Гбайт сжатых данных и обеспечивать скорость передачи 6 Мбайт/с (для сжатой информации). AIT предусматривает также аппаратную проверку данных посредством чтения сразу после записи, причем все дефектные секторы или блоки перезаписываются за один проход. Такая технология исключает необходимость в повторном проходе для проверки данных.

В AIT применяется также технология под названием "память на кассете" (Memory in Cassette, MIC). Это 15 Кбайт стираемой программируемой памяти (EPROM) на ленте, используемой для хранения журнала записанных на ленту данных, предыстории и других типов информации. Технология MIC значительно ускоряет время доступа и устраняет необходимость перематывать ленту к началу для доступа к конкретному сегменту данных. Чтобы найти требуемый сегмент, информацию достаточно считать из памяти EPROM, и накопитель немедленно перейдет к тому месту на ленте, где находится файл (в отличие от схемы поиска с перемоткой к началу ленты).

Информация EPROM помогает программному обеспечению определить, насколько нужно перемотать ленту вперед или назад, чтобы найти искомый сегмент данных, при этом считывать большое число маркеров с идентификаторами адресов не требуется. Для точного позиционирования считывающего устройства лента очень быстро перематывается примерно к искомому участку, а затем перемотка замедляется для считывания идентификаторов с ограниченной области ленты.

В накопителях AIT используется усовершенствованная лента с металлическим напылением (Advanced Metal Evaporated, AME). Такое напыление из чистого кобальта позволяет получить менее подверженную расслоению магнитную ленту, чем предыдущие форматы. Хотя AIT несовместим с прежними форматами 8-миллиметровой ленты, во многих ситуациях он обеспечивает более быстрый доступ к данным.

Ожидается, что к концу этого года производители начнут выпуск продуктов на основе формата AIT-2 с емкостью 100 Гбайт (при сжатии данных) и скоростью передачи, близкой к 12 Мбайт/с. Примером реализации технологии AIT может служить накопитель Sony SDX-S300C AITe. Эта система имеет емкость 25 Гбайт без сжатия и 50 Гбайт со сжатием данных, поддерживая скорость передачи, соответственно, 3 и 6 Мбайт/с. Еще один продукт данной категории — Sidewinder 50 компании Seagate Software. Этот AIT-накопитель поставляется с программным обеспечением Seagate Backup Exec NT. Sidewinder 50 позволяет записать на ленту до 50 Гбайт данных и поддерживает скорость передачи 3 (без уплотнения) или 6 Мбайт/с (с уплотнением).

На Рисунке 2 показана сеть устройств хранения, где взаимодействие системы хранения данных и сети осуществляется без посредничества сервера.



Рисунок 2. В этой сети устройств хранения, использующей технологии DLT и RAID, взаимодействие между запоминающими устройствами и сетью осуществляется без посредничества сервера. Это позволяет сделать данные более доступными и таким образом получить более эффективную и результативную конфигурацию.

TRAVAN И ЛЕНТОЧНЫЕ МАССИВЫ

Список предложений компании Travan пополнился новыми накопителями и лентами серии Travan Network Series (NS). Накопителями NS используется та же технология с контролем записи посредством чтения, что и в AIT, а общая емкость достигает 8 Гбайт на ленту (со сжатием данных).

Эксклюзивную лицензию на Travan NS приобрела компания Imation. Эта технология ориентирована на рабочие станции и серверы младшего класса. Согласно информации Imation, накопители Travan NS предназначены для рынка мощных настольных систем и небольших многочисленных серверов. В лентах Travan запись осуществляется линейно — дорожки располагаются в виде серпантина, в отличие от спиральной записи в лентах DAT.

Накопитель Hornet компании Seagate представляет собой устройство на базе технологии Travan, позволяющее хранить на одной ленте до 20 Гбайт данных и поддерживающее скорость обмена данными 2 Мбайт/с. Hornet обратно совместим с прежними лентами TR-1, TR-3 и TR-4.

Компания Spectra Logic недавно выпустила автоматизированную ленточную библиотеку, поддерживающую картриджи Travan NS-20. Это устройство под названием NS-20 TreeFrog поставляется с одним или двумя накопителями и 15 картриджами для данных, имеет драйверы для Windows NT и NetWare и может хранить до 150 Гбайт несжатых данных. Скорость передачи данных составляет 7,2 Гбайт/ч.

Многие организации начали экспериментировать с массивами накопителей на магнитной ленте, в которых несколько устройств работают совместно в целях увеличения производительности резервного копирования. Кроме того, такие устройства обеспечивают повышенную емкость, избыточность и отказоустойчивость, которые невозможно получить в конфигурациях с одним накопителем.

"Массивы накопителей на магнитной ленте применяются главным образом в тех случаях, когда время записи данных на ленту при существующих скоростях передачи и емкости запоминающих устройств оказывается слишком велико, — говорит Фарид Нима, президент компании Peripheral Concepts, специализирующейся на тестировании и анализе технологий резервного копирования. — Таким образом, при критических операциях резервного копирования высокоскоростной канал связи с производительным сервером не будет ограничен максимальной скоростью записи данных на один накопитель. Кроме того, ленточный массив способен заменить накопитель с очень большой емкостью".

Поскольку массивы накопителей на магнитной ленте предназначаются для согласованной, синхронной работы, надежность резервного копирования можно повысить за счет применения технологии RAID. Например, при использовании RAID 5 (в случае ленточных накопителей массив будет называться избыточным массивом недорогих лент — Redun-dant Array of Inexpensive Tapes, RAIT) — система может записывать данные на несколько лент одновременно, вместе с информацией о четности. В случае отказа ленты или накопителя оставшиеся накопители могут продолжать резервное копирование или восстановление, используя информацию о четности, которая записана на функционирующих накопителях. Хотя вычисление информации для контроля четности может замедлить процесс копирования, этот недостаток компенсируется дополнительной надежностью.

Некоторые менее сложные массивы накопителей на магнитной ленте предусматривают зеркальное отображение лент. В таком случае при отказе ленты или накопителя система обращается к его зеркальной копии и продолжает начатую операцию. Процесс зеркального отображения не столь эффективен, как распределение порций данных между разными накопителями (striping), применяемое в RAIT 5, поскольку никакого уменьшения времени записи не происходит, так как система может записывать в каждый момент только одну область данных. В смысле скорости он не может сравниться с процессом одновременного копирования данных на несколько накопителей с распределением данных между ними. Примером продукта, поддерживающего RAIT (зеркальное отображение и распределение данных), является ARCServe 6.5 от Cheyenne (подразделения Computer Associates).

Основной недостаток массивов накопителей на магнитной ленте состоит в том, что все ленты в массиве должны использоваться для резервного копирования и восстановления как один блок. Это создает дополнительные трудности, в частности, при хранении лент.

Некоторые из подобных проблем можно свести к минимуму с помощью ленточных библиотек, представляющих в спектре ленточных массивов устройства высшей ценовой категории. Компания Quantum недавно анонсировала свою библиотеку PowerStor L500 для лент DLT. Самая мощная система в этом семействе имеет емкость 980 Гбайт (со сжатием данных) и скорость передачи (сжатых данных) 30 Мбайт/с. (DLT — это магнитная лента, применяемая для резервного копирования в средних и крупных сетях. Она имеет ширину в полдюйма (1,27 см) и обеспечивает высокую скорость передачи данных. Картриджи вмещают до 35 Гбайт информации.)

Еще одна библиотека на магнитных лентах — устройство DLT LibraryXpress компании Overland Data. Эта система имеет емкость от 1 до 1,82 Тбайт и максимальную скорость передачи 144 Гбайт/ч (со сжатием). Подробнее о форматах магнитных лент рассказывается во врезке "Открытые форматы магнитных лент HP, IBM и Seagate".

ПОТОП ДАННЫХ

Согласно отчету "Анализ рынка сетевых продуктов резервного копирования за 1998 г." (1998 Network Backup Market Analysis), опубликованному компанией Strategic Research, крупные базы данных ставят непростые задачи резервного копирования и защиты данных. В отчете говорится, что даже при использовании самых передовых решений в данной области резервное копирование крупных баз данных остается очень дорогой операцией.

Фарид Нима из компании Peripheral Concepts подчеркивает сложность операций с крупными массивами данных. "Решения в области резервного копирования реализованы в большинстве компаний, но отводимый для выполнения этой операции интервал времени становится все меньше, а объемы данных почти ежегодно удваиваются", — отмечает он в этой связи. По прогнозам Нима, объемы корпоративных данных будут продолжать увеличиваться почти на 60% в год. Учитывая цифры, представленные Статистическим бюро США, показывающие, что каждый день создается миллиард новых файлов данных, это заключение выглядит правдоподобным.

К счастью, в отчете Strategic Research отмечаются и значительные достижения в производительности современных решений в области резервного копирования. Так, несколько поставщиков подобных решений достигли скорости копирования в 1 Тбайт/ч. Данный уровень производительности особенно привлекателен для тех компаний, системы которых требуют регулярного полного резервного копирования в сжатые сроки.

По ряду причин важность резервного копирования крупных баз продолжает возрастать. Современные системы охватывают многие приложения и инфраструктуры, включая электронную почту, мультимедиа и Intranet. Распространение складов данных также играет немаловажную роль. В представленном Strategic Research отчете говорится, что к 2000 году реляционные базы данных будут составлять более чем 50% всех серверных данных.

Транзакционные базы данных ставят особенно много проблем. Например, база данных, фактически вся состоящая из одного файла, может содержать миллионы записей. Произвести резервное копирование такой базы данных можно зачастую только после ее закрытия, однако во многих компаниях (например, в крупных банковских и финансовых учреждениях) остановка системы оперативной обработки транзакций недопустима.

В настоящее время для решения таких проблем применяется несколько подходов. Например, если критически важную базу данных требуется закрыть для резервного копирования, оптимальным методом было бы применение самых быстрых и высокопроизводительных аппаратных средств копирования, но они, естественно, очень дороги. Отдельные приложения для баз данных можно перевести в режим "только чтение", и выполнять резервное копирование без прерывания работы.

Некоторые производители усовершенствовали свои продукты в соответствии со все более строгими требованиями к резервному копированию баз данных. Например, компания Legato Systems усилила поддержку крупных баз данных с помощью модуля NetWorker BusinessSuite Module для ПО Informix. Данная система выполняет полное и инкрементное оперативное резервное копирование и позволяет интегрировать архивирование баз данных с резервным копированием файловой системы. Программные средства Legato имеют возможности автоматического планирования заданий на выполнение резервного копирования и поддерживают платформы UNIX и Windows NT.

Кроме того, Legato выпустила компонент NetWorker BusinessSuite Module для Lotus Notes/Domino, предназначенный для среды Windows NT, Solaris и AIX. Еще один недавно появившийся модуль поддерживает СУБД DB2 на платформе AIX, позволяя осуществлять резервное копирование нескольких серверов DB2.

Компания EMC модернизировала свою систему резервного копирования EMC Data Manager (EDM), способную в оперативном режиме архивировать многомегабайтные базы данных Oracle на платформе Windows NT. С помощью специального средства, получившего название EDM Symmetrix Path, массивы Symmetrix можно подключить непосредственно к серверам баз данных Oracle в обход сети. Symmetrix Path обеспечивает резервное копирование до 10 Тбайт данных.

Наконец, компания Seagate Software недавно объявила о начале поставок нового программного агента для Oracle Data Server 8 в среде Windows NT. Агент входит в состав ПО Seagate Backup Exec 7.0 for Windows NT и позволяет администраторам сетей пополнить список поддерживаемых процедур резервным копированием баз данных Oracle, устраняя необходимость в отдельной системе резервного копирования для базы данных Oracle.

РЕЗЕРВНОЕ КОПИРОВАНИЕ С НАСТОЛЬНЫХ СИСТЕМ

Потенциальная проблема, стоящая сегодня перед администраторами сетей, состоит в необходимости резервного копирования критически важных данных с настольных и портативных систем пользователей. Эти данные особенно уязвимы, так как нередко компании не учитывают их в своих планах в области резервного копирования.

Эд Купер, директор по стратегическим коммуникациям компании Legato Systems, выделяет в данной проблеме несколько тенденций. Например, при распределенных вычислениях многие задачи резервного копирования, еще вчера выполняемые специалистами по сетям, приходится поручать менее опытным сотрудникам. Кроме того, резервное копирование часто осуществляется автоматически, с помощью программных и аппаратных решений, которые очень редко проверяются (если проверяются вообще). Из-за ряда факторов, в частности из-за ориентации производителей средств резервного копирования на решения для серверов, резервному копированию данных с настольных систем не уделяется достаточно внимания.

Проведенное в мае 1998 г. компанией International Data Corp. исследование раскрывает некоторые причины такого положения. Во-первых, в прежних решениях для резервного копирования данных с клиентских ПК слишком большое число операций требовалось выполнять самому пользователю вручную. Во-вторых, эти решения не были в достаточной степени масштабируемыми, чтобы эффективно функционировать в сильно распределенной среде. Среди конкретных недостатков в отчете называются также трудности реализации политики администрирования, возложение на пользователя обременительных обязанностей по администрированию и (в случае сменных носителей) значительные требования к управлению.

В исследовании говорится, что, хотя основные игроки в области управления хранением данных начинают уделять по крайней мере часть своего внимания настольным системам, большинство интересных новаторских решений в данной области принадлежит таким поставщикам, как компания Stac, выпустившая ПО Replica Sequoia, в котором технология резервного копирования успешно доведена до уровня настольной системы. Stac хранит текущую динамическую копию данных каждой рабочей станции Windows NT или Windows 95, передавая изменения по сети в центральное хранилище, при этом исходные данные остаются доступными, так что пользователи могут продолжать обращаться ко всем своим файлам. Извлечь свои файлы пользователи могут с помощью интерфейса Microsoft Explorer.

Согласно информации компании Stac, обычно резервное копирование данных объемом в 500 Мбайт с настольной системы занимает менее минуты. Благодаря программному обеспечению Sequoia конечный пользователь, менеджер или администратор сети может полностью восстановить на рабочей станции поврежденную информацию, подключившись к локальной сети и выполнив полное восстановление. Для удаленных пользователей администраторы могут записать данные на CD.

Одной из основных процедур является реализованная в продукте Sequoia технология сжатия NetPack, обеспечивающая сохранение самой последней копии всех пользовательских файлов.

Еще один интересный подход к резервному копированию с настольных систем реализовала компания Mango в своей системе Medley. После инсталляции данного программного обеспечения на подключенных к сети ПК оно объединяет все неиспользуемое пространство на жестких дисках всех ПК в один логический диск, доступный всем пользователям, системы которых участвуют в таком пуле.

Согласно Medley, ее схема организации пула состоит в том, что разделяемый сетевой диск не находится постоянно на одном конкретном ПК. Продукт осуществляет мониторинг каждого жесткого диска в системе, оценивает объем занятого пространства и использует свободное пространство по мере необходимости. Хранимые на диске Medley данные (диск обозначается буквой M на каждой рабочей станции) часто перемещаются и не находятся постоянно в конкретном месте. Система хранения файлов Medley отслеживает характер использования дисков и автоматически переносит файлы на те ПК, пользователи которых чаще всего к ним обращаются. Пригодность каждой машины для хранения файлов Medley оценивает на основании измерения текущей загруженности ее центрального процессора и свободного места на диске.

Medley имеет также встроенные средства обеспечения отказоустойчивости: в любой момент времени пул содержит по крайней мере две копии каждого файла данных. В случае отказа машины, на которой хранятся файлы, пользователи все равно смогут работать с ними, поскольку ПО Medley автоматически считывает файлы из другого места и создает еще одну их копию на другой машине в пуле. Все эти процессы выполняются полностью прозрачно для пользователя.

Компания Mango недавно анонсировала ПО Medley97 for Windows NT. Данная система может функционировать в среде Windows NT 4.0 (на клиенте и сервере) и Windows 95/98.

Наконец, решение для резервного копирования настольных систем Client Exec, разработанное компанией Seagate, способно автоматически и прозрачным образом копировать данные с клиентской рабочей станции на сервер Windows NT 4.0 Server. ПО Client Exec (предлагаемое в качестве факультативного компонента Backup Exec for Windows NT) может обрабатывать данные с рабочих станций Windows 95 и Windows NT.

При использовании программного обеспечения Client Exec пользователи сохраняют постоянный доступ к своим файлам, а также могут самостоятельно выполнять их восстановление. Кроме того, эта программа поддерживает хранение нескольких версий одного файла (для обеспечения избыточности).

ТЕХНОЛОГИИ ЗАВТРАШНЕГО ДНЯ

В попытке создать идеальную систему резервного копирования новаторские технические решения будут и далее приводить к разработке все более эффективных систем. В отдельных сценариях (таких, как работа с изображениями и архивирование информации) жизнеспособным вариантом становится магнитооптическая технология. Хотя она занимает пока свою узкую нишу, расширение ее функциональных возможностей и спектра приложений может изменить ситуацию. Согласно данным исследовательской компании Strategic Research, технология Near Field Recording, разработанная компанией TeraStor, позволяет достичь очень высокой плотности записи данных. Метод Near Field Recording сочетает отдельные аспекты использования жестких дисков и новой оптической технологии. Компания заявляет, что эта технология открывает путь к созданию устройств хранения данных со сменными носителями большой емкости, не уступающих по производительности жестким дискам. Независимо от широты распространения этих подходов для резервного копирования, пользователи с их разнообразными требованиями остаются основной движущей силой, определяющей направления разработки и реализации новых, все более интересных решений задачи резервного копирования.


Джефф Данкельбергер имеет сертификаты Microsoft Certified Systems Engineer и Microsoft Certified Trainer. Он является президентом фирмы Intelligent Information Systems, оказывающей услуги по консалтингу, обучению и реализации серверов Web для компаний по всему миру. С ним можно связаться через Internet по адресу: jeff@i-squared.com или http://www.i-squared.com.

Открытые форматы магнитных лент HP, IBM и Seagate

С учетом всех технических новшеств производители средств резервного копирования и систем хранения данных все более остро нуждаются в соответствующих стандартах, дабы они могли сосредоточить свои усилия в определенном направлении. В ноябре 1997 г. компании IBM, Hewlett-Packard и Seagate Software объявили о заключении соглашения, направленного на создание открытой общей технологии для обмена записанными на магнитной ленте данными между устройствами хранения информации в корпоративной среде. Эти компании утверждают, что новый стандартный формат должен обеспечивать повышенную масштабируемость для широкого спектра системных платформ и сред (от одного сервера до крупной корпоративной сети). Весной 1998 г. компании обнародовали детали своего сотрудничества и анонсировали разработанную ими архитектуру LTO (Linear Tape Open).

LTO — один из вариантов используемой в настоящее время двунаправленной многоканальной технологии линейной записи. Технология LTO предлагает новые возможности, такие, как большее число параллельных каналов, усовершенствования в сервосистеме, улучшенный алгоритм сжатия данных и код с коррекцией ошибок, обеспечивающий более высокую эффективность записи на новую ленту высокой плотности. Как планируется, две предложенные реализации технологии LTO — Ultrium и Accelis — должны пройти через четыре этапа усовершенствования, причем каждый из этапов будет характеризоваться повышением плотности и производительности ленты по сравнению с предыдущим.

Формат Ultrium предназначен в первую очередь для устройств хранения большой емкости — для приложений резервного копирования, восстановления и архивирования. Конструктивно это картридж с одной бобиной ленты (компании заявляют, что такое решение дает возможность максимально увеличить емкость). Утверждается также, что Ultrium первого поколения будут иметь емкость несжатых данных до 100 Гбайт, а в четвертом поколении она должна быть доведена до 800 Гбайт. Максимальная ожидаемая скорость передачи данных достигает 10 и 160 Мбайт/с для первого и четвертого поколений соответственно.

В формате Accelis используется две бобины с лентой, причем лента загружается перемотанной до середины кассеты, что должно уменьшить время доступа. Компании-производители сообщают, что формат Accelis ориентирован на автоматизированные среды и подходит для широкого спектра оперативных запросов к данным, а также для приложений поиска информации. Обеспечивая в первом поколении емкость несжатых данных в 25 Гбайт и максимальную скорость передачи в 20 Мбайт/с, этот формат позволяет достичь среднего времени доступа менее 10 секунд. Производители сообщают, что четвертое поколение Accelis должно поддерживать скорость передачи несжатых данных 160 Мбайт/с и время доступа менее 7 секунд. Ожидается, что к четвертому поколению емкость достигнет 200 Гбайт. Хотя заявленные характеристики еще не реализованы на практике, они дают полезные ориентиры для разработчиков. При широкой поддержке данного формата в отрасли появление продуктов с маркировкой LTO на полках магазинов не заставит себя ждать.


Ресурсы

Информацию по оптическим устройствам хранения данных можно найти на сервере Web Ассоциации производителей оптических накопителей (Optical Storage Technology Association) по адресу: http://www.osta.org .

Сервер Web Консультативного совета по системам RAID (RAID Advisory Board) находится по адресу: http://www.raid-advisory.com .

Общие технические сведения по системам и технологиям хранения данных желающие найдут на серверах Web Института по технологиям хранения информации (Institute for Information Storage Technology, IIST) по адресу: http://www.iist.scu.edu и Национального консорциума производителей устройств хранения данных (National Storage Industry Consortium, NSIC) по адресу: http://www.nsic.org .