При аварии в сети потеря данных и доступа к жизненно важным службам может нанести смертельный удар по вашему бизнесу. Если, конечно, у вас нет четкого плана восстановления после аварии.


ПЛАН ВОССТАНОВЛЕНИЯ ПРИ АВАРИИ
ОПРЕДЕЛЕНИЕ ПРИОРИТЕТОВ
ЧУТОЧКУ ПРЕДУСМОТРИТЕЛЬНОСТИ
В ПИСЬМЕННОМ ВИДЕ, ПОЖАЛУЙСТА
УТОЧНЕНИЕ ВАШЕГО ПЛАНА

ИНСТРУМЕНТАРИЙ ВОССТАНОВЛЕНИЯ ПОСЛЕ АВАРИИ ПРИХОДИТ НА ПОМОЩЬ
Компьютер спасает себя сам


Катастрофы случаются всякие. Некоторые весьма впечатляют: взрыв бомбы во Всемирном торговом центре в Нью-Йорке привлек всеобщее внимание и вызвал в последующие три года волну процессов над террористами. Другие, вроде краха сервера или порчи данных, менее заметны. Но несмотря на огромную пропасть между "великими" и "малыми" катастрофами (никто не умирает, когда портится таблица размещения файлов) влияние, оказываемое любой аварией на компьютерную систему, зачастую одно и тоже - при сбое диска потеря данных неизбежна точно так же, как при взрыве бомбы гибель автомобиля.

К сожалению, планирование на случай аварии - один из тех проектов, на который администратор сети находит время только после выполнения нескончаемого списка срочных дел. Кроме того, многим людям просто неприятна мысль об аварии и ее возможных последствиях. Однако результаты уклонения от решения вопроса и пребывание в неведении могут быть просто ужасающими.

Год спустя после взрыва бомбы во Всемирном торговом центре журнал Survive! опубликовал следующие сведения: 150 из 350 компаний, располагавшихся в здании до взрыва, закрылось. Конечно, выходом компьютера из строя нельзя объяснить все последовавшие банкротства, тем не менее это одно из наиболее уязвимых мест. И хотя такие впечатляющие катастрофы, как ураган Эндрю, взрыв в Оклахома-Сити и крупные пожары, - события довольно редкие, для поддержания жизнеспособности организации планирование восстановления на случай более типичных сбоев системы просто необходимо.

Помимо регулярного резервного копирования наилучшим средством, обеспечивающим сохранность ваших данных, является план восстановления (ПВ) с детальным описанием необходимых действий в случае потери систем и данных. В нашей статье мы рассмотрим базовые составляющие плана восстановления. Несомненно, ваш план в соответствии с особенностями конкретной среды претерпит изменения в процессе доработки, однако описанный здесь план может служить в качестве типового практически для любой организации.

ПЛАН ВОССТАНОВЛЕНИЯ ПРИ АВАРИИ

Процесс планирования восстановления необходимо начать с составления списка потенциальных бедствий, с которыми ваша сеть может столкнуться. Это не означает, что вы должны предусмотреть всякую мыслимую чрезвычайную ситуацию (в конце концов, падение метеорита и сильный град наносят примерно одинаковый вред). Просто постарайтесь подумать о том, какие реальные аварии могут вас поджидать, и оцените время простоя в результате каждой из них. Ниже мы приводим несколько проблем, могущих иметь место в сети.

Сбой диска. Вне зависимости от того, файловый сервер это, мини-компьютер или мэйнфрейм, срок эксплуатации жестких дисков не вечен. Сбои дисков бывают разные - от случайных ошибок, исправить которые можно с помощью программных инструментальных средств, до невосстановимых физических повреждений диска.

Временное прекращение функционирования. Дисководы - только одна из функциональных частей компьютера. Если какой-либо физический компонент выходит из строя, система может оказаться в нерабочем состоянии на несколько часов или даже дней. Даже несмотря на то, что хранящейся на диске информации ничего не грозит, стоимость простоя системы может быть столь же высока, как и потеря данных. В некоторых организациях, например больницах, функциональность системы становится зачастую вопросом жизни и смерти.

Вирусы. Компьютерные вирусы представляют реальную постоянную угрозу сети. Если старые их штаммы, например Stoned, Jerusalem, Vienna и другие, обнаружить довольно легко, то их живучие потомки эволюционировали и мутировали в формы, от которых защитить сеть совсем не просто. Тем временем появились и совершенно новые виды вирусов, они инфицируют документы Microsoft Office или заражают ПК, проникая с приложениями Java или ActiveX, когда к ним обращаются из браузеров Web. Любой из этих новых мутировавших вирусов может проникнуть сквозь ваши антивирусные бастионы.

Хакеры. Общая информированность о хакерах стала гораздо выше, и многие администраторы залатали известные дыры в системе безопасности. Тем не менее широкая доступность Internet сделала многие организации намного уязвимее, чем когда-либо прежде. Особое беспокойство вызывают недавно обнаруженные дыры в некоторых популярных приложениях Internet. Например, через найденные в марте этого года дыры в Internet Explorer компании Microsoft хакеры могут управлять ПК дистанционно. Зачастую они удовлетворяются тем, что оставляют какой-либо след на вашем компьютере, но среди них попадаются и злобные вандалы или даже конкуренты, для которых ваши данные представляют важный интерес.

Физическое уничтожение. Под эту категорию подпадают природные катаклизмы и вредительские действия. Некоторые бедствия, например ураганы и землетрясения, характерны только для определенных областей; от других же, скажем, пожаров не застрахован никто.

ОПРЕДЕЛЕНИЕ ПРИОРИТЕТОВ

Следующий шаг в создании вашего плана - это определение приоритетных приложений, а именно: какие функции система должна выполнять сразу же после аварии, а с какими можно и подождать. При составлении этой части плана не исключены весьма неприятные моменты, поскольку сотрудники должны будут сами честно оценить, насколько важно их участие в работе вашей организации. Например, программистам банка придется определить степень необходимости разработки новой системы и после пожара, в то время как конечным пользователям надо будет оценить, насколько важны для них хранящиеся на файловом сервере программы текстовых процессоров. В обычных условиях эти инструменты, без сомнения, необходимы для выполнения задач, без которых успешная деятельность банка, особенно в долгосрочной перспективе, просто невозможна. Однако они могут и не быть настолько необходимыми в случае катастрофы, как немедленное восстановление способности банка проводить банковские операции.

В любой организации, за исключением разве что самых мелких, простое составление каталога всех имеющихся приложений сопряжено с разного рода сложностями. Одно из возможных решений здесь - это опрос менеджеров и представителей каждого отдела (этот вопрос слишком важен, чтобы проводить опрос в письменном виде). Вам следует попросить сотрудников подробно рассказать о том, что их отделы делают и какие приложения они используют. Прежде чем приступать к опросу, надо продумать категории, на которые вы собираетесь разбить приложения по степени важности. Ниже мы даем примеры таких категорий вместе с приложениями, которые они могут включать.

Важные постоянные бизнес-функции. Эта категория включает операции, которые организация, чтобы остаться жизнеспособной, должна продолжать выполнять при любых обстоятельствах. Например, важнейшая функция банков - выполнение банковских операций (включая операции по депозитам, перевод денег и т. п.), без которых в случае катастрофы клиенты могут запаниковать и в срочном порядке начать переводить свои деньги в другой банк.

Важные периодические бизнес-функции. Эта категория включает операции, выполнение которых должно осуществляться через регулярный интервал времени. Оформление ведомости на зарплату - один из примеров такого рода операций. Сотрудники могут смириться с некоторой задержкой выдачи заработной платы, если ваша организация попала в экстраординарную ситуацию, однако большинство из них вряд ли долго протянет без получки.

Важные функции для вторичных бизнес-целей. Эти операции являются необходимыми, но не первоочередными. Определить функции, относящиеся к этой категории, порою не так просто, поскольку многие не попавшие в первые две категории функции тем не менее стоят в списке приоритетных функций весьма высоко и должны быть восстановлены как можно быстрее после катастрофы. Вернемся к примеру с банком: взимание процентов по кредитам можно на некоторое время и приостановить - это не должно сказаться ни на положении банка, ни на его репутации.

Рутинные задачи. Здесь примером может служить доставка почты из одного офиса в другой. Эта связь необходима для нормальной жизнедеятельности компании в обычных условиях, но в чрезвычайных обстоятельствах она спокойно подождет.

Перспективные задачи. Данная категория включает прежде всего различные перспективные проекты и разработки; как правило, они могут быть отложены. В случае банка открытие новых филиалов или выход на новые рынки перед лицом чрезвычайных обстоятельств может быть перенесено на более поздний срок.

ЧУТОЧКУ ПРЕДУСМОТРИТЕЛЬНОСТИ

Третий этап в создании плана состоит из разработки и реализации превентивных мер. В принципе любой план восстановления предусматривает возможность того, что самые лучшие планы пойдут прахом, однако это не исключает необходимость изучения мер предотвращения таких ситуаций или смягчения их эффекта. Необходимо как минимум знание и реализация мер защиты данных, потому что они являются ключевыми для успешного восстановления после аварии; иначе вы можете оказаться с планом, предусматривающим восстановление данных, резервные копии которых так и не были сделаны. Ниже мы перечисляем необходимые меры.

Резервное копирование. Уже не раз говорилось, и мы еще раз повторим: чтобы быть во всеоружии в случае катастрофы, вы должны резервировать, резервировать и еще раз резервировать. Если данные регулярно копируются, хорошо документированы и хранятся в надежном месте, то вы в состоянии справиться с последствиями любой аварии. Например, в случае порчи диска его содержимое может быть загружено с магнитной ленты на новый диск; при уничтожении данных вирусами решение состоит в восстановлении незараженных данных с резервных носителей. Конечно, резервная лента и ломаного гроша не стоит, когда здание вместе с ней сгорает до основания. Ленты лучше всего хранить в другом помещении и для надежности копировать данные регулярно.

Избыточность данных. Сбои дисков на файловых серверах происходят чересчур часто, чтобы доверить им высококритические приложения (в отличие от общих офисных производственных программ вроде текстовых процессоров и электронных таблиц) без той или иной страховки. Резервное копирование данных само по себе не гарантирует достаточной защиты, поскольку восстановление - процесс очень медленный: вы должны заменить дефектный диск (это означает отключение всего сервера) и восстановить данные с резервных носителей. Учитывая вышесказанное, выход из строя одного диска может запросто привести к потере целого рабочего дня или даже более - многие организации просто не могут себе этого позволить.

Избыточные массивы недорогих дисков или RAID - это спецификация кластеров из нескольких дисков. Данные распределяются между дисками избыточным образом, так что сервер может продолжать выполнять свои функции, даже если один из дисков сбоит. Диски используются либо парами, либо массивами по три и более, причем каждый массив адресуется как один логический диск, называемый томом. (Дополнительную информацию о RAID см. в статье "Элементы дисковых подсистем сервера" в февральском номере нашего журнала. Кроме того, заинтересованный читатель может заглянуть на узел Web компании Invincible Technologies по адресу: www.invincible.com/rguide.htm- там он найдет историю и описание RAID.)

Антивирусное программное обеспечение. Учитывая тот ущерб, который вирусы могут нанести компьютерной системе, антивирусное программное обеспечение необходимо установить на каждую рабочую станцию и каждый сервер. Вследствие того, что доступ к Internet ускоряет распространение вирусов, база данных об их известных "сигнатурах" должна обновляться как можно чаще. В основном это делается посредством подписки.

Электропитание. Источники бесперебойного питания (ИБП) могут обеспечить питание центрального хоста от батарей в течение достаточного для нормального отключения системы времени. Некоторые ИБП обеспечивают питание системы по нескольку часов, но даже менее мощные ИБП, способные гарантировать лишь нормальное отключение, позволяют существенно снизить вероятность потери данных.

Брандмауэры. Если ваша сеть подключена к Internet, то она может стать объектом атаки хакеров. Один из способов предотвратить такого рода неприятность - это установить один из имеющихся на рынке брандмауэров.

Альтернативный центр обработки данных. Наличие площади и оборудования на случай невозможности продолжения работы в обычном месте поможет избежать многих неприятностей.

В ПИСЬМЕННОМ ВИДЕ, ПОЖАЛУЙСТА

Следующий этап процесса планирования - протоколирование инструкций. Подготовьте подробный список с инструкциями о том, что делать, когда какую-либо систему необходимо восстановить. В этот список необходимо включить следующую информацию.

Кому следует позвонить. Данный пункт должен включать представителей из каждого подразделения компании, а также членов отдела ИС. Однако помните, что план восстановления хорош тогда, когда он учитывает возможную по тем или иным причинам недоступность этих людей. Как бы это ужасно ни звучало, человек иногда не так уж и неуязвим, и порой он гибнет вместе с кораблем, так что план восстановления автоматизированных систем после катастрофы должен всегда составляться с учетом того, что нужные люди могут оказаться не в состоянии выполнять свои функции.

Где взять резервные ленты и копии на других носителях. Хранение данных в другом месте - весьма предусмотрительное решение, но, если процедуры восстановления четко не определены, оно может обернуться против вас. Ваш план восстановления должен содержать все сведения о хранении носителей в другом месте, в том числе какие контейнеры или комплекты лент хранят данные с того или иного сервера.

Имена и контактная информация о поставщиках, готовых предоставить новые компьютеры. Однако знания имени и телефона вашего дилера в некоторых случаях может оказаться недостаточно, особенно если организации спешно требуется большое количество компьютеров. Многие поставщики компьютерного оборудования предлагают специальные контракты на случай катастрофы, в которых они обязуются предоставить определенную партию оборудования в короткий период времени. Конечно, такого рода услуга стоит немалых денег, но расходы могут вполне себя оправдать: контракты с поставщиками на случай катастрофы не только дают письменную гарантию того, что ваша организация получит необходимые ей серверы и рабочие станции, но, кроме того, "вербуют" вам верных союзников, заинтересованных в том, чтобы ваша компания выжила и они смогли получить с вас по счетам.

Имена и контактная информация о поставщиках, способных помочь при восстановлении. Техническая помощь будет просто необходима, не только если в результате аварии пострадает системный администратор, но даже если все будут здоровы - при содействии процесс восстановления пройдет быстрее.

Инструкции по восстановлению данных с резервных носителей. Прежде чем касаться конкретных деталей восстановления, вы должны описать настройку таких компонентов, как программное и аппаратное обеспечение резервного копирования на магнитную ленту. Если вы используете на файловом сервере какой-либо конкретный накопитель или программу резервирования, то необходимо документировать свой выбор и записать рекомендации по их установке. Воспроизводить справочники по инсталляции не нужно. Вы должны будете просто отметить определенные особенности установки устройств и программ, на которые те, кто будет ее производить, должны обратить свое внимание, чтобы не изобретать колесо заново.

Подробная информация о том, как настроить рабочие станции и серверы для работы в восстановленной локальной сети. Этот раздел составляет квинтэссенцию вашего плана. Он должен описывать процедуру настройки, в том числе конфигурацию оборудования, подключение к сети, установку операционной системы, а также необходимых приложений или программного обеспечения для восстановления данных с резервных накопителей. Не забывайте о таких важных деталях, как типы сетевых плат, сетевые адреса и имена компьютеров.

Помните, что план предназначен для описания восстановления важнейших автоматизированных бизнес-функций, а не для инструктажа о воссоздании всех систем с нуля. Например, разработчики должны самостоятельно позаботиться о том, чтобы их коды и процедуры создания приложений были документированы; план восстановления должен гарантировать только быструю переустановку копии приложения.

УТОЧНЕНИЕ ВАШЕГО ПЛАНА

После того как ваш план в общих чертах составлен, настало время для его детальной проработки. Начать ее следует с проверки того, насколько рекомендации просты и понятны. Инструкции надо готовить с учетом того, что их будет выполнять кто-то другой без вашей помощи в случае, если и вы станете жертвой несчастья. Представьте себе, что составленные вами инструкции будут читаться - и выполняться - президентом компании, имеющим слабое представление о компьютерах.

Далее проверьте работоспособность вашего плана. Для тестирования вовсе незачем останавливать рабочую систему; вместо этого вы можете смоделировать восстановление с помощью альтернативной системы.

Наконец, после завершения плана вы должны его время от времени пересматривать. Конечно, было бы хорошо, если бы такой требовательный проект, как создание плана восстановления после аварии, удалось завершить раз и навсегда, но это из области чистой фантазии. Наверняка уже во время тестирования вы обнаружите слабые места своего проекта. Кроме того, появление новых важных систем неизбежно потребует внесения поправок. Анализ готовности вашего плана следует проводить раз в полгода для учета изменений данных и числа пользователей. Создание плана восстановления напоминает рисование линейных кораблей: только вы закончили, как пора начинать все снова.

Альтернативой самостоятельному составлению плана восстановления служит найм консультанта для анализа и рекомендации резервных процедур, а также для помощи в случае реальной аварии. Кроме того, вы можете приобрести программное обеспечение для составления плана восстановления, оно несколько ограничено в своих возможностях, но зато гораздо дешевле.

Ничто так не стимулирует проведение оценки степени важности информационных систем и хранимых данных, как внезапная их потеря. Можно сожалеть о все большей нашей зависимости от компьютеров, но восстановление необходимо вне зависимости от того, каким образом хранится информация - на магнитных дисках или на бумаге; кроме того, резервное копирование компьютеризированных данных и хранение копии в другом месте определенно проще копирования печатных материалов и их перевозки в другое помещение. Как бы сложно не было составить план, помните о том, что восстановление без плана будет еще труднее - спросите любого из тех седовласых системных администраторов, кому довелось испытать это на собственном опыте.


Джо Рудич - ведущий аналитик по клиент-серверным системам в St. Paul Company. С ним можно связаться по адресу: jrudich@interserv.com.

ИНСТРУМЕНТАРИЙ ВОССТАНОВЛЕНИЯ ПОСЛЕ АВАРИИ ПРИХОДИТ НА ПОМОЩЬ

Компьютер спасает себя сам

Задумывались ли вы о защите ваших компьютеров от аварий, способных вывести их из строя? Помните о пяти П: Предусмотрительное Планирование Предотвращает Плохую Производительность. Если ваша организация столкнулась с той или иной аварией, то качество и полнота документированного плана может существенным образом сказаться на быстроте, с которой нормальная жизнедеятельность компании будет восстановлена.

Одним из инструментов для составления хорошего плана может стать сам компьютер, точнее, программный пакет для планирования восстановления после аварий. Это весьма специализированный продукт и к тому же довольно дорогой. Кроме того, приложения данной категории различаются по функциям и цене. Ниже мы приводим список таких приложений.

Recovery Architect компании Strategia - это широко распространенная программа для формальной разработки плана восстановления центра обработки данных. План учитывает взаимосвязи и важнейшие приоритеты всех групп пользователей, а также имеющееся оборудование и специалистов. Recovery Architect предоставляет интегрированные средства резервирования/восстановления и составляет историю событий и отчеты о проверках.

Один из наиболее серьезных инструментов планирования восстановления после аварий - Contingency Planning and Recovery System for Windows компании Focus Group. CPR разделяет разработку и сопровождение плана на несколько компонентов и предлагает членам команды приоритетный список пошаговых инструкций. Среди компонентов CPR - управление резервированием и хранением, безопасность системы, планы для неограниченного числа устройств, отделов и мест; интерактивная документация по сопровождению, тестированию и обучению плану, а также возможность создавать настраиваемые отчеты для аудиторов, страховых и правительственных агентств.

Менее дорогие варианты представляют Phoenix for Windows компании Binomial International и Building Disaster Recovery Plan компании Contingency Strategies Associates. Оба эти приложения имеют спецификации для планирования и разработки стратегии восстановления. Кроме того, они предлагают настраиваемые отчеты и памятки для различных типичных аварийных ситуаций.

Напоследок одно замечание о программном обеспечении планирования восстановления после аварий: ваш план не имеет никакой ценности, если он хранится на компьютере, уничтоженном в результате аварии. Копия плана должна находиться в каком-либо ином месте!