При этом одной из важнейших задач становится обеспечение сохранности данных и восстановление работы информационных систем, даже в случае полной утраты офисных зданий.

Политика сохранности и восстановления данных (Disaster Recovery) в случае природных и техногенных катастроф, террористических атак, а также обычных утрат, вызванных человеческим фактором, обычно включается в состав более широкой корпоративной концепции сохранения бизнеса (Business Continuity). События 11 сентября 2001 г. в WTC Нью-Йорка, цунами в Азии в 2004-м, несколько разрушительных ураганов на юге США в следующем году еще раз продемонстрировали, что ни один бизнес, где бы он ни располагался, не гарантирован от различного рода катастроф и других чрезвычайных ситуаций. Мощность подобных атак и стихийных бедствий способна не только нарушить отдельные бизнес-процессы, но и полностью остановить деятельность компании.

Впрочем, угрозы, приводящие к большим убыткам, могут иметь и менее глобальный характер, что, однако, не отменяет необходимости профилактики и заблаговременной подготовки к ним. Как показали исследования, в 2003 г. около 60% малых и средних предприятий по всему миру вынуждены были приостановить свой бизнес на период от 1 до 24 ч (Veritas, 2003). При этом 43% пострадавших компаний так и не смогли открыться вновь, а еще 29% были закрыты в течение двух следующих лет (McGladrey and Pullen, 2004). Таким образом, только 28% предприятий продолжили дальнейшую работу.

Среди главных причин растущего спроса на средства Disaster Recovery можно выделить стремление избежать упущенной выгоды или потери бизнеса в целом, а также вероятность выплаты различных штрафных сумм по неисполненным контрактам.

К примеру, поставщикам продукции и услуг грозят штрафные санкции, если они не отгрузят товар или не предоставят услугу вовремя, а ведь дело может быть не только в форс-мажорных обстоятельствах, но и в отключении электричества, халатности персонала и т. п. Будучи важным направлением в корпоративной политике ИТ на Западе, Disaster Recovery приобретает все большее значение и в России.

ДЛЯ НАИХУДШЕГО СЛУЧАЯ

В Deutsche UFG, одном из подразделений инвестиционного направления «Группы Дойче Банк» в России, с 2003 г. используется система Double-Take Software. Данная система позволяет обеспечить воостановление работоспособности систем ИТ в течение короткого промежутка времени с минимальными потерями данных или вообще без таковых, что необходимо, учитывая специфику деятельности компании (см. врезку «Коротко о главном»).

При разработке генерального плана Disaster Recovery компания ориентировалась на самый пессимистичный сценарий — полную утрату здания в результате любой из чрезвычайных ситуаций. Этот план касается не только подразделения ИТ — он охватывает все процедуры, выполнение которых должно обеспечивать сохранение бизнеса в целом.

В рамках плана восстановления данных в качестве основной цели перед специалистами Deutsche UFG была поставлена задача тиражирования пяти ключевых серверов на оборудование в резервном офисе, который, впрочем, требовалось вначале создать. В мировой практике временной отрезок, прошедший с момента «краха» системы до ее восстановления, называется Recovery Time Objective (RTO). Обычно его стремятся сократить за счет запуска резервных мощностей, находящихся вне проблемной зоны.

Рисунок 1. Схема подключения резервного офиса для обеспечения бесперебойной работы.

В соответствии с требованиями генерального плана Disaster Recovery на восстановление работоспособности инфраструктуры ИТ отводился 1 ч, однако руководство группы ИТ сочло возможным сократить этот показатель вдвое. В случае сбоя основных серверов в течение 30 мин должны были заработать пять резервных машин. Восстановлению подлежали не только базы данных, но и различные сервисы, включая почтовую службу MS Exchange и файловые серверы.

Проект стартовал осенью 2004 г. Прежде всего предстояло определиться с полнофункциональным программным решением, а затем сформировать подходящую для него аппаратную структуру. В некотором смысле выбор решения был предопределен, так как продукт Double-Take Software соответствовал всем требованиям Deutsche UFG.

СВОЕВРЕМЕННАЯ РЕАКЦИЯ

Решение Double-Take применяется для защиты данных и их восстановления, обеспечения высокой доступности и осуществления централизованного резервного копирования.

В частности, оно позволяет обеспечить защиту и восстановление данных, сервисов и приложений MS Exchange, MS SQL Server, Oracle, SharePoint и многих других. Double-Take имеет сертификацию всех уровней для Windows 2000, 2003 и, по мнению компании-разработчика, обеспечивает лучшую защиту данных, чем многие аппаратные решения, при более низкой цене.

Система Double-Take обеспечивает тиражирование данных в реальном времени, поддержку локальных и глобальных сетей, а также сетей хранения на базе IP, причем для развертывания системы можно использовать уже имеющееся в наличии оборудование. Для внедрения и обслуживания не требуется привлекать большое количество специалистов, поэтому оно доступно не только крупным компаниям из списка Fortune 500 (как утверждается, половина из них используют Double-Take).

Double-Take отличается от обычных решений резервного копирования тем, что тиражирование производится постоянно, поэтому в случае сбоя основной системы восстановление происходит не на дату последней сохраненной копии, а на момент сбоя. В банковском бизнесе это обстоятельство имеет критическое значение, поскольку сбой системы с утратой данных может привести к убыткам не в одну тысячу долларов, даже если резервная копия была сделана предшествующей ночью.

Система работает следующим образом. На машину-источник данных и на целевой сервер устанавливается специальный программный модуль. Затем с помощью клиентского приложения пользователю предлагается выбрать данные для тиражирования и место их резервного хранения. После проведения предварительного конфигурирования процесс выполняется автоматически и прозрачно. Важным моментом является то, что зеркалирование возможно, даже когда источник данных активен.

ТОНКАЯ НАСТРОЙКА

Первичную установку решения в Deutsche UFG произвели специалисты зарубежной компании-дистрибьютора SunBelt Software — одного из главных поставщиков и экспертов по Double-Take в Европе и США (в настоящее время она вошла в состав Double-Take Software). В результате при участии специалистов Quarta Technologies было налажено тиражирование основных сервисов, составлен подробный отчет о проделанной работе и организована техническая поддержка по электронной почте и телефону из Франции. Однако, помимо этого, необходимо было реализовать поддержку остальных сервисов и обеспечить постоянное развитие и мониторинг системы. Эти работы были поручены российской компании, так как услуги зарубежного исполнителя обошлись бы неоправданно дорого.

По итогам небольшого корпоративного исследования для окончательного внедрения, развития и поддержки решения была выбрана компания Quarta Technologies. Deutsche UFG уже сотрудничала с Quarta Technologies в сфере поставки программного обеспечения, однако, по словам Бориса Сажина, руководителя группы ИТ в Deutsche UFG, решающим доводом послужило то, что именно этот подрядчик наиболее оперативно откликнулся на запрос, предоставив исчерпывающий план действий по развитию и мониторингу системы Double-Take.

Сложность полнофункционального внедрения заключалась в том, что рабочие процессы Deutsche UFG прерывать нельзя, поэтому все работы приходилось производить в нерабочее время и с большими ограничениями. Дополнительные трудности возникли по причине больших объемов тиражируемых данных. К примеру, размер только почтовой базы составлял около 500 Гбайт.

Впрочем, задачу облегчал тот факт, что заказчик заранее приобрел всю необходимую аппаратную инфраструктуру — еще до заказа программного решения были закуплены серверы HP серий ML и DL, оборудование Cisco, арендован канал до Disaster Recovery Site (помещения вне здания, где находится резервное оборудование). Однако, как показали расчеты, существующий канал в 10 Мбит/с не в состоянии справиться с фактическим объемом данных, и его пришлось расширить до 30 Мбит/с.

Специалисты Quarta Technologies под контролем Deutsche UFG разработали подробную методику внедрения проекта и подготовили набор документов, где были определены этапы работ и желаемые результаты каждого из них. Методика внедрения была выработана после пилотных стендовых испытаний проекта, в течение которых проверялась работоспособность сервисов без привлечения объектов данных (т. е. непосредственно самих баз данных серверов SQL). Дополнительно была подготовлена пошаговая инструкция, где описываются все действия технического персонала по передислокации в резервный центр в случае наступления «часа X» на заранее оснащенные рабочие места. Местонахождение резервного оборудования и рабочих мест держится в секрете и известно ограниченному кругу лиц.

По признанию обеих сторон, важная роль отводилась контролю качества, планированию и документированию. Как утверждается, система вполне может быть сертифицирована по стандарту ISO 9001, хотя такой цели при внедрении не ставилось. «Даже если вы не собираетесь проходить сертификацию ISO 9001, на нее все равно стоит ориентироваться, так как эти стандарты разработаны профессионалами на основе реального опыта», — считает Александр Голев, технический руководитель проекта со стороны Quarta Technologies.

Этап непосредственного внедрения начался в феврале 2005 г. и завершиться через 11 месяцев.

В ТЕСНОМ ВЗАИМОДЕЙСТВИИ

Проектная команда Quarta Techno-logies состояла из трех человек. Необходимость поддержки MS Exchange потребовала включить в нее отдельного специалиста, который бы осуществлял настройку тиражирования почтовых сервисов. Со стороны заказчика в проекте участвовали также три сотрудника, это занимало до 70% их рабочего времени. В обязанности представителей Deutsche UFG входили контроль тестов на испытательном стенде, выработка дополнительных требований и утверждение отчетной документации.

Важная роль отводилась подразделению Business Support Group, входящему в отдел ИТ заказчика. В его компетенции находится консультация по бизнес-процессам и действующим приложениям в рамках компании. Впрочем, оглядываясь назад, в Deutsche UFG пришли к выводу, что Business Support Group стоило бы задействовать более активно, а еще лучше — изначально ввести в состав проектной группы. Это позволило бы существенно ускорить внедрение, так как данная группа обладает наиболее полной экспертизой по приложениям, сервисам и бизнес-процессам компании. Впредь в своих будущих проектах Deutsche UFG намерена поступать именно так.

Работа по внедрению проводилась итерационно. Каждая итерация сопровождалась двухуровневым тестированием. Первый уровень — тесты ИТ на работоспособность сервисов. Второй — тестирование работоспособности приложений. Обнаруженные ошибки не исправлялись на месте, а просто регистрировались. По результатам составлялись отчеты, замечания, рекомендации и дополнения. Всего проведено три полных итерации.

В процессе внедрения из Quarta Technologies была выделена компания Quarta Consulting как отдельное юридическое лицо. Это позволило исполнителю более плотно заняться проектом Double-Take в Deutsche UFG и подготовить базу для будущих работ Quarta в сфере ИТ-консалтинга.

ЗАВЕРШАЮЩАЯ ФАЗА

В 2006 г. проект вступил в свою нынешнюю фазу — мониторинг и поддержку. Мониторинг необходим для поддержания работоспособности системы и своевременной профилактики или устранения сбоев. Под постоянным наблюдением в Deutsche UFG находятся дисковые системы, процессоры, оперативная память. При помощи утилиты Performance Monitor информация собирается ежедневно и объединяется в еженедельные отчеты, предоставляемые компанией Quarta. Налаженная служба оповещения информирует по электронной почте о различных критических событиях в режиме реального времени, таких, как остановка и перезапуск сервисов, угроза исчерпания дискового пространства, переполнение очереди памяти и т. д. Со стороны исполнителя поддержкой мониторинга обычно занимается один специалист.

По итогам мониторинга и заказчик, и исполнитель могут вырабатывать требования/предложения по развитию системы. Так, уже не раз принимались решения о покупке дополнительных жестких дисков по причине быстрого роста объема тиражируемых данных. Как отмечают в Deutsche UFG, хотя проект закончен, процесс поддержки Disaster Recovery будет оставаться таковым до тех пор, пока сохраняется угроза возникновения чрезвычайной ситуации.

Весной в рамках технической поддержки проведено обновление программного обеспечения Double-Take до версии 4.4 (изначально была развернута версия 4.3). Самым важным ее отличием является возможность сжатия данных, что позволило наполовину снизить объем трафика, а также сократить на 30% и без того редкие сбои драйверов. Для работ по обновлению понадобилось 4 человекочаса, а весь процесс, начиная от планирования операции до подведения итогов, занял не более трех рабочих дней.

Андрей Олищук — корреспондент «Журнала сетевых решений/LAN».


Коротко о главном

Deutsche UFG, подразделение инвестиционного направления «Группы Дойче Банк»

Москва, ул. Поварская, д. 10, стр. 1

http://www.ufg.ru

Факты. Deutsche UFG занимается инвестиционными проектами, работает в области торговли ценными бумагами (Equity Trading) и управления корпоративными финансами. Исторически Deutsche UFG является одним из маркетмейкеров Российской торговой системы (РТС), входит в число участников РТС, ММВБ, Московской фондовой биржи, НАУФОР, а также состоит членом Лондонской фондовой биржи. В 2005 г. в рейтинге журнала Euromoney Deutsche UFG победила в номинации «Лучший инвестиционный банк», а в предыдущие годы была названа «Лучшим деловым партнером на российском рынке» и получила награду за «Лучшую сделку в области M&A».

Задачи. Перед руководством Deutsche UFG встала задача разработки генерального плана Disaster Recovery, рассчитанного на сохранение всех бизнес-процессов даже в случае утраты офисного здания вследствие любых природных и техногенных катостроф, включая террористические угрозы. В рамках данного плана на отдел ИТ была возложена ответственность за формирование системы быстрого восстановления данных и работоспособности ключевых сервисов ИТ.

Решение. Для реализации поставленной задачи руководство отдела ИТ выбрало продукт Double-Take. С помощью выбранной системы в Deutsche UFG были налажены резервное копирование и тиражирование баз данных MS SQL, файловых серверов, почтовых сервисов MS Exchage и специализированного финансового ПО. Вся сложность внедрения заключалась в том, что работу систем ИТ нельзя было прерывать.

Вывод. В результате нескольких итераций внедрения система была полностью развернута и поставлена в режим технического сопровождения и мониторинга. Все данные передаются по широкому каналу к запасным серверам и тиражируются в оперативном режиме. По итогам проведения регулярных мероприятий компания-заказчик имеет возможность прогнозировать проблемы (к примеру, нехватку дискового пространства) и влиять на их профилактику, а в случае экстренных ситуаций все жизненно необходимые данные и сервисы могут быть восстановлены в течение 1 ч.

Поделитесь материалом с коллегами и друзьями