Поскольку обеспечение непрерывности бизнеса системы в ряду других проектов занимает довольно скромное место, ошибки здесь не редкость. Опросив руководителей ИТ-служб и других экспертов, мы попытались выяснить, что чаще всего забывают сделать или упускают из виду при планировании восстановительных процедур. Оказалось, что обычно все сводится к пяти классическим ситуациям.

Ошибка 1. Неудовлетворительная предварительная подготовка

Сотрудники ИТ-службы зачастую пренебрегают опросом пользователей и руководителей основных подразделений, благодаря которому можно выяснить, какие приложения для них важнее всего. Это приводит к ошибкам в расстановке приоритетов и неверному определению порядка проведения восстановительных мероприятий. Сотрудники ИТ-службы считают, что в первую очередь следует восстанавливать ключевые корпоративные бизнес-приложения.

На самом же деле более всего ощущается потребность в простых прикладных программах — в электронной почте, например. Как узнать, что важнее? Спросите пользователей.

Рекомендация: сотрудники ИТ-службы постоянно слышат о том, что программные системы CRM и ERP имеют критически важное для компании значение. Но чтобы узнать, какие приложения нужны пользователям в первую очередь задайте им этот вопрос напрямую.

Ошибка 2. Подготовка к восстановлению усилиями одной ИТ-службы

«Общее заблуждение заключается в том, что восстановление системы после серьезных сбоев и непрерывность бизнеса — синонимы, — заметил директор ИТ-службы компании Southern California Water Дон О?Коннор. — Но это далеко не так». Даже в недостаточно подготовленных ИТ-службах продуман план действий на случай возникновения непредвиденных обстоятельств. А можно ли сказать это о других группах?

«Мой опыт показывает, что ИТ-служба реагирует на все относительно быстро, — подчеркнул О?Коннор. — Действительно ненадежное звено — это пользователи».

Рекомендация: сотрудники компании должны понимать, что перезагрузка систем и восстановление данных — это лишь часть того, что предстоит сделать. В планы восстановления после катастроф необходимо включить мероприятия, которые должны выполнить руководители основных направлений и конечные пользователи. Ведь именно они на себе испытывают все неприятности кризисной ситуации.

«Слишком часто получается, что за обеспечение непрерывности бизнеса отвечает только ИТ-служба, — заметил Лундстрем. — А ведь на самом деле — это задача, которую должны решать все».

Ошибка 3. Подготовка к прошедшей войне

Генералы всегда готовятся воевать так, как они делали это в последний раз, а многие предприятия тратят свои деньги и энергию на подготовку к тем неприятностям, которые случились с ними в прошлый раз. С точки зрения инстинкта самосохранения, это вполне понятно, но аварии имеют такую природу, что их почти невозможно предсказать.

В недавней истории можно увидеть массу примеров. Утром 11 сентября 2001 года террористы атаковали здания Всемирного торгового центра, в которых находились многие из базирующихся в Нью-Йорке финансовых компаний.

Естественно, компании хотелось бы создать себе «запасной аэродром» на такой случай, и вот огромные деньги тратятся на строительство резервного центра, который располагается «за речкой», в Джерси-сити.

Но следующий кризис, обрушившийся на Манхэттен, — масштабная авария энергосетей в августе 2003 года — сопровождался отключением электроэнергии и в Нью-Джерси.

Рекомендация: безусловно, к определенным событиям (атакам террористов или хакеров, землетрясениям, пожарам и т. д.) нужно готовиться заранее, но не стоит думать, что можно предвидеть все. Необходимо составить план действий, учитывая не какие-то конкретные ситуации, а их вероятные последствия.

Ошибка 4. Недостаточное внимание к подготовке людей

Еще один урок, полученный 11 сентября, заключается в том, что даже самое совершенное оборудование для резервирования поможет лишь в том случае, если вы сможете им воспользоваться.

«У ряда организаций имелись центры восстановления данных в Нижнем Манхэттене, — отметил аналитик Gartner Карл Клонч. — Однако сразу после обрушения башен ВТЦ полиция перестала пускать персонал внутрь зданий. Оборудование находилось в отличном состоянии, но его возможности так и остались невостребованными».

Такое может произойти, например, при эвакуации людей из здания, при аварии лифта или при перекрытии основной магистрали.

Другой вопрос связан с квалификацией тех, кто в конечном итоге получает доступ к резервному оборудованию.

Слишком много руководителей — особенно те из них, кто не слишком серьезно подходит к организации процедуры восстановления, — рассчитывают на то, что ИТ-специалисты, приложив героические усилия, помогут им выбраться из кризиса. Но, как справедливо заметил ведущий разработчик программного обеспечения компании Gap Алберт Лэйн, занимающийся планированием мероприятий по восстановлению в различных организациях на протяжении 20 лет, «вы никогда не знаете, вернутся ли к вам завтра те сотрудники, которым здесь отводится ключевая роль».

Рекомендация: необходимо подготовить абсолютно ясную документацию. «Мы составляем документы таким образом, чтобы в случае необходимости любой человек мог запустить приложение заново, — подчеркнул Лэйн. — Следует организовать все так, чтобы в офисе всегда был сотрудник, способный исправить положение».

Ошибка 5. Самообман и пустая трата времени

«Конечно, компании тестируют имеющиеся у них средства, — отметил Клонч. — Но поскольку проведение полноценных испытаний требует слишком большого количества ресурсов, их обычно откладывают на потом. В результате сотрудники ИТ-службы, движимые естественным желанием выполнить все тесты в лучшем виде, оказываются в нелепом положении. Они готовятся. Подбирают инструменты, изучают процедуры. А затем, когда ситуация действительно выходит из-под контроля, выясняется, что неисправности так и не устранены».

Напряжение в ИТ-службах и без того постоянно нарастает, а ведь планирование восстановления требует дополнительных затрат времени и сил. В компании Gap все планирование осуществляется заранее.

«Мы занимаемся розничной торговлей и должны обеспечить нормальное функционирование своих магазинов», — пояснил Лэйн.

Рекомендация: на эти вопросы нет простого ответа. Все признают эффективность проведения внезапных проверок, но не следует забывать, что выполнение тестов в условиях необходимости непрерывного ведения электронного бизнеса сопряжено с немалыми трудностями. Клонч предлагает каждый раз подвергать неожиданной проверке только одно из подразделений ИТ-службы, при этом все остальные будут продолжать заниматься своим делом.

А некоторым компаниям стоит задуматься и о привлечении независимых аудиторов, с тем чтобы сотрудники ИТ-службы не смогли воспользоваться во вред своим работодателям заранее подготовленной ими же самими информацией.


Важные мелочи

При наступлении кризисной ситуации сотрудники ИТ-службы, пытающиеся восстановить работоспособность системы, зачастую не могут преодолеть довольно простые препятствия. Аналитики и эксперты рекомендуют заранее планировать свои действия с учетом следующих вопросов.

  • Организация доступа. У кого имеются ключи от здания или планы? Как пройти внутрь в случае отключения электрической сети? Кто из представителей местных служб (полиция, пожарные или городские власти) может оказать вам необходимую помощь?
  • Коммуникации. В кризисных ситуациях сотрудникам ИТ-службы иногда приходится вступать в контакт с сотрудниками предприятия, которых они даже не знают по имени. Нужен полный телефонный справочник, включающий в том числе и номера мобильных телефонов.
  • Электричество. Если у нас дома вдруг отключается электричество, а батарейки карманного фонарика сели, мы чувствуем себя крайне неуютно. То же самое происходит и на рабочем месте — в конце концов, резервные генераторы тоже выходят из строя.
  • Пароли. Безопасность — это, конечно, хорошо, но в кризисных ситуациях даже сотрудникам, находящимся на самых нижних ступенях иерархической лестницы, может понадобиться экстренный доступ к системам. Поэтому организациям нужно определить порядок действий в подобных обстоятельствах.

Поделитесь материалом с коллегами и друзьями