Семинар компании «Инфосистемы Джет»

Компания «Инфосистемы Джет» провела семинар под названием «Проектирование и эксплуатация надежных ИС». Речь на нем в основном шла о том, как обеспечить гарантированную работу сложных вычислительных комплексов.

По данным Максима Папина, начальника сервисного центра «Джет», только 17% запросов приходятся на аварийные случаи. Остальные 83% касаются решения текущих проблем, сервисного обслуживания, помощи в настройке и развитии системы и т.д. В свою очередь, аварии в большинстве случаев (67%) вызваны ошибками персонала или нарушениями утвержденных правил работы.

С аппаратными проблемами связано только 28% аварий. Меньше всего сбоев (5%) возникает из-за ошибок, допущенных при проектировании системы, однако на их устранение требуется, как правило, немало средств и времени.

Хотя проблемы, связанные с ошибками в проекте, малочисленны, ущерб от них велик. Поэтому работу над надежной вычислительной системой нужно начинать с правильного проектирования, заранее продумывать не только конфигурацию собственно вычислительного комплекса, но и его питание, правила использования и доступа к нему, учитывать документацию, условия окружающей среды, и даже квалификацию персонала.

Особое внимание следует уделять работе с людьми, поскольку именно они в большинстве случаев являются инициаторами аварий.

Подмечено, что люди совершают ошибки в определенные моменты, например, в начале эксплуатации системы или во время ее последующих модернизаций. Поэтому Папин рекомендует не вмешиваться в правильно работающую систему, устанавливать только необходимые исправления и программы, проверив предварительно их работоспособность на испытательном стенде. Важно также регламентировать работу системного администратора и проводить периодические тренинги по отработке нештатных ситуаций. Кроме того, все изменения, вносимые в систему, желательно предварительно согласовать со службой технической поддержки.

В области технических средств, обеспечивающих сохранность информации, появляются новые технологии. Одной из них является дублирование данных (так называемые PIT-копии). Моментальные копии можно использовать для сохранения состояния системы на ленточных накопителях, при организации резервных центров обработки данных, генерации отчетов и для тестирования приложений и исправлений. Известно несколько продуктов для управления процессом создания моментальных копий; есть как программные — Veritas Volume Manager, FlashSnap, Sun Instant Image, так и аппаратные решения — Shadow Image и True Copy. Эти продукты позволят сделать хранение данных более надежным и упростят обращение к ним.