Джоел Слосс (joelsloss@hotmail.com) — технический редактор в журнале Windows IT Pro с 17-летним опытом работы в области корпоративного программного обеспечения

Наводнения, пожары, землетрясения, нарушения энергоснабжения, а также отказы в работе аппаратного и программного обеспечения служат нам напоминанием, почему так важна готовность к аварийным ситуациям. ИТ-подразделения крупных компаний отлично умеют справляться с ними, но для небольших предприятий может оказаться трудным поддерживать бесперебойную работу систем на уровне 99,0 %, не говоря уже о 99,999 % безотказной работы. Стоимость и барьеры сложности в конечном счете препятствуют многим предприятиям испытывать решения высокой готовности, заставляя специалистов по ИТ использовать ручные методы обнаружения и запуска процессов исправления и восстановления.

.

Обзор

Руководство часто обращается к системным администраторам с просьбой уменьшить затраты, но при этом повысить надежность системы ИТ. Администраторы предприятий малого и среднего бизнеса ощущают эту нехватку более остро, потому что обеспечение отказоустойчивости способно более чем удвоить стоимость существующей инфраструктуры за счет резервных серверов, избыточной сетевой инфраструктуры и так далее. Хотя имеющиеся технологии в Windows Server и способны отчасти помочь, они не дают отказоустойчивости моментально, как того требует объем работ.

Продукт Stratus призван разрешить эту дилемму благодаря инвариантности по отношению к аппаратному обеспечению и с помощью пакета доступности для малых и средних предприятий, основанного на программном решении и все же не полностью аппаратно независимого. Stratus сделал себе имя в классе корпоративных решений высокой доступности, в течение более 30 лет поддерживая работоспособность 24 часа в сутки 7 дней в неделю жизненно необходимых служб, применяемых в больницах, коммунальных предприятиях и т.д.

Avance сочетает в себе программное обеспечение с проактивным управлением (даже удаленным) и аппаратное резервирование.

Кластер высокой доступности Avance обеспечивает почти нулевое время отказа и минимальное время восстановления, с почти нулевым воздействием на клиента (включая приложения с запоминанием состояния), используя мониторинг в реальном времени и тиражирование данных.

Те, кто работает с гетерогенной средой, также оценят поддержку Avance для серверов Linux (например, Red Hat, CentOS) и их приложений. Avance использует CentOS 5.5 и технологии виртуализации Citrix Systems XenServer, чтобы отделить аппаратное оборудование от ПО, создавая базу для прозрачного перемещения операционной системы и приложений между физическими системами в момент сбоя.

Вы можете использовать большинство готовых к работе серверов, сетей и аппаратных систем хранения, пока любые две системы, которые вы группируете, не покажут, что аппаратное несоответствие приводит к неправильным режимам работы драйвера (и, соответственно, аварийному отказу).

Кроме того, та же самая конфигурация RAID может быть использована на обеих системах. Одно из преимуществ кластерного подхода состоит в том, что вам не нужно покупать специальный массив устройств хранения для данных, потому что репликация между серверами происходит по кабелю.

Недостаток заключается в том, что вам все же нужен соответствующим образом настроенный второй сервер в качестве «горячего резерва». Заметьте, что у вас не будет действующего производственного кластера. Подробная информация об этом приведена во врезке «Как работает Avance».

Настройка

Для целесообразности, я начал с двух готовых серверов на базе Intel, которые были предоставлены Stratus. Каждый сервер имел материнскую плату S5520UR, два четырехъядерных процессора Xeon X5560, 24 Гбайт памяти и 2 Tбайт дискового пространства. Вы можете дополнительно увеличить аппаратную отказоустойчивость, если выберете системный блок с компонентами «горячей замены» (например, процессора, модулей оперативной памяти), контроллеры RAID, избыточные блоки питания, отказоустойчивые сетевые адаптеры и т.д.; это поможет снизить вероятность отказа одного сервера. Однако это необязательно, ведь модуль мониторинга в реальном времени, который включает более 150 различных метрик и методы предсказания отказов, выполнит живую миграцию, если будет обнаружен сбой или его вероятность.

Ваша конфигурация дублированного сервера может не иметь никаких отличий от серийного образца, за исключением выделенного порта гигабитного Ethernet на каждой системе для управления и репликации данных, который называется каналом синхронизации Sync. Серверы также могут быть совершенно «безголовыми» (после исходной настройки), потому что все операции технического обслуживания выполняются через веб-ориентированную консоль. Однако Stratus рекомендует дополнительные каналы синхронизации Sync для обеспечения эффективной работы и отказоустойчивости.

Avance устанавливается просто и использует DVD. Он автоматизирует настройку для обоих серверов за единый процесс, однако необходимо переформатировать систему, если вы используете не новое оборудование. Вы не сможете поменять аппаратные средства для установленной сборки операционной системы или переместить их с другой системы, если только они не идентичны и уже использовались. Добавление второй системы для формирования кластера выполняется быстро благодаря установке программного обеспечения, управляемой с первичного узла. Когда вы присоедините второй сервер к кластеру, автоматизированный процесс синхронизации определит и настроит его.

Постоянная репликация данных Avance означает, что каждый сервер всегда находится в актуальном состоянии. В случае отказа оборудования, вероятного сбоя или планового отключения вторая система просто принимает нагрузку с того момента, когда отключилась первая. Это позволяет выполнять техническое сопровождение, которое требуется на первом узле, не прерывая работу служб. Выполнив задачу, вы можете вручную перебросить рабочую нагрузку назад на первый узел или оставить ее на втором узле и задать ее перенос обратно на первый узел в случае выявления сбоя на втором.

Эксплуатация

У Avance имеется консоль управления по сети Apache Tomcat на базе HTML5 и JavaScript, которая запущена только на одном узле кластера. Преимущество управления через web состоит в том, что это проще и есть доступ практически с любого клиента, даже с мобильного устройства. Недостатком является пресловутый вопрос о безопасности. Хотя тонкий клиент может быть полезен (нет необходимости в установке), выполнение на уровне хоста веб-приложения увеличивает риск потенциальных атак.

Рабочая нагрузка каждого виртуализованного сервера может быть защищена с помощью антишпионских решений, но проникновение на уровне хоста – это уже плохо. XenServer изолирует виртуальные машины друг от друга, и Stratus пытается укрепить конфигурацию хоста.

Для дополнительной защиты можно полностью развернуть сетевой экран уровня приложений и разместить свои серверы в демилитаризованной зоне (DMZ). В качестве альтернативы вы могли бы развернуть защищенную виртуальную машину, через которую маршрутизируется весь трафик. Однако гипервизор первого типа (работающий на «железе») без возможности выполнения приложений и отдельный сервер управления предоставят в целом более эффективные (хотя и более дорогие) средства безопасности. Консоль Avance имеет таймер неактивности, однако ей недостает возможностей аутентификации на базе токенов или мультифакторной аутентификации.

Каждая задача в Avance выполняется через веб-консоль, что избавляет администратора от необходимости сидеть рядом с серверами. Это удобно и в том случае, если вы используете стороннего провайдера для удаленной поддержки своей ИТ-инфраструктуры. Хотя встроенной поддержки сокрытия IP или фильтрации для выполнения ограниченного администрирования с некоторых IP-адресов нет, доступ через VPN и сетевой экран обеспечит аналогичную защиту.

Используя простую для восприятия компоновку, интерфейс пользователя предоставляет быстрый доступ к установленной по умолчанию панели инструментов Avance, которая содержит предупреждения, настройки конфигурации и страницы подробностей для управления свойствами как физического, так и виртуального кластера. Предусмотрен также быстрый доступ к страницам, с которых вы можете управлять физическими системами, настраивать дисковые группы и тома хранения, чтобы предоставить ресурсы для определенных рабочих приложений, формировать виртуальные сети, управлять пользователями, создавать виртуальные машины и т.д. Большинством операций управляют простые в использовании программные мастера, которые автоматизируют задачи.

В соответствии с полностью виртуализованной сущностью решения, вы можете создавать точки установки виртуального CD, доступные определенным виртуальным машинам, как показано на экране 1. Они могут использоваться в качестве прямых копий файлов. iso или загружаемых файлов обоими серверами и виртуальными рабочими столами. Хотя это может быть нежелательно с точки зрения безопасности, вы можете сделать физические компоненты, такие как накопители USB, доступными отдельным рабочим приложениям.

 

Создание точек установки виртуального CD virtual CD
Экран 1. Создание точек установки виртуального CD virtual CD

Отказоустойчивость

Если происходит сбой, Avance обеспечивает активный мониторинг по различным категориям, предоставляющим полный спектр возможностей обнаружения отказов в физической или виртуальной среде. Как и в случае с решениями с выделенным каналом управления, фильтры предсказаний помогают предупредить отказ, а не ждать, когда он произойдет. Благодаря заблаговременному предупреждению вы можете устранить проблему, прежде чем случится катастрофический сбой, с которым не справится даже Avance. Даже если вы используете верную комбинацию параметров, которая зависит от оборудования и операционной системы, я не уверен, что это возможно.

Тестируя Avance, я делал множество неприятных для серверов вещей. Я вынимал сетевые кабели, отсоединял шнур питания, «убивал» виртуальные машины и так далее. Я даже устроил единовременный аварийный отказ на обеих машинах, выдергивая все шнуры питания, даже к резервным источникам (заставляя их издавать жалобные звуковые сигналы). Надо сказать, очень впечатляет – ничего хуже, наверное, не может произойти. «Убийство» одного сервера целиком вылилось в предупреждение в консоли, как показано на экране 2, но ни на приложении управления, ни на рабочих нагрузках (такие как сессии Remote Desktop Services), казалось, ничего не отразилось.

 

Проверка предупреждения на панели инструментов по умолчанию
Экран 2. Проверка предупреждения на панели инструментов по умолчанию

Виртуальные машины продолжали работать. Когда я подключил испорченный сервер, он спокойно присоединился к группе, заново синхронизировал данные и занял свое место в качестве нового вторичного узла. Я напряженно думал, что же еще я могу испортить без физического повреждения оборудования.

Учитывая подобные возможности, для чего еще использовать Avance, как не для очевидного улучшения отказоустойчивости? Как я упоминал выше, существуют другие доступные формы отказустойчивости и кластеризации, и некоторые из них могли бы больше подойти для определенных рабочих нагрузок или ситуаций. Области, которым Avance соответствует наилучшим образом, включают:

  • обеспечение 99,99% доступность приложения;
  • избыточность удаленного узла;
  • отказоустойчивость небольшого офиса или филиала;
  • от небольших до средних по объему рабочих нагрузок (например, Microsoft Exchange Server, Microsoft SharePoint, система управления взаимоотношений с клиентами CRM, ограниченные по объему базы данных);
  • частное «облако».
  • Области, в которых другие подходы (или расширенные более эффективные предложения корпоративного класса V Series от Stratus) подошли бы больше:
  • высокопроизводительную обработку транзакций;
  • организацию информационных хранилищ;
  • обработку данных в реальном времени;
  • высокопроизводительные распределенные приложения или развертывание в корпоративной среде (многосерверная система электронной почты или базы данных);
  • публичное «облако».

Обратите внимание, что здесь не обеспечивается возможность управления многократным развертыванием Avance через единую консоль. Тем не менее, создать один большой кластер мощных машин лучше, чем работать с несколькими небольшими кластерами в существующем окружении.

Avance оправдывает свою репутацию эффективного продукта, предлагая более современные и доступные решения Stratus. Avance предоставляет возможности, которые обычно ожидаешь найти в более дорогостоящих пакетах. Благодаря акценту на обработке отказа и простоте эксплуатации, небольшие подразделения ИТ с лимитированными ресурсами смогут повысить уровень поддержки предложений и значительно увеличить готовность к аварийным ситуациям.

Ну и на вопрос, буду ли я устанавливать этот продукт в свой центр обработки и хранения данных, могу ответить уверенно — да, буду.

Как работает Avance

Однозначно определить категорию модели высокой доступности, используемой программным обеспечением Avance Stratus Technologies, затруднительно. Невозможно отнести ее к модели active-active или active-passive: в ней есть элементы от каждого типа. Ее можно сравнить с мгновенным «горячим» резервом, возможно, аналогичным тому хранения RAID 1. По этой причине я бы назвал эту модель «зеркальный кластер». Репликация данных происходит в режиме реального времени от основного узла к резервному по выделенному каналу связи, так же, как контроллер системы хранения копирует ввод/вывод зеркальных томов на оба тома в паре логических дисков. В Avance, тем не менее, только один узел эксплуатируется полностью и выполняет программу, в то время как в томе RAID 1 оба диска используются одновременно.

В кластере Avance обе системы всегда (до микросекунды) «в курсе» статуса системы и статуса базы данных, поскольку то, что происходит на одном узле, сразу же и точно так же происходит и на другом. Обработка отказа между узлами мгновенная, без нарушения активного режима (наподобие параллельной вселенной). Поскольку второй узел работает, по существу, в жесткой связке с первым, в случае, если виртуальный IP кластера переключается на резервный узел, ни одно приложение, ни один клиент не узнают, что произошло. Ни один бит не пропадет в транзакции, и ни одна секунда не будет потрачена впустую.

В противоположность этому, кластеру active-passive требуется второй узел, чтобы понять, что основной узел неисправен, переместить разделяемые ресурсы (обычно диски), восстановить статус приложения и повторно инициализировать соединение. Транзакции могут быть утрачены, что вызовет дальнейшие процессы восстановления в среде базы данных приложения. К тому же все происходящее неминуемо вызовет задержку во времени.

Что касается других элементов кластера, то клиенты подключаются к единому виртуальному IP-адресу, который регулируется программным обеспечением Avance, управляющим физическими каналами и IP-адресами. Консоль управления и все рабочие нагрузки единовременно работают только на одной физической системе. Однако вместо ситуации, когда активное соединение на неисправном узле будет потеряно (клиенту потребуется восстановить соединение), состояние памяти будет сохранено, и сессия (например, Remote Desktop Services) не будет затронута. Рабочие приложения могут перебрасываться с одного узла на другой сколько угодно раз, и это никак не повлияет на доступность служб.

Avance

ЗА: обеспечивает работоспособность корпоративного класса для малого и среднего бизнеса; простота в настройке и администрировании; полностью автоматизирован; практически нулевая задержка при обработке отказа; универсален для гетерогенного окружения (поддержка Windows и Linux).

ПРОТИВ: не поддерживает управление более чем одним кластером одновременно, что может создавать трудности в управлении различными удаленными сайтами; операционная среда защищена, но приложение веб-управления на базе хоста потенциально подвержено атакам.

РЕЙТИНГ:

ЦЕНА: 5000 долл. за лицензию за двойной сервер Avance, плюс 100 долл. за ежемесячное обслуживание (обратитесь в Stratus за более детальной информацией о ценах).

РЕКОМЕНДАЦИИ:

Avance подходит для малого и среднего бизнеса, а также для управления удаленными сайтами, требующими высокой доступности. Avance поддерживает большинство приложений enterprise-класса (например, Exchange Server, ERP, программное обеспечение CRM), ограниченное по масштабам окружение баз данных.

КОНТАКТЫ: Stratus Technologies