Часть 2

Наблюдение за серверами при помощи консоли ESM

В первой части статьи я представил обзор возможностей консоли управления MMC и описал взаимодействие Exchange 2000 со службой AD в Windows 2000. Процесс управления Exchange 2000 был разделен на две части: управление сервером через консоль ESM и управление пользователями при помощи оснастки Active Directory Users and Computers.

Эти сведения дают общее представление о работе Exchange 2000 и позволяют перейти к следующей задаче: поддержанию бесперебойной работы всех почтовых серверов. В этой статье речь пойдет об обеспечении работоспособности серверов Exchange, а также о типах сообщений, которые позволяют судить о состоянии сервера. Обратим внимание и на некоторые провайдеры WMI, позволяющие получить доступ к данным Exchange 2000.

К истокам

В Exchange всегда присутствовала возможность наблюдения за работой серверов. В версии 5.5 монитор сервера и монитор связи содержат простую форму команды Ping, которая проверяет наличие серверов в сети и активность основных служб (т. е. информационного хранилища IS и агента передачи сообщений MTA). На этих же принципах построен контроль работоспособности и метод сбора информации о состоянии Exchange 2000.

Различия заключаются в том, какие серверы осуществляют контроль, какие данные можно получить с серверов и какие интерфейсы использует для этого Exchange 2000. Поддерживается полный набор документированных интерфейсов, что позволяет контролировать работу Exchange 2000 в рамках общей стратегии управления системами. Независимые разработчики не упустили из виду эти возможности и провели модернизацию своих программ, чтобы более эффективно использовать новые интерфейсы.

В Exchange 2000 мониторы сервера и связи были заменены расширением консоли ESM, получившим название Monitoring and Status («Контроль и состояние»). В этой оснастке консоли ESM можно указать способ оповещения о событиях на контролируемых серверах. Сообщения отправляются по электронной почте или при выполнении сценариев. Соответственно, в консоли ESM можно наблюдать за состоянием серверов и коннекторов группы маршрутизации.

Экран 1. Просмотр состояния серверов и коннекторов.

На Экране 1 показана консоль ESM - основное средство управления серверами Exchange 2000. Пункт Notifications позволяет выбирать сообщения, которые посылает сервер. При выборе пункта Status на экран выводится информация о серверах и коннекторах.

Контроль состояния серверов

Для наблюдения за работой удаленных серверов Exchange 5.5 используются мониторы серверов. В Exchange 2000 аналогичные функции выполняют notifications (предупреждения). Следует определить, какие параметры и службы сервера необходимо контролировать. Для получения информации с удаленных серверов используются вызовы RPC, поэтому слежение одного сервера за другим возможно при условии, что серверы могут установить между собой RPC-соединение. Следует учитывать эту особенность при выборе сервера, который осуществляет контроль.

Exchange 2000 может посылать предупреждения через выполнение сценариев или путем отправки электронных сообщений. В первом случае вызывается исполняемый или WS-сценарий, который совершает необходимые действия, а во втором - электронные сообщения доставляются указанному набору адресатов. Очевидно, что первый способ более эффективен, так как позволяет выполнить целую последовательность программ при заданных условиях. На Экране 2 показано, что сервер QEMEA-ES1 контролирует себя (в поле Monitored Items указано This server) и два других сервера (QEMEA-DC1 и QEMEA-ES0). Если на этих серверах произойдет одно из заранее предусмотренных событий: например, свободное дисковое пространство уменьшится до установленной границы, то автоматически будет послано электронное сообщение. Нельзя твердо рассчитывать на прием сообщений, так как в случае сбоя системы сервер Exchange может быть остановлен.

Экран 2. Мониторинг серверов.

Существует два пути для определения параметров контроля. В консоли ESM можно перейти в папку Administrative Groups, выбрать из списка сервер, открыть окно его свойств и перейти на закладку Monitoring. Или же можно воспользоваться пунктом Status, выбрать имя сервера на правой панели ESM и открыть окно его свойств. В любом случае будет открыто окно, показанное на Экране 3. Для учета свободного дискового пространства на разных серверах можно устанавливать разные граничные значения. Свободное дисковое пространство является одним из основных параметров функционирования сервера, так как службы IS и MTA при отсутствии места на диске будут остановлены. В Таблице 1 перечислены все доступные параметры контроля.

Экран 3. Задание условий.

Переключатель Disable all monitoring of this server разрешает или запрещает осуществлять контроль сервера. По умолчанию переключатель не установлен, поэтому серверы автоматически публикуют данные о своем состоянии при помощи WMI. Не следует запрещать наблюдение за сервером без особых на то причин.

После того как параметры контроля определены и достигли пороговых значений, Exchange 2000 начинает посылать оповещения. На Экране 4 показано, как задается набор параметров, которые отправляются по электронной почте. Строка Servers and connectors to monitor, открывающая доступ к списку контролируемых объек-тов, состоит из элементов «Этот сервер», «Все серверы», «Все серверы из группы маршрутизации», «Все коннекторы из группы маршрутизации». Кнопка Customize позволяет в диалоговом окне выбрать часть серверов из числа имеющихся в организации.

Экран 4. Задание параметров предупреждений.

Правильность заполнения полей To и Cc проверяется с помощью AD. Сообщение может быть отправлено пользователям, получателю из списка «Контакты» и группам. Если нужно направить сообщение на пейджер или мобильный телефон, следует создать нового получателя и указать специальный тип сообщения.

Редактировать тему и содержание сообщения нужно с осторожностью, чтобы случайно не изменить специальные поля, в которые сервер Exchange вставляет значения (см. Экран 4). Ключевое слово TargetIn-stance указывает на контролируемый сервер и имеет несколько полей, которые соответствуют параметрам диагностики. Например, QueuesState-String служит для контроля состояния очередей SMTP и X.400.

Экран 5. Сообщение с отчетом о состоянии.

На Экране 5 показан пример сообщения, которое Exchange 2000 отсылает на указанный адрес, если достигнуто хоть одно из установленных пороговых значений. Предупреждение не содержит полной информации, но его достаточно, чтобы затем собрать дополнительные данные и принять меры к устранению проблемы. В нашем примере показано, что службы функционируют, но в очередях скопились неотправленные сообщения. Текущее состояние свободного дискового пространства, оперативной памяти и загрузки процессора - неизвестно (Un-known). На первый взгляд все дело в том, что исчерпаны системные ресурсы, т. е. сообщения накапливаются в очереди из-за недостатка процессорного времени или оперативной памяти. Однако после подключения к серверу и его проверки может оказаться, что очередь сообщений пуста. Это говорит о том, что тревога была ложной. Лучше десять раз получить ошибочное сообщение, чем один раз прозевать настоящий сбой.

Экран 6. Сообщение о сбое коннектора.

На Экране 6 показан пример сообщения о том, что коннектор сервера Exchange недоступен. Коннекторам рекомендуется давать имена, отражающие их функции. В крупной организации используется множество коннекторов разных типов, и, если администратор не может определить тип коннектора и его назначение, быстро исправить положение не удается. В нашем случае известно, что не функционирует коннектор RGC, который соединяет центральную группу маршрутизации с группой во Франции. Так как коннектор RGC однонаправленный, то источником проблемы, скорее всего, стала группа, передающая сообщения. Поэтому первым делом следует проверить серверы-мосты (bridgehead) этой группы.

Просмотр данных о состоянии сервера

При выборе коннектора в пункте Status консоли ESM на экран выводится информация, которая примерно соответствует данным таблицы состояния связи Link State Table. Эта таблица поддерживается службой маршрутизации SMTP, размещается в оперативной памяти, и администратор не может получить к ней доступ при помощи обычных средств. На компакт-диске с Exchange 2000 в каталоге supportutilsi386 находится программа Winroute, которая предоставляет более подробную информацию о таблице Link State Table. Exchange 2000 с помощью механизма Link State Routing определяет, по какому маршруту направить сообщение. Аналогичную задачу в Exchan-ge 5.5 выполняла таблица адресов маршрутизации Gateway Address Routing Table (GWART). В отличие от этой более статичной таблицы, Link State Routing использует облегченный алгоритм Dijkstra, поэтому при передаче сообщений может выбирать оптимальный путь. Это связано с тем, что маршрутизация SMTP основана на данных таблицы Link State Table, которая динамически обновляется в зависимости от изменений в сети или после добавления нового коннектора. Например, если какое-либо сетевое соединение выходит из строя и коннектор SMTP не может передать сообщения в указанный домен SMTP, то сообщение о недоступности прежнего маршрута передается всем группам маршрутизации. Группа, которая обнаружила отсутствие соединения, шлет сообщения о состоянии связи всем группам в организации. Затем главный сервер в группе маршрутизации на основании скорректированной таблицы состояния сетевых соединений компилирует новую таблицу маршрутизации.

Консоль ESM собирает данные с определенного сервера, который выступает в роли посредника между ESM и контролируемыми серверами. Так как при работе в распределенных сетях не все серверы подключены к сети постоянно, достоверная информация может быть получена только о локальном по отношению к ESM сервере. ESM получает информацию обо всех серверах Exchange от сервера глобального каталога GC службы AD. Если данные об Exchange, полученные от разных серверов GC, отличаются, значит, репликация выполняется с ошибками, и следует обратить особое внимание на потоки данных между контроллерами доменов и серверами GC.

При подключении к серверу его имя выводится в верхней части панели Status в консоли ESM (см. Экран 1). Показаны все коннекторы и все серверы, принадлежащие административной группе. Однако возможны исключения. Например, если сервер Ex-change 2000 соединен с серверами организации через единственный коннектор к серверу Exchange 5.5, то ESM не показывает этот коннектор. Подобная ситуация возможна, если в организацию входят как серверы Exchan-ge 2000, так и серверы предыдущих версий. Проблема исчезнет после того, как серверы Exchange 2000 вытеснят Exchange 5.5. Кроме того, здесь показаны коннекторы, которые не входят в административную группу и служат для доступа к копиям общих папок (в Exchange 5.5 это называлось public folder affinity, а в Exchange 2000 - public folder referrals). Exchange-сервер направляет запрос для доступа к содержимому общей папки через коннектор, к серверу, где находится копия общей папки. Такие коннекторы видны в ESM, поскольку группа маршрутизации может наследовать способность их использования. В целом механизм доступа к копиям общих папок в Exchange 2000 более сложен, чем в Exchange 5.5. Программа Winroute дает прекрасную возможность заглянуть вглубь процесса.

Чтобы из ESM подключиться к удаленному серверу, следует правой кнопкой мыши щелкнуть на пункте Status и выбрать пункт меню Connect to. Это может сделать администратор сервера Exchange или лицо, имеющее административные права на просмотр. Следует учитывать, что данные в окне ESM статические и обновляются с определенным интервалом. Чтобы обновить данные вручную, следует нажать клавишу F5 или щелкнуть правой кнопкой мыши на пункте Monitoring и выбрать Refresh из контекстно-зависимого меню. Это заставит ESM опросить таблицу Link State Table и получить из оперативной памяти данные о коннекторах.

Проблемы диагностики

Рассмотрим типичные проблемы, с которыми можно столкнуться при диагностике серверов из ESM. На Экране 1 показано, что состояние сервера QEMEA-DC1 определено как «неизвестное» (Unknown). Это не означает, что сервер выключен. Он может отвечать на команду ping, и все службы могут функционировать нормально. Скорее всего, последняя попытка ESM установить соединение с сервером была неудачной. Если это произошло из-за повышенного трафика в сети, то через некоторое время состояние сервера будет определено как «доступен» (Available).

Экран 7. Нарушения в работе серверов.

Если состояние сервера определяется как «недоступен» (Unreachable), это свидетельствует о более серьезных неполадках. Все попытки ESM установить соединение с удаленным сервером закончились неудачей. Проверить, функционирует ли сервер Exchange, невозможно. На Экране 7 показано, что сервер QEMEA-DC1 недоступен. Это повлияло на состояние серверов QEMEA-ES0 и QEMEA-ES1, чьи очереди достигли критических размеров. Коннектор RGC Hub to France недоступен, потому что локальным сервером-мостом является QEMEA-ES0. Интересно, что коннектор RGC France to Hub определен как доступный из-за того, что группа маршрутизации France до сих пор имеет возможность посылать сообщения серверу в локальной группе маршрутизации.

Если видно, что сервер находится в состоянии Unknown или Unreachable, но известно, что сетевые соединения не нарушены и с сервером все в порядке, причины проблемы могут быть следующие.

Неправильно функционирует служба System Attendant. Служба System Attendant управляет всеми компонентами Exchange 2000. Все другие службы предоставляют данные для System Attendant и не могут стартовать без нее. Она отвечает за выполнение фоновых заданий: например, обрабатывает запросы LDAP для построения адресных списков и осуществляет синхронизацию с базой Microsoft IIS. Сервер Exchange не может функционировать, если служба System Attendant не работает.

Ошибки в работе службы Exchange Routing Engine. Если эта служба не функционирует, то информация о состоянии коннекторов и очередей недоступна. Cлужба Routing Engine - одна из наиболее важных в системе, так как в случае сбоя в ее работе прием и отправка сообщений прекращаются.

Проблемы функционирования службы WMI. Эта служба, созданная для Windows 2000, предоставляет приложениям и службам стандартный механизм для передачи информации о своем состоянии при помощи провайдеров (т. е. программных компонентов, собирающих данные от приложений и передающих их далее посредством известных технологий). Таким образом, программы контроля могут собирать данные от многих источников и создавать отчеты. Например, провайдер ExchangeRoutingTableProvider извлекает из таблицы Link State Table информацию о состоянии коннектора, а ExchangeClusterProvider контролирует состояние сервера. WMI-провайдеры могут использоваться и в других случаях. Так, ESM собирает данные о сообщениях, находящихся в очереди, при помощи провайдера Exchange-Queue.

В составе сервера Windows 2000 имеется служба сервера терминалов, и, чтобы проверить, как работают рассмотренные нами службы, достаточно подключиться к нужному серверу и загрузить консоль службы (для этого следует выбрать пункты меню Программы/Администрирование/Службы).

Сложности контроля параметров. При контроле параметров часто поступают ложные сообщения, о которых сигнализирует консоль ESM. Чтобы получить более подробную информацию о сервере, который сообщил о проблеме, следует выбрать пункт Status, щелкнуть правой кнопкой мыши на имени сервера и выбрать пункт меню Properties. На экран будут выведены контролируемые параметры сервера, хранящиеся в AD как часть конфигурационных данных Exchange 2000.

Еще я обратил внимание, что кластер серверов Exchange 2000 часто посылает ложные предупреждения о превышении пороговых значений контролируемых параметров. Пока еще не очень много серверов Exchange 2000 эксплуатируется в кластерах, и можно надеяться, что разработчики Microsoft устранят причины ложных сообщений.

По сравнению с предыдущими версиями, в Exchange 2000 не только реализованы дополнительные возможности контроля, но и добавлена поддержка новых компонентов, таких, как SMTP Routing Engine. Но если пользоваться только ESM, будут доступны далеко не все новые возможности. Я уже упоминал о назначении провайдеров WMI. Их интерфейсы прекрасно описаны, и это дает возможность независимым разработчикам создавать собственные инструменты для доступа к данным сервера Exchange. Можно самим создать простые шаблоны на все случаи жизни и применять их по мере необходимости. В заключительной статье цикла будет рассказано о провайдерах WMI, о библиотеке сценариев CDO для управления Exchange и о том, как все это использовать, чтобы извлечь необходимые данные.

(Продолжение следует.)

Тони Редмонд - редактор Windows 2000 Magazine, старший технический редактор выпусков Exchange Administrator, вице-президент в Compaq Global Services. Связаться с ним можно по адресу: exchguru@win2000mag.com.


Таблица 1. Доступные параметры контроля.
ПараметрПримечание
Загрузка процессораУстанавливаются два пороговых значения (предварительное и критическое) загрузки процессора в течение указанного периода. Рекомендуемые пороговые значения: 80% загрузки в течение 5 мин.
Функционирование стандартных служб Exchange 2000Наблюдение за работой служб IS, MTA, Routing Engine, System Attendant, World Wide Web Publishing и SMTP Transport. Список контролируемых служб можно расширять.
Свободное дисковое пространствоУстанавливаются пороговые значения (предварительное и критическое) свободного пространства на томе. Различные пороги могут устанавливаться для каждого тома в системе. Обычно следует контролировать том, где размещается операционная система, том с базами сервера Exchange и том с файлами транзакций.
Размер очереди SMTPС учетом скорости обработки и маршрутизации, сообщения не должны находиться в очереди долго. Если между серверами имеется постоянное сетевое соединение, а сообщения находятся в очереди более 5 мин, могут возникнуть проблемы с коннектором.
Пороговые значения виртуальной памятиУстанавливаются пороговые значения (предварительное и критическое) доступной виртуальной памяти. Рекомендуемый минимум свободной виртуальной памяти составляет 25%.
Функционирование службы Windows 2000Можно контролировать работу любой службы Windows 2000. Например, можно следить за тем, чтобы постоянно были запущены служба IIS Admin и служба архивирования из пакета программ независимых разработчиков.
Размер очереди X.400Пороговые значения для очереди X.400 устанавливаются подобно значениям для очереди SMTP. Отличие состоит в том, что эта очередь управляется службой MTA.

назад