Особенности системы Patrol
Принципы построения системы Patrol
Коммуникационные уровни Patrol
Автономные агенты в крупной многоуровневой системе управления

Проекты усложняются, нагрузка на администраторов сетей возрастает, и поток информации о работе системы грозит их захлестнуть. Здесь могут помочь "умные" средства управления приложениями, которые позволят акцентировать внимание на причинах сбоев, а не на их последствиях, и выполнить необходимые корректирующие действия. Одно из таких средств - система управления приложениями Patrol компании BMC Software.

Особенности системы Patrol

Можно отметить такие особенности системы Patrol, которые делают ее привлекательной с точки зрения поддержки работоспособности сетевых приложений. К ним следует отнести модульность, открытость (на специализированном языке PSL пользователи, имеющие, конечно, определенный уровень подготовки, могут самостоятельно создавать модули, поддерживающие мониторинг своих приложений), а также интегрируемость с широким спектром платформ сетевого управления: HP OpenView, IBM NetView, SunNet Manager, Cabletron Spectrum и др.

Необходимо еще раз подчеркнуть, что система осуществляет не только мониторинг работы приложений, но и выполняет корректирующие действия.

Принципы построения системы Patrol

Cистема Patrol построена на базе распределенных автономных интеллектуальных агентов (Intelligent Autonomous Agent) - небольших независимых программ, которые работают на управляемых серверах и рабочих станциях и позволяют осуществлять мониторинг приложений в средах Unix, Windows NT, OS/2, OpenVMS. Агенты не ориентированы на консоль в отличие от иерархической схемы управления, при которой требуется проведение постоянного опроса или установка консоли на каждом сервере, причем в случае централизованной консоли доля управляющего трафика может достигать 25%. Здесь же передача сообщений по сети идет только тогда, когда происходит какое-либо событие, например изменение состояния объекта. Это позволяет значительно уменьшить нагрузку на сеть. Агенты, расположенные на управляемых серверах, автоматически обнаруживают приложения, базы данных, сервисы промежуточного уровня, обеспечивают непрерывный мониторинг параметров системы, пересылку предупреждений, активизацию корректирующих действий, а также корреляционную обработку событий.

Экспертные модули (Knowledge Module) - следующий составной элемент системы Patrol. Они являются библиотеками, специализированными на конкретную ОС, сервер баз данных или приложение. Экспертные модули определяют правила, используемые интеллектуальными агентами для мониторинга и выполнения корректирующих действий. Каждый из агентов может взаимодействовать с несколькими экспертными модулями, которые находятся на управляемых серверах вместе с агентами.

В настоящее время число экспертных модулей постоянно растет, причем не только благодаря усилиям BMC Software, но и с помощью независимых разработчиков.

В систему Patrol входят консоли трех типов: Patrol Operator Console (консоль оператора), Patrol Developer Console (консоль разработчика), Patrol Event Manager Console (консоль администратора). Как уже упоминалось выше, Patrol не требует для своего функционирования соединения с консолью. Однако один автономный интеллектуальный агент может поддерживать несколько соединений с консолями Patrol, например с сетевым администратором и администратором баз данных.

Менеджер событий (Patrol Event Manager - PEM) является базисом архитектуры системы и может быть доступен как с консоли Patrol, так и с отдельной консоли PEM или системы управления третьих фирм. Он позволяет настраивать среду просмотра таким образом, чтобы администратор мог сфокусировать свое внимание и контролировать отдельные события с помощью развитых средств фильтрации, сортировки и управления. Менеджер событий осуществляет просмотр, описание, связывание событий, составление отчетов, управление и отклик на события, а также производит корреляцию событий от различных агентов и экспертных модулей.

Коммуникационные уровни Patrol

При разработке Patrol предпочтение было отдано низкоуровневому UDP-протоколу, который зачастую является базовым компонентом операционной системы и выходит из строя только вместе с ОС. Он меньше зависит от смены версии, чем протоколы верхнего уровня. Существенным недостатком UDP является отсутствие встроенных средств проверки надежности, и поэтому в системе Patrol реализован дополнительный промежуточный слой над UDP, который и обеспечивает надежность.

Таким образом, в Patrol реализованы три коммуникационных уровня:

  • cистемный уровень, использующий UDP-протокол;
  • уровень сессий, обеспечивающий добавочные сервисы, повышающие надежность;
  • уровень приложений, обеспечивающий передачу значений параметров, статусов объектов и другой информации на консоль.
  • Cледует отметить, что Patrol может работать и по TCP/IP-протоколу, а также проводить мониторинг транзакций высокого уровня TCP/IP и RPC.

    Автономные агенты в крупной многоуровневой системе управления

    Каково же место агентов Patrol в сложной системе управления большим предприятием? В качестве примера рассмотрим проект инфраструктуры системы сетевого управления, который был создан на основе ряда продуктов, в том числе и системы Patrol, описанной выше. Он был предложен к внедрению в крупной российской нефтегазовой компании с целью обеспечения работы в сети примерно 5 тыс. пользователей.

    Cистема управления имеет иерархическую архитектуру (агент-субагент-менеджер), что позволяет значительно снизить трафик и снять перегрузку с консолей администраторов. В качестве базовой выбрана платформа управления HP OpenView, которая реализует распределенную обработку. Она наиболее широко поддержана поставщиками аппаратного обеспечения, используемого в этой корпоративной сети.

    Центр управления сетью, находящийся в главном офисе корпорации, обеспечивает непрерывное круглосуточное управление информационными ресурсами всех филиалов. Структурно центр управления подразделяется на отделы по функциональному признаку.

    Можно выделить отделы управления:

  • телекоммуникационным оборудованием;
  • сетевым оборудованием;
  • системным ПО;
  • CУБД;
  • прикладным ПО,
  • а также координационный отдел.

    В ЛВС региональных филиалов предлагается установить специализированное оборудование мониторинга трафика. Анализатор протоколов для локальных и глобальных сетей Sniffer Server собирает информацию о функционировании сети, проводит первичную обработку и выполняет полный анализ на всех семи уровнях сетевой модели OSI.

    Специализированные зонды RMON/RMON2 семейства NETScout осуществляют мониторинг удаленных узлов корпоративной ЛВС и каналов связи с ЛВС в центральном офисе. Собранная информация поступает к администратору сетевого оборудования.

    Мониторинг телекоммуникационного и активного сетевого оборудования производится по SNMP-протоколу, а вся информация поступает на консоли администраторов этого оборудования. В качестве систем управления используется соответствующее ПО: 3Com Transcend Enterprise Manager, СiscoWorks и другие на платформе ОреnView.

    Установка автономных интеллектуальных агентов Patrol на всех серверах позволяет проводить мониторинг всех слоев программного обеспечения: операционных систем (Windows NT, HP-UX), серверов баз данных (Oracle, MS SQL Server), ПО передачи сообщений (MS Exchange) и прикладного ПО.

    В этом случае агенты Patrol представляют собой, образно говоря, "глаза и уши" администратора. Это как бы некий человек, которому администратор делегировал свои права по сбору информации и проведению корректирующих действий, который не болеет и не допустит ошибок. Например, рассмотрим типичную ситуацию, когда на жестком диске сервера остается менее 5% свободного места, a его дальнейшее уменьшение может вызвать определенные проблемы. Если в процессе работы этот предел, установленный администратором, будет перейден, то агент Patrol удаляет TMP-каталог, производит резервное копирование на ленту и осуществляет еще целый ряд действий, описанный администратором для этого случая. Список корректирующих действий может иметь сложную структуру и выполняться поэтапно, с промежуточной проверкой тех параметров, которые необходимо привести к норме. Его составляет администратор на основе собственного опыта.

    Очень удобно и то, что консоль Patrol администраторов ПО интегрирована в систему управления OpenView. Все это значительно облегчает их работу по управлению системой и контролю за ней.

    Контроль и координацию работы администраторов осуществляет менеджер с помощью устойчивой к помехам системы корреляции событий InChange. Благодаря этому внимание администраторов акцентируется на причине сбоев в работе приложений, а не на их последствиях.

    Необходимо учитывать, что система Patrol стоит несколько десятков тысяч долларов и ее цена весьма значительно зависит от типа компьютера (от ПК до мэйнфрейма). Систему экономически оправдано внедрять в крупных гетерогенных сетях, а также для мониторинга критичных к сбоям приложений.

    * * *

    В заключение коротко об использовании системы управления приложениями Patrol. Фирма Сabletron Systems предлагает ее вместе со своим продуктом Spectrum для обеспечения полного набора средств сетевого управления; Internet-серверы AlphaServer компании Digital Equipment управляются с помощью Patrol. Первым продуктом, управляющим SAP R/3 c использованием нового API, была система Patrol. Sun Microsystems рекомендует своим клиентам использовать Patrol для управления серверами Lotus Notes в крупных корпоративных сетях.


    (По материалaм компании IBS)