Все под контролем

Нормальное функционирование бизнес-процессов требует непрерывного поддержания соответствующих сервисов, для чего управление инфраструктурой предприятия, в том числе управление его сетевой инфраструктурой, должно быть реализовано в виде целостного решения. Этот подход реализуют интегрированные платформы ведущих производителей отрасли.

Для современного бизнеса информационные технологии стали важнейшим ресурсом —источником ощутимых преимуществ в плане удовлетворения его стратегических, тактических и оперативных потребностей. Однако снижение издержек, повышение эффективности, ускорение выхода на новые рынки и т. д. приходится оплачивать сложностью обеспечения надежности и доступности этого ресурса для внутренних и внешних пользователей, так как управлять самой инфраструктурой ИТ предприятия, основу которой составляет корпоративная сеть, стало теперь намного труднее.

Специалисты в области ИТ утверждают, что в перспективе сети станут самоуправляемыми. Однако пока до этого далеко, и в реальных сетях приходится сталкиваться с массой проблем: оборудование выходит из строя, приложения не всегда доступны, в отдельных сетевых сегментах возникают перегрузки, производительность работы сети и приложений оказывается ниже ожидаемой, ресурсы используются неэффективно — одним словом, бремя забот и расходов становится все тяжелее. Так, по данным Infonetics Research, американские компании теряют в среднем около 2% годового дохода из-за неработоспособности сети, причем 69% этой суммы следует отнести на счет заторов в сети.

Подобно тому, как конфликт служит стимулом развития ситуации, так и возникающие проблемы дают толчок совершенствованию методов управления сложным сетевым организмом, представляющим собой многообразие технологий, операционных сред, приложений и оборудования от различных поставщиков, часто не совместимых друг с другом и требующих раздельного администрирования и управления. Такие параметры, как производительность сети, уровень загруженности каналов связи, коэффициент использования портов, время отклика программных приложений, требуют непрерывного наблюдения и контроля. Причины, например неожиданное замедление работы какого-либо сетевого сегмента, могут быть самыми разными: неправильная конфигурация сетевых и программных средств, неполадки оборудования, комбинации действий различных пользователей.

Понять, в чем же дело, удается далеко не сразу, особенно если расстояния между центральным офисом и удаленными филиалами велики. К перегрузке может привести неадекватная производительность оборудования при достаточной емкости канала, неэффективность сетевых протоколов или прикладных сервисов. Задача повышения надежности и доступности ресурсов сети еще более усложняется из-за того, что все чаще компоненты приложений для электронного бизнеса размещаются за межсетевыми экранами, и они оказываются недоступными для прямого контроля со стороны служб ИТ.

ВЕКТОР ДВИЖЕНИЯ

По сравнению с 90-ми годами управление корпоративной инфраструктурой сегодня стало гораздо более зрелым. Еще не так давно заказчики предпочитали обособленные продукты для решения специфических задач. Сетевое управление рассматривалось в основном с точки зрения управления отдельными компонентами сетевой инфраструктуры: сетевыми устройствами, серверами, ПК, приложениями, базами данных, — и этого оказывалось вполне достаточно для поддержки клиент-серверных архитектур того времени. Поставляемые производителями сетевого оборудования программные средства использовались главным образом для их конфигурации и администрирования и располагали вполне адекватными встроенными сетевыми механизмами мониторинга.

Современные системы управления превратились в полностью интегрированные платформы, поскольку в целях поддержки всего бизнеса им приходится решать более сложные задачи управления территориально распределенной инфраструктурой. Один из базовых принципов функционирования таких систем заключается не в реакции на случившееся (когда, например, работа приложения останавливается из-за нехватки ресурсов, и в результате нарушается производственный ритм всего предприятия), а в вероятностном прогнозировании проблемы и ее предотвращении. Точечные решения продолжают присутствовать на рынке, поскольку потребность в специфических функциях управления до сих пор значительна, но, по оценкам экспертов, более 50% корпоративных пользователей предпочитают, чтобы функции управления были тесно интегрированы.

Единые платформы управления обеспечивают целостное представление взаимосвязей между всеми компонентами инфраструктуры, а интеграция в них высокоуровневых прикладных систем и служб создает базис для успешного управления современным предприятием. Учитывая, что бизнес все более ориентируется на заказчика, в последние годы изменился сам подход к управлению корпоративной сетью — в центре внимания теперь не сбор статистики с отдельных устройств, а поддержание работоспособности корпоративной сети для обеспечения хозяйственной деятельности предприятия.

Управление устройствами и приложениями — это только часть задачи управления. Акцент смещается в сторону обеспечивающих бизнес-процессы сервисов, поддержка которых в режиме реального времени становится основной целью платформы сетевого управления. Теперь предметом конкуренции для разработчиков средств управления являются функции мониторинга параметров соглашений об уровне предоставляемого сервиса, на основании данных которых можно выявить тенденции в изменении параметров сервисов и составить прогнозы. Это позволяет правильно и своевременно оценить влияние событий (отказов) на бизнес и осуществить приоритетное обеспечение ресурсов ИТ для поддержки критически важных бизнес-задач.

КОМПОНЕНТЫ УПРАВЛЕНИЯ

Управление инфраструктурой предприятия включает в себя целый комплекс средств управления сетевым оборудованием, серверами, платформами, приложениями, СУБД и даже прикладными сервисами. Ключевые функции администрирования и управления сетями отражены в модели Fault, Configuration, Accounting, Performance, Security (FCAPS) международной организации по стандартизации в сфере коммуникаций и обмена информацией ISO. Компоненты Fault решают задачу выявления и устранения сетевых проблем. Средствами Configuration осуществляются мониторинг и контроль аппаратного и программного обеспечения сети и любой их модификации. Accounting отвечает за распределение и надлежащее использование сетевых ресурсов. Назначение Performance — минимизация заторов и узких мест, выявление складывающихся тенденций и планирование ресурсов для будущих нужд. Security обеспечивает защиту от внешних и внутренних нарушителей. Данная модель дает общее представление о функциональном наполнении системы сетевого управления. Определенные наборы этих функций в той или иной степени реализованы в продуктах BMC Software, Computer Associates, HP, IBM, Micromuse, Veritas Software.

Ряд разработчиков средств управления предлагают узко специализированные продукты с тщательной проработкой выбранных функций. Компания Systems Manager Arts (Smarts) сфокусировалась на разработке решения Incharge по поиску, корреляции событий и анализу причин возникновения проблем в сетях IP и постепенно распространяет его на область управления серверами, приложениями и управление менеджерами. Microsoft реализует системы управления в качестве составной части OC, приложений или СУБД. NetIQ и Quest Software специализируются на разработке средств управления приложениями. Продукт Spectrum компании Aprisma (теперь это собственность Goris) представляет собой средство мониторинга сетевой инфраструктуры. Система Omegamon DE компании Candle, которую недавно приобрела IBM, ориентирована на проактивное управление и автоматизацию критически важных для бизнеса событий. Одна из главных разработок Candle — система мониторинга мэйнфреймов. Concord Communications поставляет систему сквозного управления производительностью и создания отчетов о качестве обслуживания eHealth, а решение NerveCenter компании OpenService обеспечивает корреляцию событий.

Средства управления сетевой инфраструктурой должны поддерживать максимальное разнообразие платформ и приложений. Производители разрабатывают соответствующие решения для сетей на базе различных технологий: VLAN, VPN и т. д. В отдельных случаях в платформы сетевого управления интегрируется программное обеспечение для контроля параметров внешней среды — температуры, влажности, сейсмической активности.

СЕТЕВОЙ МОНИТОРИНГ

В основе управления инфраструктурой предприятия лежит мониторинг текущего состояния сети (Network Management). Он предоставляет инструментарий для наблюдения и контроля за всеми ее структурными элементами (каналами связи и сетевыми устройствами), включая поиск и автоматическое обнаружение сетевых устройств (Discovery), построение топологии сети (Topology), механизмы опроса для определения доступности устройств (Polling), обработку прерываний SNMP (классификация по категориям, по статусу критичности), графическое отображение состояния устройств с указанием проблемных мест на карте.

Система сетевого управления должна обладать способностью самостоятельно классифицировать и обрабатывать большой поток служебных сообщений: выделять критичные, отбрасывать незначимые, сохранять те, которые могут понадобиться в дальнейшем для анализа и локализации неисправностей на основе методов корреляции событий в сложных сетевых топологиях с использованием алгоритмов анализа первопричины возникающих проблем (Root Cause Analysis, RCA).

Именно так построена многоуровневая платформа сетевого управления Netcool компании Micromuse. Сбор, обобщение, анализ и представление информации для управления сетью (Collect, Consolidate, Analyze, Inform, CCAI) выполняют пять базовых модулей линейки Netcool (OMNIBus, Service Monitors, Precision, Impact и DashBoard). Monitors осуществляет всеохватывающий мониторинг доступности, производительности, пороговых значений, сбор данных при помощи агентов-мониторов. OMNIBus — ключевой модуль линейки — получает информацию от зондов и обрабатывает ее в режиме, приближенном к реальному (в смысле оперативности работы агентов) времени. Precision, получив данные от специальных агентов Discovery, реализует автоматическое обнаружение устройств в распределенных гетерогенных средах, выполняет построение и графическую визуализацию сетевой топологии второго и третьего уровней (включая связи между различными сетевыми устройствами), осуществляет анализ сетевой структуры, определяет взаимосвязи компонентов топологии, выясняет статус устройств и обеспечивает актуальность сетевой топологии. Одна из наиболее важных функций Precision — корреляция событий и использование методов локализации проблем на основе RCA.

Собранная информация обобщается, преобразуется в унифицированный вид и далее применяется для централизованного управления событиями/инфраструктурой на уровне анализа и автоматизации посредством семейства продуктов Impact. Система Impact обогащает информацию, дополняя сообщения данными из внешних источников. Корреляция событий предусматривает автоматическое удаление событий, если проблема уже разрешена. Методы управления на основе правил помогают автоматизировать эти функции.

Самый верхний, презентационный, уровень архитектуры CCAI реализует средства представления (инструментальные панели, пользовательские интерфейсы, отчеты и т. д.) состояния информационных ресурсов как в режиме реального времени, так и в исторической ретроспективе даже если эти ресурсы распределены географически или принадлежат к различным департаментам. Портал DashBoard позволяет объединить все интерфейсы продуктов Netcool, а также интерфейсы к продуктам других производителей и пользовательские интерфейсы.

Пакет HP OpenView Network Node Manager — средство оперативного управления корпоративными сетями, а HP OpenView Performance Insight обеспечивает анализ и управление производительностью сетей IP, сетевого оборудования, серверных платформ, приложений, а также IP-телефонии. Оба продукта составляют единую систему поиска и устранения проблемных мест в работе корпоративной сети, используют общую конфигурацию опроса устройств и сквозную передачу сообщений о превышении пороговых значений от Performance Insight в систему NNM. Отчеты Performance Insight вызываются непосредственно из браузера событий или карт сети NNM.

Продукт Network Node Manager предоставляет удобный инструментарий и средства автоматизации для управления сетями IP. Наглядный графический интерфейс NNM позволяет с помощью карт точно отобразить топологию сети предприятия, быстро выявить неполадки и проанализировать причины их возникновения, а также определить тенденции и принять упреждающие меры.

Централизованное хранилище содержит данные о топологии сети, служебные сообщения и информацию о событиях, полученную по SNMP. Система автоматически устанавливает пороговые значения параметров работы сети на основании интеллектуального анализа собираемых данных и в случае их превышения предупреждает оператора о потенциальной угрозе. Широкие возможности по фильтрации потока сообщений от сетевых элементов и корреляционный анализ событий помогают существенно сократить количество второстепенных сообщений и выделить критичные.

HP OpenView Performance Insight (PI) обеспечивает мониторинг широкого перечня сетевых протоколов и устройств (Netflow, RMON, RMON2, frame relay, ATM, MPLS/VPN, Cisco IPT, Cisco SAA, системных и прикладных ресурсов серверных платформ). Пользователям предоставляется большой выбор типовых отчетов и инструментарий для построения собственных отчетов, где информация представляется в наглядной форме для выявления проблемных (с точки зрения производительности) мест в сети, на основании которой можно осуществлять проактивные действия по устранению недостатков. Анализ сообщений об инцидентах позволяет составить долгосрочные прогнозы на 30, 60 и 90 дней. Внимательное изучение отчетов Performance Insight помогает более точному планированию дальнейшего развития инфраструктуры ИТ.

Недавно в составе HP OpenView появился новый продукт — Route Analytic Management Systems (RAMS) — для анализа различных типов протоколов маршрутизаторов (BGP, IS-IS, OSPF). В его функции входят построение графических карт и анализ взаимодействия маршрутизаторов в реальном времени.

Задачи сетевого управления в продуктовой линейке BMC Software решаются с помощью PATROL Visualis и PATROL DashBoard, функциональность которых во многом сходна с функциональностью HP Open View NNM и PI. BMC PATROL Visualis обеспечивает построение топологии сети (на втором и третьем уровнях), мониторинг состояния контролируемых ресурсов, обработку прерываний SNMP, визуализацию на карте проблемных узлов и каналов связи. Отличительная особенность PATROL Visualis — наличие диагностического модуля Flows. Последний собирает информацию о разнообразных метриках (загруженность интерфейсов и процессоров, количество пакетов и ошибок и т. д.) и отображает ее в различных срезах на топологической карте с помощью изменения цвета и размера графических элементов, причем позволяет это делать как в режиме реального времени, так и в ретроспективе. Данные для анализа поставляют SNMP-агенты сетевых устройств и функционирующие на серверах агенты PATROL.

BMC PATROL DashBoard — это система управления производительностью сети, она реализует функции автоматического обнаружения сетевых устройств, сбора и накопления данных, контроля пороговых значений. PATROL DashBoard умеет работать с зондами RMON2, может выступать в качестве Netflow-коллектора данных от оборудования Cisco и отображать в виде графиков более детальную статистику по структуре сетевого трафика. Система позволяет осуществлять расширенную диагностику при интеграции в нее информации о времени отклика сетевых приложений от зондов PATROL End-to-End Response Timer и агентов Service Assurance (SAA) оборудования Cisco.

Модель управления, в соответствии с которой реализована платформа IBM Tivoli, предусматривает несколько этапов работы — мониторинг, анализ, планирование и выполнение. IBM Tivoli Monitoring представляет собой централизованную систему управления разнородной распределенной средой ИТ, в состав которой входят разнообразные решения по контролю за аппаратными средствами, платформами и приложениями. Продукт реализует стандартную модель управления (Common Information Model, CIM) для описания управляющей информации в сетевом окружении (см. статью автора «Управление эксплуатацией сетей операторов связи» в августовском номере «Журнала сетевых решений/LAN» за этот год). Эта модель опирается на базовые принципы объектно-ориентированной парадигмы и позволяет создавать собственные ресурсные модели мониторинга для конкретных нужд. За комплексное управление сетью на канальном уровне (анализ сбоев на коммутаторах) отвечает IBM Tivoli Switch Analyzer, работающий в связке с IBM Tivoli NetView и IBM Tivoli Enterprise Console.

МОНИТОРИНГ СЕРВЕРНЫХ ПЛАТФОРМ И ПРИЛОЖЕНИЙ

Если сетевой мониторинг основывается на сборе информации от встроенных агентов SNMP с оборудования производителей, то мониторинг платформ и приложений выполняют специализированные программные модули — агенты, устанавливаемые на подконтрольном объекте. Агенты разрабатываются производителями систем управления, и от их реализации зависит, каким образом и насколько оперативно будут выявляться и решаться те или иные проблемы. Если система не располагает качественным набором агентов, то функции анализа и центральная база событий, составляющие мозговой центр системы управления, оказываются бесполезными.

Эксперты лаборатории по тестированию сетей в Алабаме (Network Тesting Labs) провели исследование агентов различных производителей, по результатам которого пришли к заключению, что программные агенты и используемые в них технологии являются одним из основных факторов, влияющих на качество мониторинга систем и приложений. Для сопоставления различных средств мониторинга и их программных агентов были инсталлированы и проверены продукты Micromuse, HP, BMC, IBM, Concord Communications и NetIQ.

Для оценки были выбраны следующие критерии качества агентов: способность к быстрому предоставлению детальной и полной информации при минимальном использовании вычислительных и сетевых ресурсов, простота обновления и легкость развертывания. От скорости их работы зависит, насколько близко к режиму реального времени функционирует платформа управления. Желательно, чтобы агенты соответствовали отраслевым стандартам, не были жестко привязаны к какой-либо платформе и обладали хорошей документацией.

Серия проведенных в лаборатории тестов показала, что агенты Micromuse собирают наиболее точные и полные метрики, касающиеся серверов, приложений и сетевой среды, экономны в потреблении ресурсов, просты в инсталляции и лояльны в отношении стандартов. Они работают в различных вычислительных средах и неплохо документированы. Два основных типа агентов Micromuse — Applications Server Monitors (ASM) и System Service Monitor (SSM). Агенты SSM измеряют в режиме реального времени активность сетевого оборудования, серверов и основных приложений, а ASM оценивают изнутри работу приложений различных производителей. Оба типа агентов интегрируются не только с системой управления Nelcool/OMNIBus, но и с другими средствами получения информации по SNMP. Агенты SSM реализуют стандарты MIB-2, RMON/RMON2 и базы данных Host-Resources MIB, а дополнительно осуществляют гибкий мониторинг журнальных файлов и текущих вычислительных процессов.

Стандартный агент OpenView способен собирать более 120 метрик, из которых примерно 30 основных являются общими для всех платформ. Кроме того, специальный агент OpenView Performance собирает более 600 метрик для мониторинга производительности. Например, агент HP измеряет такие глобальные системные величины, как использование ресурсов процессора и памяти, статусы системных файлов и активность обмена страниц. Агенты HP могут выполнять корреляцию, приоритезацию, группировку и фильтрацию сообщений независимо от управляющей станции. Они выполняют корректирующие действия как с участием оператора, так и в автоматическом режиме, сообщая оператору о результатах выполнения соответствующего действия. В зависимости от назначения приобретенных и инсталлированных компонентов OpenView, агенты HP способны измерять широкий набор метрик — от состояния сервера и операционной системы до степени загруженности сети хранения SAN. Решения OpenView построены на базе модульной архитектуры, что позволяет интегрировать модуль сетевого управления и модуль управления серверными платформами и приложениями в единое решение по управлению инфраструктурой ИТ.

Основные элементы архитектуры BMC PATROL — агенты системы управления (PATROL Agents) и модули знаний (PATROL Knowledge Modules, KM). Модуль знаний PATROL KM содержит загружаемые библиотеки информации, где находятся правила для эффективного исследования, мониторинга, детектирования и управления событиями от различных источников информации в конкретной компьютерной среде. Каждый индивидуальный экспертный модуль PATROL KM адаптирован под конкретный объект управления — сервер, операционную систему, приложение, базу данных или компонент промежуточного программного обеспечения — и работает совместно с интеллектуальным агентом PATROL. Агенты BMC PATROL отличаются независимостью (каждый имеет собственное локальное хранилище событий и данных) и могут функционировать в среде большинства современных операционных сиcтем: от AS/400 до Novell NetWare. При мониторинге производительности агенты PATROL контролируют как стандартные параметры загруженности ОС (например, утилизацию центрального процессора, памяти, дисков, сетевых адаптеров), так и любые другие с помощью модулей, разрабатываемых на встроенном языке составления сценариев (PATROL Scripting Language, PSL).

Агенты IBM Tivoli осуществляют мониторинг загруженности важных сетевых ресурсов, узких мест и потенциальных проблем на основе установленных пороговых значений. IBM Tivoli имеет агентов для основных программных продуктов — Microsoft Exchange/Lotus Notes, Oracle и WebSphere, а также для любых типов компьютеров и вычислительных сред. Агенты IBM Tivoli эффективно применяются для мониторинга древовидной структуры каталога Microsoft Active Directory, контроллеров доменов Microsoft, серверов тиражирования Microsoft, серверов DNS и DHCP.

IBM Tivoli NetView содержит механизмы фильтрации, корреляции и обработки событий на основе правил управления сложными распределенными сетями любого размера, выявления тенденций возникновения проблем до их появления и быстрого устранения проблем. Помимо традиционных функций управления ресурсами сети продукт позволяет обнаруживать объекты в сети TCP/IP, просматривать сведения о топологии сетей, устанавливать взаимосвязи между событиями, управлять событиями и прерываниями, контролировать работу сети и собирать данные о производительности. Управление осуществляется локально, централизованно или путем передачи управления другим приложениям, например IBM Tivoli Enterprise Console (TEC), для дальнейшей корреляции с сообщениями от других источников событийной информации и совместного анализа.

IBM Tivoli Enterprise Console (TEC), ядро решений IBM Tivoli в области обеспечения доступности, по сути — мощная экспертная система на базе Prolog. Продукт предоставляет исчерпывающий обзор состояния всей распределенной корпоративной среды и специализированные ракурсы событий, входящих в сферу компетенции конкретного администратора, выполняет обработку и корреляцию событий, происходящих во многих разнородных распределенных системных и сетевых компонентах, а также позволяет осуществить автоматический запуск корректирующих действий.

Несколько слов стоит сказать об агентах CA, которые в исследовании экспертов Network Testing Laboratory не рассматривались. Система мониторинга CA Unicenter базируется на технологии «менеджер-агент». Один менеджер в состоянии управлять несколькими агентами, а один агент — взаимодействовать с несколькими менеджерами. Менеджеры способны выступать в роли агентов для других менеджеров. Интеллектуальные и активные агенты Unicenter собирают информацию обо всей инфраструктуре или отдельных ресурсах, информируют менеджеров о проблемах и автоматически предпринимают корректирующие меры в соответствии с заданными пользователем и определенными централизованно или локально правилами управления. При этом ресурсы для функционирования агентов требуются незначительные. Менеджеры могут располагаться в любом месте сети, а агенты привязываются непосредственно к управляемым ресурсам. Агенты собирают, распознают, фильтруют контрольно-измерительную информацию и отправляют ее менеджерам, а те в свою очередь анализируют, контролируют и согласуют управление ресурсами и информацию о состоянии среды, выявляя тенденции в ее изменении, благодаря чему достигается лучший контроль управляемых ресурсов. Такая распределенная архитектура позволяет значительно сократить служебный трафик.

В составе платформы управления Unicenter компании Computer Associates реализованы средства сбора, обобщения событий, их корреляции, анализа и построения прогнозов на основе принципов нечеткой логики нейронных сетей. Запатентованная технология нейроагентов Predictive Performance Option (Neuroagents) позволяет выявить неявные зависимости и спрогнозировать развитие ситуации. Нейроагент, к примеру, способен установить связь роста нагрузки на одной машине с ростом нагрузки на другой либо зависимость между динамикой сетевых транзакций на каком-либо компьютере и интенсивностью файловых операций. Данную технологию Computer Accosiates продает как самостоятельный запатентованный продукт. (Итальянский футбольный клуб «Милан» использует ее для составления прогнозов о предрасположенности игроков к получению травмы. Для обучения нейроагента используется предварительно созданная биометрическая модель человека, а в качестве параметров — метрики конкретного спортсмена. На основании прогноза, сделанного по технологии CA, выдается рекомендация об его участии в матче.)

ОТ СОБЫТИЙ К БИЗНЕСУ

Функции мониторинга или контроля производительности в первую очередь интересны администратору сети. Руководителю службы ИТ более важны сведения о событиях, которые предоставляют системы Event Management. Какой прок в информации о загруженности процессора, доле потерянных пакетов или отказе одного из тысячи портов, если банковский почтовый сервер оказался неработоспособным, из-за чего остановилась обработка платежных поручений? Данные об аварийном порте важны в том случае, когда к нему был подключен прекративший работу критичный сервер — ресурс, отказ которого может иметь серьезные последствия для бизнеса.

Для диагностики приложений используют так называемую сервисно-ресурсную модель, описывающую взаимосвязи сервисов и обеспечивающих их ресурсов. Примером такой взаимосвязи может служить взаимодействие сервера электронной почты с сервером базы данных. Дальнейшее развитие этой модели предусматривает оценку последствий (в том числе финансовых) событий на бизнес-процессы с точки зрения бизнес-подразделений и компании в целом.

Интегрированные платформы управления вышли далеко за рамки управления сетевой инфраструктурой. Теперь это мощные инструменты управления распределенной гетерогенной средой современного предприятия, модель функционирования которых должна описывать взаимосвязи между бизнес-процессами и ресурсами ИТ. Кроме того, они предоставляют руководству компании инструментарий, с помощью которого определяются конкретные затраты на все компоненты инфраструктуры для выявления, например, способа снижения непроизводительных расходов. Поэтому платформы управления не только располагают средствами мониторинга, но и обеспечивают создание наглядных отчетов, содержат элементы калькуляции, а также инструментарий для построения прогнозов в целях проактивного планирования инфраструктуры.

Одно из направлений развития платформ управления состоит в обеспечении доступности корпоративных и внешних сервисов из всех точек сети. Эта тема рассматривается во врезке «Моделирование и мониторинг сетевой активности».

Платформы управления ведущих производителей BMC Software, CA, HP, IBM развиваются с учетом стандартов ITIL (см. врезку «Руководство к действию»). HP OpenView опирается на концепцию ITSM на базе стандартов ITIL, отраслевых стандартов де-факто в области управления корпоративным предприятием. Ее стратегия управления включает три уровня: управление инфраструктурой, управление услугами ИТ и управление бизнес-эффективностью работы подразделения ИТ. Посредством HP OpenView Operations можно осуществлять консолидированное управление событиями при интеграции в нее средств управления инфраструктурой и приложениями ИТ. В пакете HP OpenView Navigator реализована сервисно-ресурсная модель, на основе которой можно автоматически оценивать влияние отказов различных компонентов инфраструктуры на бизнес-процессы.

BMC Service Impact Manager реализует концепцию Business Service Management — управление ИТ с точки зрения бизнеса. Продукт расширяет возможности сервисно-ресурсных моделей: от сервисов ИТ к бизнес-функциям и бизнес-показателям.

Один из компонентов DashBoard в составе платформы Micromuse Netcool — инструментальная панель Realtime Active DashBoard (RAD) — содержит средства моделирования взаимосвязей сервисов, отображает их состояние и предоставляет информацию об ущербе из-за недоступности услуг и влиянии услуг и процессов на работу предприятия. RAD в реальном времени ведет учет выполнения SLA по согласованным обязательствам.

Единый удобный интерфейс IBM Tivoli Business Systems Manager упрощает управление инфраструктурой ИТ с учетом взаимосвязи ресурсов и бизнес-процессов. Эта система интегрируется с продуктом IBM Tivoli Enterprise Data Warehouse, который обеспечивает управление инфраструктурой ИТ с точки зрения существующих приоритетов. Относительно новое решение в линейке продуктов IBM — Web Infrastructure Orchestration. Его главное предназначение — сокращение времени на развертывание и подключение дополнительных мощностей компьютерных систем на основе модульных серверов. Обнаружив изменения в нагрузке на сервер Web при добавлении новых сервисов в среду ИТ, Web Infrastructure Orchestration позволяет быстро (за несколько минут) настроить производительную работу с Web.

Unicenter развивается в соответствии с принципами ITIL — эта система предназначена не только для контроля инфраструктуры предприятия, но и для поддержки всей его деятельности. В ее состав входит средство описания «автомата состояний» для бизнес-процессов (Business Process Management), благодаря которому любой процесс в информационной системе может быть представлен с точки зрения бизнес-процессов, использующих эти ресурсы. В результате, руководство более четко видит реальную роль ИТ, а администраторы мгновенно оценивают воздействие того или иного события в инфраструктуре ИТ на весь бизнес компании. Одна из подсистем Unicenter Argis позволяет наладить взаимосвязь между инвентаризацией и финансовым учетом и дает ответы на вопросы о стоимости владения всеми ресурсами ИТ, на основании чего можно планировать бюджет на следующий год. Недавно включенная в состав продуктов Unicenter технология Sonar позволяет автоматически и динамически выявлять бизнес-процессы в инфраструктуре предприятия и отображать их на карте.

ЗАКЛЮЧЕНИЕ

По мере роста предприятия потребность в эффективном управлении его информационными ресурсами становится все более очевидной, современным платформам управления инфраструктурой предприятия вполне по силам справиться с этой задачей. Однако на результативность внедрения средств управления влияют не только функциональность программных продуктов, но, возможно, даже в большей степени, и методология управления информационными ресурсами, применяемыми на предприятии. Программные средства лишь инструмент, но даже очень хороший инструмент не гарантирует требуемого результата в случае его неправильного применения.

Наталья Жилкина — научный редактор «Журнала сетевых решений/ LAN». С ней можно связаться по адресу: nzil@lanmag.ru.

Моделирование и мониторинг сетевой активности

На администраторов сетей возлагается задача по обслуживанию не только сетевого оборудования и каналов связи, но и сетевых сервисов — DNS, DHTP, Web. Иногда необходимо обеспечить доступность корпоративных и внешних сервисов из всех точек сети, где они используются. Разработчики средств мониторинга служебных сетевых сервисов в своих продуктах HP OpenView Internet Services и BMC PATROL End-to-end Response Timer применяют метод синтетических транзакций для эмуляции транзакций реальных приложений. Пользовательские запросы — отправка или получение письма, запрос DNS на разрешение имени, запрос страницы Web, запрос по ftp, POP3, SNMP, IMAP — моделируются и выполняются с помощью зондов, установленных в точках присутствия провайдера Internet, в удаленных офисах или на сайте партнера за пределами межсетевого экрана. Одновременно определяется доступность сервиса, измеряется время отклика или производится анализ ответа.

Зонды позволяют контролировать и приложения более высокого уровня. Для этого нужно эмулировать работу клиентской части путем записи и воспроизведения либо сетевого трафика, либо действий пользователя в клиентском интерфейсе приложения. Во втором случае фактически используется «робот», нажимающий кнопки клиентского интерфейса и генерирующий с некоторой периодичностью тестовые транзакции из нескольких точек.

С помощью программных средств тестирования IBM Rational Robot моделируется и рабочая активность реальных пользователей. Таким образом можно оценить показатель времени отклика для любой транзакции. Анализ активности заказчиков в режиме реального времени выполняется посредством IBM Tivoli Monitoring for Transaction Performance. Оператор одним щелчком мыши может отобразить на экране схематичный путь транзакции и время прохождения каждой узловой точки «маршрута». Такая методика обеспечивает быструю локализацию проблемы и подключение для ее решения соответствующего программного компонента-анализатора или непосредственное участие технического специалиста.

Продукты CA Advanced Network Operation и Unicenter Response Option помогают определить не только время отклика приложения, но и продолжительность ожидания на клиентской машине, в сети или на сервере.

Руководство к действию

Разработка современных методик в области построения решений по управлению информационной инфраструктурой была начата Отделом правительственной торговли Великобритании (United Kindom?s Office Of Government Commerce, OGC) во второй половине 1980-х гг. Предложенный набор рекомендаций (Information Technology Infrastructure Library, ITIL) представляет собой совокупность книг с описанием интегрированной методологии управления услугами ИТ. Над созданием библиотеки ITIL трудились несколько организаций, в том числе консалтинговая компания Pink Elephant, специализирующаяся в области управления IT-услугами; в настоящее время она осуществляет сертификацию продуктов на соответствие ITIL. На данный момент концепция ITIL поддерживается и пропагандируется некоммерческой организацией IT Service Management Forum (ITSMF).

Описанные в ITIL процессы соответствуют требованиям стандарта ISO 9001. Книга «Сервисная поддержка» описывает службу сервисной поддержки (Service Desk), а также управление инцидентами, проблемами, изменениями, релизами, конфигурацией; книга «Предоставление услуги» — управление доступностью, нагрузкой, непрерывностью предоставления услуг, уровнем обслуживания, а также финансовое управление для услуг IT. На рынке до сих пор нет продукта, полностью отвечающего концепции ITIL, где во всей полноте были бы аккумулированы функции сетевого управления, и вряд ли, в силу экономической нецелесообразности, такой продукт появится. Поэтому неизбежно возникает потребность в интеграции нескольких продуктов, а оптимальным решением такой задачи является использование модульного принципа при реализации функционала.