Администрирование с контролем

Сетевое управление помогает администратору локализовать возникающие в сети ошибки и без промедления оценить ее состояние. Многие системы построены в соответствии с моделью FCAPS, т. е. разделены на управление ошибками, конфигурацией, статистикой, производительностью и безопасностью, причем не все решения охватывают полностью пять областей. Часто предприятиям попросту не нужна такая функциональность, им вполне хватает даже возможностей свободно распространяемого программного обеспечения или менеджеров элементов от производителей активных компонентов.

Администратор сети обычно отвечает за управление активными компонентами в локальных и глобальных сетях. В большинстве случаев к его обязанностям добавляется распространение программного обеспечения, а также управление системами и уровнем обслуживания. На крупных предприятиях некоторые предметные области переданы отдельным подразделениям, они занимаются мониторингом и конфигурацией своих компонентов, документируют их состояние в отчетах. Нередко для этой цели используется централизованное решение управления. Однако для различных компонентов и дисциплин могут применяться разные инструменты управления, работа с которыми в идеальном случае осуществляется тем не менее подразделением ИТ централизованно. Такой сценарий называется «зонтичное управление».

КОМПЕТЕНЦИИ

Говоря о сетевом управлении, как правило, имеют в виду управление и обслуживание коммутаторов и маршрутизаторов. Отсюда ясно, какие подразделения и лица должны быть вовлечены в соответствующие проекты. Однако система сетевого управления, охватывающая как локальную, так и глобальную сеть, обречена на провал, когда, к примеру, администраторы маршрутизаторов и глобальных сетей отказываются предоставлять доступ к собственным системам. Ни одно подразделение не захочет находиться под контролем у другого и добровольно никому не дает прав мониторинга своих компонентов. Чтобы провести внедрение новой системы управления с минимальным количеством препятствий, необходимо ответить на следующие вопросы:

каких специалистов нужно привлечь к участию в проекте?
кто принимает решение о выборе продукта?
какие права для работы с системой управления будут предоставлены конкретным лицам?

Кроме того, с самого начала следует четко установить, каким требованиям должна отвечать система. Лишь когда все заинтересованные стороны — и руководство, и исполнители — привлечены к реализации проекта, можно понять, что является причиной проблем — например, нежелание некоторых подразделений работать совместно и предоставлять доступ к своим системам.

ФУНКЦИОНАЛЬНЫЙ ОХВАТ

Все системы обычно позволяют получить графическое представление сети, когда инфраструктура ИТ изображается на так называемых картах (см. Рисунок 1). Многие производители предлагают возможность получения важной информации через интерфейс Web, а некоторые решения полностью базируются на Web и потому не зависят от платформы.

Рисунок 1. Карта раскинувшейся на всю Германию сети предприятия с указанием имеющихся соединений маршрутизаторов.

На карте, как правило, системы отображают сети IP — по одной или несколько подсетей IP. Однако это представление не учитывает зависимостей на втором уровне модели OSI. Так, например, оставшийся без ответа ping часто не позволяет определить, почему сервер недостижим. Поэтому производители систем сетевого управления дополнили свое программное обеспечение интеллектуальными элементами на втором уровне. Эти системы распознают, через какие порты или интерфейсы соединены между собой маршрутизаторы, коммутаторы и серверы, а по результатам опроса интерфейса сообщают, отчего нет доступа к серверу: из-за его отключения или по причине отсутствия соединения с магистралью.

Многие производители решений сетевого управления для описания различных возможностей своих инструментов используют модель управления сбоями, конфигурацией, статистикой, производительностью и безопасностью (Fault, Configuration, Accounting, Performance and Security, FCAPS). Эта модель была разработана Международным союзом телекоммуникаций (International Telecommunications Union, ITU) для провайдеров и операторов, поэтому для локальных сетей используются не все описанные в ней функции. Большинство систем предусматривает управление только такими категориями, как ошибки, конфигурация и производительность, причем на практике они часто перекрываются, и определить их границы невозможно. Часть из них, например статистика, реализуется в виде отдельных решений, которые рациональнее применять для специальных задач, поскольку многофункциональные универсальные продукты оказываются сложными и трудно поддаются управлению.

УПРАВЛЕНИЕ СБОЯМИ

Управление сбоями — основополагающая составная часть всех систем. Оно определяет поведение в случае тревоги, отвечает за обнаружение и исправление неисправностей, тестирование, а также за восстановление сети. Речь идет о том, чтобы после проявления ошибки как можно быстрее восстановить рабочее состояние. Путем опроса переменных SNMP в агентах сетевых компонентов и получения сообщений SNMP система распознает ошибки и анализирует их. Это может быть неготовность системы или превышение порогового значения, когда нагрузка на канал к серверу или между двумя коммутаторами превышает критическую. Система определяет причину ошибки: например, обнаруживает отсутствие соединения с магистралью. После выяснения причины система сопоставляет ее с различными сообщениями об ошибках и состоянии, подает сигнал тревоги, а управление конфигурацией устраняет ошибку — перезапускает системы или вызывает внешние программы для ликвидации проблемы.

Однако решающим фактором является то, что сообщения о тревоге в зависимости от времени суток и дня недели немедленно направляются ответственному сотруднику по электронной почте, SMS или пейджинговой связи. Слишком часто администраторы вычислительных центров узнают о случившемся лишь после звонка пользователя с жалобой на неработоспособность системы. Неправильно же сконфигурированные системы, постоянно выдающие тревожные сообщения, когда инфраструктуре ИТ ничего не угрожает, попросту игнорируются. Часто персонал не принимает всерьез работающую таким образом систему сетевого управления, поскольку она не предлагает никакой помощи. Тем не менее многие системы поддерживают возможность автоматического направления вызова в справочную техническую службу и именно этим интересны предприятиям, где бы хотели структурировать свои информационные технологии в соответствии с библиотекой инфраструктуры ИТ (IT Infrastructure Library, ITIL). В ней определены 12 ключевых процессов управления службами ИТ, а основная идея заключается в том, что правильно функционирующие процессы управления ведут к повышению качества услуг.

УПРАВЛЕНИЕ КОНФИГУРАЦИЕЙ

Управление конфигурацией позволяет контролировать, изменять и следить за компонентами при помощи соответствующих функций, к которым относятся сбор, представление, управление и актуализация параметров конфигурации. Управление конфигурацией должно автоматически обнаруживать все компоненты сети, распознавать их и классифицировать.

Автоматическое обнаружение наряду с данными об адресе сетевого узла (IP-адрес и MAC-адрес) должно позволять извлекать и другую информацию. Для топологий локальных и глобальных сетей недостаточно, когда из маршрутизатора или коммутатора третьего уровня считываются данные о маршрутизируемых сетях IP, поскольку все остальные сведения о топологии так же интересны и необходимы, например управляющая информация (Management Information Base, MIB) о мостах или исчерпывающие подробности о продвижении данных. В итоге может быть составлена точная топология сети, в частности способ физического соединения коммутаторов и маршрутизаторов между собой. Таким образом можно установить контроль за механизмами обеспечения избыточности, а в случае отказа сервера отследить цепочку соединений вплоть до соответствующего порта коммутатора.

С этой функциональностью связана и возможность документирования при условии, что предусмотрена функция экспорта, например в Visio. Более того, благодаря управлению конфигурацией должна появиться возможность устанавливать пороговые значения для самых различных параметров, к примеру нагрузки на сеть или широковещания. Само по себе конфигурирование компонентов проще всего осуществлять с помощью менеджеров элементов от соответствующих производителей компонентов.

УПРАВЛЕНИЕ ПРОИЗВОДИТЕЛЬНОСТЬЮ

В идеальном случае управление производительностью предоставляет данные обо всех коммуникационных процессах на предприятии. Сбор данных может происходить при помощи SNMP/удаленного мониторинга (т. е. путем опроса и сообщений SNMP от отдельных компонентов) или от внешних источников данных. Управление производительностью позволяет получить статистику о работе портов коммутаторов или маршрутизаторов в реальном времени. Кроме того, соответствующий инструментарий должен уметь также измерять время отклика компонентов и учитывать, например, нагрузку центрального процессора коммутатора или маршрутизатора. Отчеты позволяют сетевому администратору выдвигать предположения относительно производительности сети в будущем, поэтому хороший инструмент измерения производительности становится основой определения типовых характеристик и анализа тенденций для прогнозирования нормальной производительности сети и составления мнения о перспективах изменения объемов поступления данных. Анализ производительности позволяет предотвратить появление узких мест и тем самым повысить готовность сети (см. Рисунок 2).

Рисунок 2. Показания нагрузки и возникающих ошибок.

СТАТИСТИКА

Создание отчетов об использовании сетевых услуг и передача их инициаторам, персонам и группам относится к управлению статистикой (см. Рисунок 3). Эта задача относительно сложна и в большинстве систем сетевого управления реализуется с большими затратами. Классическое управление на базе SNMP часто не в состоянии с ней справиться, поскольку требуется другой коллектор данных. Однако для растущего числа предприятий упорядочение затрат играет главную роль и потому должно быть хорошо продумано в рамках сетевого управления.

Рисунок 3. Отчет о готовности коммутатора.

УПРАВЛЕНИЕ БЕЗОПАСНОСТЬЮ

Управление безопасностью при сетевом управлении играет второстепенную роль, поскольку состоит преимущественно в ограничении доступа и задании прав на использование сети. В эту категорию попадают идентификация, аутентификация и авторизация. Для указанных действий разработаны специальные решения.

ЗАКЛЮЧЕНИЕ

Не всегда необходима поддержка всех категорий модели FCAPS. Часто в небольших однородных сетях для сетевого управления достаточно менеджера элементов от производителя активных компонентов — к примеру, IronView от Foundry, Cisco Works или EpiCenter от Extreme. Система сетевого управления вовсе не обязательно должна быть дорогой. Если она применяется правильно, то быстро окупается благодаря сокращению времени на ликвидацию отказа, а в небольших сетях администратору даже не приходится применять такие сложные платформы, как Tivoli или HP OpenView. В этом случае можно предложить соответствующее свободно распространяемое решение Nagios или Whats Up Gold от IPswitsch.

Оливер Зюэс — консультант в компании Magellan. С ним можно связаться по адресу: db@lanline.awi.de.

? AWi Verlag