Перестав справляться с наплывом данных и устав от постоянной модернизации RAID, специалисты американского Национального пенсионного фонда работников коммунального хозяйства решили взять на вооружение технологию SAN на базе Fibre Channel.

Управление пенсионными программами для более чем 300 местных отделений профсоюзов — задача не из легких. Располагая активами в размере 4,5 млрд долларов, Национальный пенсионный фонд работников коммунального хозяйства (водопровода и канализации) оперирует информацией о занятости, финансовыми документами, данными о правах на те или иные привилегии и занимается распределением пенсионных средств почти четверти миллиона состоящих на его учете членов. Этой организации приходится иметь дело с огромным объемом информации, касающейся почти 40 тыс. работающих и получающих пособия пенсионеров, а также хранить пенсионные истории клиентов за прошедшие 32 года. Проблема управления хранением сотен гигабайт данных превратилась в сущий кошмар для технического отдела пенсионного фонда.

Поэтому около полутора лет тому назад, когда потребовалось перестроить пять дисковых систем RAID за ограниченный период времени, Билл Маннинг, начальник технического отдела пенсионного фонда, применил абсолютно нестандартный подход при выборе и внедрении устройств хранения. Будучи человеком осторожным и предусмотрительным, Маннинг тем не менее сделал ставку на новую, еще не опробованную технологию, так называемую виртуализацию памяти, — и не прогадал. В частности, он обнаружил, что данная технология коренным образом меняет подход к развертыванию, управлению и модернизации системы хранения, предназначенной для решения критически важных задач пенсионного фонда.

ФИЗИЧЕСКИЙ УРОВЕНЬ ВИРТУАЛИЗАЦИИ

«На самом нижнем, физическом, уровне виртуализация нивелирует различия между всеми разнородными системами хранения», — объясняет Стив Дюплесси, соучредитель и старший аналитик консалтинговой компании Enterprise Storage Group, специализирующейся на рынке систем хранения. Другими словами, данная технология позволяет создать систему хранения на базе решений различных производителей, причем для серверов этой системы она представляет собой единое унифицированное пространство, что избавляет пользователей от необходимости переплачивать, приобретая устройства одного производителя. Более того, применение данной технологии открывает перспективы для реализации в гетерогенной среде таких приложений, как тиражирование, «мгновенные снимки», или «зеркалирование», вне зависимости от того, кем произведена дисковая подсистема. Она также улучшает управление, а это значит, что для получения широкого спектра возможностей пользователю вовсе не требуется выбирать самую дорогую дисковую систему.

Дюплесси также полагает, что во всем мире имеется лишь 50-100 сетей корпоративного уровня с полномасштабной реализацией технологии виртуализации памяти. Рэнди Кернс, совладелец консалтинговой компании Evaluator Group, специализирующейся на сетевых системах хранения, размышляет об основных причинах существующего положения дел. Он отмечает, что всего несколько производителей выпускают продукты на базе данной технологии. «Наиболее известные игроки, так много говорящие о виртуализации, в действительности ничего не поставляют. Compaq и IBM анонсировали решения на базе технологии виртуализации, но ни одно из них на рынке пока не представлено», — замечает он. Еще один ведущий поставщик систем хранения, компания Hewlett-Packard, недавно проник на этот рынок с «черного хода», приобретя компанию Storage-Apps, разрабатывающую ПО управления системой хранения.

По мнению Майкла Петерсона, президента консалтинговой компании Strategic Research, специализирующейся в области сетевых систем хранения, выбор решений на базе данной технологии, предлагаемый известными производителями, довольно беден, и это отпугивает многих потенциальных заказчиков. «Складывается парадоксальная ситуация, — удивляется он. — Вряд ли хотя бы один центр обработки данных решится приобрести систему для ответственных приложений от неизвестной компании! Вместе с тем, поставщиками решений на базе виртуализации преимущественно становятся малоизвестные производители, в узкий круг которых входит компания DataCore Software, предоставившая программное обеспечение Национальному пенсионному фонду работников коммунального хозяйства». Среди таких разработчиков можно еще назвать FalconStor, StorageTek, Tricord, TrueSan Networks и Veritas.

По данным исследовательской компании IDC, в отсутствии известных компаний-производителей объем рынка систем хранения на базе виртуализации пока невелик, но сохраняет устойчивую тенденцию к росту. По ее же прогнозам, среднегодовой темп роста в сложных процентах для средств управления ресурсами хранения за период с 1999 по 2004 гг. увеличится почти на 22%, в то время как темп роста общего объема рынка в целом составит 16%.

ХОРОШО ЗАБЫТОЕ СТАРОЕ

Как отмечает Петерсон, концепция виртуализации памяти не нова. По сути, под этим термином часто подразумевают дисковые массивы RAID и системы зеркалирования, когда данные хранятся отдельно, хотя на самом деле такой подход не обеспечивает «истинной» виртуализации. Однако термин прижился и теперь обозначает разнесение главных компьютеров и систем хранения данных. Безусловно, он имеет непосредственное отношение и к такому понятию, как сеть хранения данных (SAN), однако, как подчеркивает Петерсон, не все сети хранения обладают возможностью виртуализации.

Поставщики решений для данной технологии пытаются устранить один из основных недостатков существующих реализаций SAN — сложность построения разнородной среды из различных серверов, чтобы они могли совместно использовать данные, разнесенные между несколькими дисковыми системами. При совместном использовании распределенных данных в сетях хранения SAN под управлением ОС Windows NT и UNIX чрезвычайно сложно реализовать принцип передачи данных блоками, поскольку названные операционные системы базируются на различных форматах файлов. Виртуализация хранения пытается преодолеть это препятствие. Основная цель данной технологии — сделать отдельные системы хранения невидимыми для серверов корпоративной сети, вне зависимости от их типа или местоположения. При установке системы виртуализации сервер должен «видеть» единственное хранилище имеющихся данных, как если бы оно было непосредственно подключенным.

Виртуализация хранения предоставляет ряд новых возможностей. Основное преимущество состоит в способности создавать виртуальные диски варьируемой емкости, управлять ими, переопределять, или, другими словами, логически группировать дисковое пространство. Таким образом, один том может располагаться на нескольких физических устройствах, и дисковое пространство в этом случае используется более эффективно, поскольку пользователи могут динамически менять емкость диска в процессе работы по мере необходимости.

По словам Джима Барбера, руководителя технического отдела компании-посредника Selenetix, при установке системы виртуализации SANsymphony компании DataCore новая технология предоставляет обслуживающему персоналу бо?льшую гибкость в построении различных конфигураций систем хранения. С этой технологией заказчику не придется быть привязанным к системам хранения одного-единственного поставщика. «И это великолепно, — продолжает Барбера, — потому что UNIX может использовать одну модель системы хранения, NT — другую, а SGI (Silicon Graphics) — третью, вам же необходимо всем этим хозяйством управлять, правильно связывая все элементы и пользуясь средствами виртуализации».

ПЯТЬ ТИПОВ ВИРТУАЛИЗАЦИИ

По словам Кернса, на практике применяется пять различных способов реализации концепции виртуализации: симметричные и асимметричные модели, которые иногда еще называют in-band и out-of-band, в зависимости от использования для доступа основного или вспомогательного канала (локального порта) соответственно, а также реализации на базе серверов, коммутаторов и систем хранения.

Хотя в технологии виртуализации наиболее популярны первые две модели, ни та, ни другая еще не заняли ведущего положения на рынке. Кернс полагает, что один лидер лучше нескольких, но вряд ли это лидерство кому-то удастся захватить, поскольку рынок систем хранения столь велик и растет так быстро, что для каждого подхода существует масса применений.

Кернс убежден, однако, что если кто-то воспользуется системой хранения на основе виртуализации, то он никогда больше не согласится на другое решение. Это привело бы к разрушительным последствиям, поскольку слишком сложно перемещать данные из одной схемы в другую.

Система хранения на основе виртуализации SANsymphony компании DataCore, установленная в пенсионном фонде, — типичный пример виртуализации с использованием основного канала (симметричный подход, in-band). При этом подходе сама структура сети (см. Рисунок) диктует необходимость введения менеджера сети хранения SAN в качестве посредника между хост-компьютерами и информационными системами. Кернс применяет по отношению к программному менеджеру SANsymphony эпитет «интеллектуальный», поскольку он управляет обменом данными между хостами и устройствами хранения сети SAN и тем самым обеспечивает виртуализацию. Взяв за основу такую архитектуру, специалисты технического отдела пенсионного фонда могут по желанию добавлять и удалять виртуальные области памяти, а также перемещать логические разделы с одного сервера или приложения на другие — и все это в оперативном режиме, при работающих серверах, приложениях и дисках.

По словам Кернса, симметричному методу доступа свойственны накладные расходы на обработку данных: задержка при их сохранении и извлечении. Это вызвано перемещением данных через промежуточное устройство, которое DataCore называет сервером домена хранения (Storage Domain Server, SDS). Для преодоления названного недостатка в компании DataCore применили кэширование. В большинстве случаев подобный прием сокращает задержки на обработку данных.

Менеджер системы хранения SANsymphony работает под управлением NT 4.0 или Windows 2000 на компьютере Server/Advanced Server (Win2k), являющемся сервером SDS. Это устройство связано с сетью SAN посредством стандартных адаптеров шины хоста Fibre Channel (Host Bus Adapters, HBA) и коммутаторов, что позволяет напрямую подсоединять к серверу SDS устройства с интерфейсами Fibre Channel, SCSI, а также EIDE/ATA. (DataCore недавно объявила о поддержке сетей SAN по протоколу IP.)

В конфигурации DataCore все устройства хранения, подсоединенные к серверу SDS либо к коммутатору, становятся виртуальными. Таким образом создается логический пул хранения данных, который может быть по выбору распределен между серверами, работающими под управлением NT/ Win2K, Solaris компании Sun Microsystems (для архитектуры SPARC и Intel), HP/UX компании Hewlett-Packard, AIX компании IBM, Linux, Iris компании SGI, MacOS компании Apple Computer, а также NetWare компании Novell.

Еще одним преимуществом SANsymphony Петерсон из компании Strategic Research считает ее простоту и управляемость. Он также полагает, что DataCore реализовала достаточно большое число «успешных проектов в области ИТ и приобрела многочисленных партнеров», так что потенциальные клиенты могут чувствовать себя спокойно.

Компания DataCore предлагает две версии своего продукта: редакцию Server, которая создает единый логический пул для каждого SDS в отдельности, и редакцию Network (или Enterprise), предусматривающую единый логический пул, связанный с множеством SDS.

РОСТ ПО ЭКСПОНЕНТЕ

Почти полтора года тому назад Маннинг оказался в ситуации, когда в связи с расширением бизнеса ожидался резкий рост объемов информации. Это потребовало значительного увеличения емкости хранения для баз данных под управлением NT и Solaris. Он искал альтернативу необходимости ежегодно строить новые массивы RAID, поскольку емкость дисковой подсистемы в пенсионном фонде была уже недостаточна для решения насущных проблем.

Необходимость увеличения емкости ведет к необходимости полной замены существующих массивов на системы RAID большей емкости, что весьма дорого и сложно. RAID сконструирован таким образом, что если нужно увеличить емкость хранения, то придется покупать идентичные накопители. Скажем, в корпусе размещается пять накопителей, но рассчитан он на десять. Можно приобрести еще пять, но точно таких же. «Проблема в том, что технология меняется очень быстро, и через год-два эти устройства будет уже невозможно найти, — рассуждает Маннинг. — Практически это означает, что потребуется заново покупать оборудование и создавать массивы RAID. Получается, что все предыдущие затраты были сделаны впустую».

Естественно, что подобное решение неприемлемо. Все больше и больше местных отделений профсоюзов поручают фонду оперативное управление своими пенсионными планами с целью сокращения издержек. Увеличение количества запросов на хранение информации приводит к тому, что пенсионному фонду приходится ежегодно проводить утомительную модернизацию своих массивов RAID, что влетает в копеечку.

ДРУЖЕСКАЯ ПОДДЕРЖКА

Когда Барбера из компании Selenetix предложил Маннингу приобрести продукт компании DataCore на базе технологии SAN, он объяснил это тем, что «пенсионный фонд находится именно в той ситуации, при которой компании прибегают к развертыванию SAN». Он вспоминает, что в пенсионном фонде были установлены специфические системы RAID для различных приложений: серверы электронной почты, серверы базы данных и серверы документов, причем всем им выделялась память равной емкости. Однако при таком типе сетевой среды реальные потребности приложений часто не совпадают с выделенными ресурсами. Один массив всегда заполняется быстро и полностью, другой — лишь наполовину, а третий остается и вовсе пустым. Обычно электронная почта — приложение с невысокими требованиями к объему памяти, тогда как за короткое время емкость сервера документов заполняется файлами персонала из 80-100 человек целиком, а сервер базы данных — на 40-50%.

Перемещение выделяемой приложениям емкости хранения с одной системы RAID на другую — дело непростое. Данная процедура — как это происходило в случае упомянутого пенсионного фонда — требует от персонала ИТ перестройки массивов RAID, которую Барбера назвал «игрой в разочарование». По общему мнению экспертов, в подобной ситуации виртуализация хранения окупается сполна. «Биллу Маннингу и его администраторам все время приходилось модернизировать или покупать дополнительные дисковые массивы», — вспоминает Барбера. С переходом на сеть хранения на основе SANsymphony Национальный пенсионный фонд смог организовать управление этими массивами и распоряжаться дисковым пространством по своему усмотрению, чтобы не начинать каждый раз сначала.

СЕМЬ РАЗ ОТМЕРЬ

Руководство технического отдела пенсионного фонда при переходе к виртуализации системы хранения проявило надлежащую предусмотрительность. Маннинг отдавал себе отчет в том, что SAN не устоявшаяся технология, поэтому, приступая к проекту, он испытывал некоторые сомнения по поводу того, как все это будет работать. Но он также понимал, что задача сложнее, чем простое подключение/подсоединение.

Уже на первом этапе перехода к новой системе руководство фонда убедилось в необходимости развертывания SAN. «Мы представили аналитический отчет об издержках, чтобы проиллюстрировать, как быстро растут объемы данных», — рассказывает Маннинг. Как уже отмечалось, большинство профсоюзов поручает управление своими пенсионными программами фонду, чья потребность в средствах хранения растет вследствие этого экспоненциально. Прогнозируемые темпы роста показывали, что о создании новых массивов RAID придется задумываться каждые 1-1,5 года. Специалисты пенсионного фонда подсчитали стоимость каждого нового массива RAID, включая затраты на простои, связанные с переконфигурацией своей системы хранения. Результаты этих подсчетов послужили веским аргументом в пользу выбора наименее трудоемкой стратегии. «К тому же мы знали, что могли бы более эффективно использовать имеющееся у нас оборудование и без особого труда интегрировать новую емкость по мере надобности, не останавливая работу организации для проведения двухдневных технических мероприятий», — добавляет Маннинг.

Имея на руках финансовые расчеты, доказывающие, что суммарная стоимость сети SAN была бы ниже существующей, Маннинг все же с осторожностью относился к тому, чтобы доверить новой технологии сохранность критически важных данных. «Естественно, я сомневался по поводу технологии, поэтому вместе с нашим интегратором мы самым тщательным образом протестировали ПО и всю конфигурацию», — признается он.

Процесс предварительной проверки включал в себя создание «SAN в лаборатории», где Маннинг и специалисты компании Selenetix скрупулезно протестировали программное обеспечение. «Мы проверяли работоспособность системы при отказе отдельных элементов и моделировали аварийные ситуации, специально вынимали диск из массива, чтобы посмотреть, насколько данные способны к самосохранению, отключали головные устройства, определяя, будет ли приложение продолжать работать, а также протестировали возможность резервного копирования и восстановления. И для подстраховки на первые две недели мы оставили работать один массив RAID, что оказалось излишним», — вспоминает Маннинг.

Наконец, в августе 2000 г. пенсионный фонд начал работать с системой DataCore. Как показано на Рисунке, кроме SDS (под кодовым названием DisneyWorld), сеть состоит из нескольких характерных для SAN компонентов, включая два коммутатора Capellix 2000 компании Gadzoox Networks, а также контроллер RAID с поддержкой Fibre Channel компании RAIDION Systems (верхний левый угол на Рисунке).

Как видно на иллюстрации, дисковые устройства сети пенсионного фонда, маркированные как «виртуальные диски», подключаются к соответствующим серверам NT (с именами Pumba, Hercules, Shrec и Alladin) через интерфейс Fibre Channel (FC на Рисунке); однако эти соединения являются логическими. На самом деле виртуальные диски располагаются на трех дисковых массивах, подключенных к контроллеру RAIDION массива RAID.

Когда SANsymphony работает на сервере SDS, специалисты могут «жонглировать» дисковым пространством как угодно с помощью специального приложения в виде графического средства управления. SANsymphony управляет процессом распределения дискового пространства и определяет, какие серверы назначаются определенным томам в сети SAN.

С тех пор как установлена SANsymphony, объем хранения увеличился с четверти терабайт до полтерабайта. Специалисты технического отдела пенсионного фонда сделали это за одну неделю, а в течение следующей провели распределение дискового пространства и его назначение виртуальным дискам — и все это при сохранении сетевых сервисов.

Теперь, когда установлена SAN на базе SANsymphony, требуемое пространство для планируемой системы представления документов стало выделять намного легче благодаря возможности объединения ресурсов. Это лишь одно из направлений работы пенсионного фонда, стремящегося по возможности перейти на безбумажную технологию работы. «Мы планируем перевести все документы, накопленные за 33 года, из бумажного вида в электронное представление (как правило, это пенсионные истории клиентов). Перевод этих файлов в сеть хранения SAN позволит упростить многие процедуры нахождения данных пенсионного фонда, — делится своими планами Маннинг. — Прежде, когда какому-нибудь специалисту фонда требовалось просмотреть конкретный файл, клерк должен был определить местоположение и достать папку с файлом, содержащим соответствующие документы. Затем эта папка должна была пройти через всю систему пенсионного фонда, через различные отделы, которые запрашивали нужную информацию». Это отнимало много времени и сил. К тому же хранение данных в электронном виде резко сокращает вероятность потери или путаницы файлов.

Специалисты технического отдела пенсионного фонда строят дополнительные планы по поводу развертывания SANsymphony. Как уже упоминалось, они намерены переместить данные с отдельных массивов RAID на серверы сети SAN под управлением Solaris и надеются завершить эту работу в ближайшие полгода. Для обеспечения избыточности намечается создать еще одну зеркальную SAN. Процесс, который будет включать инсталляцию редакции Network системы SANsymphony, предоставит персоналу фонда альтернативный путь к данным, что исключит вероятность отказа всей системы из-за сбоя на отдельном участке.

Хотя система по большей части работала в соответствии с ожиданиями, ее первоначальная установка в 2000 г. проходила не без проблем, пусть и не столь существенных. Во время инсталляции и тестирования продукт DataCore показал себя безупречно, но когда на следующий день он был запущен уже в реальных условиях, то сразу же отказал. Причина неисправности заключалась в несовместимости микросхем с программным обеспечением системы. Проблему разрешила компания DataCore, и система была запущена в работу без каких-либо отказов впоследствии.

Джим Карр — зам. главного редактора Network Magazine. С ним можно связаться по адресу: jcarr@cmp.com.


В двух словах

Национальный пенсионный фонд

Национальный пенсионный фонд работников коммунального хозяйства (водопровод и канализация) Александрия, шт. Вирджиния

Отрасль: финансовые услуги

Руководитель проекта: Билл Маннинг, начальник технического отдела пенсионного фонда.

Персонал ИТ: 15 человек, включая Маннинга.

Специализация: программные средства управления хранением.

Объем услуг: управление пенсионными программами в объеме 4,5 млрд долларов для более чем 300 профсоюзов работников коммунальных служб, на учете которых состоит 200 тыс. человек и 108 сотрудников.

Задачи. Расширение услуг для новых членов пенсионного фонда и планируемый перевод документов в архивную электронную систему графических документов привели к тому, что фиксированная емкость массивов RAID и простых дисковых массивов оказалась недостаточной для растущего объема информации. Это вновь и вновь вынуждало приобретать новые и перестраивать имеющиеся системы хранения пенсионного фонда.

Решение. Национальный пенсионный фонд работников коммунального хозяйства развернул систему хранения на базе виртуализации, выбрав решение компании DataCore Software - средство управления памятью SANsymphony. Данное программное решение позволяет специалистам фонда создавать, управлять и тиражировать виртуальные тома по желанию, назначая и переназначая логические разделы на дисках определенным серверам по мере надобности.