Сеть хранения, хост, накопитель и коммутатор предлагают свои подходы для виртуализации имеющейся емкости хранения, цель которой - управление потоком данных. В будущем на первый план выйдет комбинация уже известных концепций. И здесь не обойтись без тщательного предварительного анализа имеющейся инфраструктуры.

В последние годы большинство предприятий очень осторожно относились к инвестициям в ИТ. Однако «все как прежде» долго оставаться не может, поскольку существенно возросли запросы к технологиям обработки данных. Особенно же увеличилась потребность в емкости хранения - по оценкам экспертов, годовой рост составляет от 50 до 100%.

Исследования показывают, что все большую часть объема хранимой информации занимает электронная почта. Но и она не является единственной составляющей прибывающего потока данных - другие типы документов также нуждаются в дополнительных ресурсах памяти. Современные законодательные нормы и стремление к рационализации путем оптимизации процессов стали причиной того, что многие квитанции, письма, счета и формуляры сканируются и сохраняются в электронном виде. На крупных предприятиях ежедневное сканирование всей входящей корреспонденции уже сегодня является стандартом. К этому добавляются большие объемы данных в популярных форматах JPG и PDF, а также несметное число копий других документов.

РАЗРОСШИЕСЯ СТРУКТУРЫ ХРАНЕНИЯ

Так что же делать с потоком электронных файлов? Формировавшиеся в течение многих лет структуры далеко не всегда однородны. Информация сохраняется на жесткие диски, оптические носители и магнитные ленты. Часто на предприятиях появлялись отдельные «островки», когда каждый сервер поддерживал собственную систему хранения. Поэтому существуют разные концепции обеспечения высокой готовности и восстановления после катастроф, а стоимость управления хранением данных быстро повышается и грозит подорвать бюджеты на ИТ.

Теперь множеству крупных предприятий приходится сталкиваться с тем, что емкость их оптических систем и жестких дисков практически исчерпана. Поэтому необходима специальная стратегия для расчистки завалов данных экономически эффективными методами с учетом сдерживания роста стоимости и емкости хранения. Кроме того, желательно добиться более простого администрирования, тем более что единая концепция должна сделать емкость хранения и потребность в ней более прозрачной и управляемой. Обусловленная этим миграция на современное программное обеспечение - сложный проект, особенно если параллельно существуют разные концепции и системы, между которыми нет никакой связи.

РАЗДЕЛЕНИЕ ВЫЧИСЛЕНИЯ И ХРАНЕНИЯ

Виртуализация хранения рассматривается как решение проблемы. Понятие виртуализации не ново - в области электронной обработки данных оно используется уже десятилетиями. В отношении хранения данных виртуализация означает, что использование ресурсов вычисления и хранения происходит без привязки к реальному аппаратному обеспечению. Так возникает логический взгляд на физический уровень.

По общему мнению, виртуализация позволит лучше использовать уже имеющиеся, а также внедряемые ресурсы. При реализации проекта необходимо обеспечить своевременное наращивание инфраструктуры в соответствии с требованиями приложений, но без чрезмерного роста стоимости. Кроме того, следует принимать во внимание законодательные нормы, касающиеся хранения данных и документов (см. Рисунок 1). В процессе решения этой задачи все имеющиеся в наличии аппаратные технологии объединяются в так называемый пул, в котором одинаково хорошо поддерживаются дисковые массивы, оптические системы хранения и ленточные библиотеки. При помощи инструментов управления хранилищами определяются правила, посредством которых можно осуществлять автоматизированное управление хранимыми данными. Таким образом, становятся возможными категоризация и копирование, а также удаление данных на имеющихся накопителях.

Рисунок 1. Хранилище должно удовлетворять различным законодательным требованиям.

В качестве связующей технологии между системами хранения используются сети хранения данных (Storage Area Network, SAN). Виртуализация возможна на разных уровнях, однако для каждого отмечаются свои особенности (см. Рисунок 2). Пока еще сравнительно новым методом является виртуализация на базе коммутаторов, когда инстанция виртуализации интегрируется непосредственно в коммутатор или маршрутизатор, к которому подключаются все распространенные серверные системы или системы хранения. Сторонники этого подхода уверены в его успехе и в инвестиционной надежности таких решений, однако их можно рекомендовать только тем, кто намерен полностью отказаться от своих старых систем хранения в пользу новой инфраструктуры. С гораздо большей вероятностью компании, как и прежде, захотят использовать имеющиеся аппаратные компоненты и гармонично объединить их путем виртуализации. Поэтому в первую очередь стоит обратить внимание на возможности виртуализации на уровне сервера (на основе хоста), на уровне сети хранения данных (на основе приложений) и на уровне хранения данных (на основе массива).

Рисунок 2. Тема виртуализации в отраслевой ассоциации сетевых хранилищ (Storage Networking Industry Association, SNIA).
РАЗРАБОТКА КОНЦЕПЦИИ ХРАНЕНИЯ

Каждый из вариантов обладает своими преимуществами и недостатками. В случае виртуализации на базе хоста все программное обеспечение и нагрузка возлагаются на серверы. Эта форма виртуализации позволяет осуществлять быстрый доступ к нескольким накопителям и оказывается очень эффективной. Однако предприятия попадают в зависимость от разработчика решения. Еще один недостаток заключается в том, что единого представления емкости не предлагается.

Виртуализация на базе SAN быстро реализуема, проста в управлении и обеспечивает доступ к нескольким накопителям и серверам. Однако в зависимости от размера сети существует опасность образования «бутылочного горлышка», из-за чего пострадает производительность сети. Что же касается масштабируемости, то и в этом случае ее возможности ограничены.

Наконец, виртуализация на базе накопителя предусматривает изменение архитектуры сети для обеспечения доступа к нескольким накопителям. Положительными сторонами являются близость к данным и доступ с нескольких серверов. Недостаток - опасность слишком крепкой привязки к производителю.

Для реализации собственной концепции хранения, прежде всего, нужна прозрачность. Если речь идет о надлежащем обращении с ценными массивами данных, то на первое место выходит анализ жизненного цикла, правовых предписаний и готовности данных. Кроме того, в рамках концепции хранения должны рассматриваться соответствующие приложения. При наличии у предприятия подходящей системы управления технологическими или деловыми процессами информация должна предоставляться своевременно. При этом чаще всего неважно, какая система хранения используется. Функции предварительной выборки относятся к числу стандартных в большинстве систем управления деловыми процессами.

Вторым шагом в общей концепции является мониторинг безопасности данных. Здесь следует исходить из наихудших предположений. Необходимо учесть катастрофические происшествия, к примеру затопление вычислительного центра, поскольку в таких ситуациях сотрудники должны как можно быстрее возобновить доступ к данным. Затем следует предусмотреть случай внезапного отказа отдельных системных компонентов без возможности быстрого определения источника отказа. Надежная защита и быстрое восстановление корпоративных данных должны считаться критичными для выживания предприятия. Часто в связи с этим возникают различные требования, которые должны быть включены в общую концепцию.

До того как на третьем этапе будут созданы отдельные виртуальные пулы хранения, технологии хранения данных проверяются на надежность и оптимальное применение. Центральное значение приобретает вопрос миграции данных: как она будет выглядеть в будущем и насколько большие объемы данных придется переносить через несколько лет на более современные технологии? Сегодняшняя неоднородность сред хранения возникла - в некоторой степени - вследствие стремления приобретать недорогие продукты. Между тем мнимая экономия оборачивается лишь ростом издержек. Это становится очевидным после наблюдения за величиной полной стоимости владения (Total Cost Ownership, TCO) на протяжении приблизительно трех лет и чаще всего выражается в увеличении потребления тока, издержек на охлаждение, затрат на обслуживание оборудования и программного обеспечения.

Из-за многочисленных преимуществ и недостатков различных подходов виртуализация «в чистом виде» едва ли встречается на практике. Подходы можно комбинировать таким образом, чтобы удовлетворить индивидуальным требованиям предприятия. Недооценивать проект виртуализации хранения ни в коем случае нельзя. Ожидаемой экономии и успешной оптимизации удастся достигнуть, лишь когда будут полностью изучены и проверены все «за» и «против» многочисленных вариантов хранения.

Вольфганг Штер - руководитель отдела обслуживания и поддержки компании Trooper Data Service AG, он отвечает за разработку хранилищ для бизнес-приложений. С ним можно связаться по адресу: wj@lanlinne.awi.de.


? AWi Verlag