Крупнейшие производители компьютеров предлагают системы хранения собственной разработки или выпускаемые в тесном альянсе с фирмами, специализирующимися на соответствующем рынке. В число партнеров Fujitsu Siemens Computers в области систем хранения входят EMC, Microsoft, StorageTek и другие компании, однако именно союз с NetApp оказался наиболее плодотворным
Системы хранения NearStor предназначены для оперативного резервного копирования информации с рабочих высокопроизводительных и дорогих дисков на более медленные и дешевые

Американская компания Net?work Appliance создана в 1992 году, а партнерство с FSC началось в 2000 году. Fujitsu Sie?mens стала ее крупнейшим партнером и в Европе, и в мире, а в России она — «главный представитель» интересов Network Appliance. (Авторизованным дистрибьютором продукции NetApp в СНГ является S&T International.) Союз между этими компаниями дает им возможность предоставить рынку широкий спектр современных решений в области хранения. Fujitsu Siemens предлагает собственные решения CentricStor в области ленточных систем хранения, а продукция NetApp относится в первую очередь к дисковым системам.

Виртуальные ленты

CentricStor является комплексным программно-аппаратным решением для ленточных систем хранения, основанным на идее виртуализации накопителей на магнитных лентах. Оно обеспечивает высокую масштабируемость — до 512 виртуальных накопителей, с суммарной скоростью обмена до 1200 Мбит/с, и включает средства резервного копирования и репликации. Виртуализация накопителей на магнитных лентах предлагается также IBM, но ее продукт ориентирован на мэйнфреймы, а CenticStor предназначен для рынка систем Unix и Windows.

С технической точки зрения подобная виртуализация обычно предполагает использование «вторичных» жестких дисков в качестве кэш-памяти, расположенной между ленточными накопителями и первичными дисками, с которых осуществляется резервное копирование.

Компания Fujitsu Siemens предложила предельно удобную для системных администраторов виртуализацию накопителей на магнитных лентах: Unix «видит» систему CentricStor просто как обычную ленточную SCSI-библиотеку.

Аппаратная часть CentricStor может базироваться на накопителях разных типов, в том числе IBM3590, StorageTek T9840/T9940, устройств DLT, Magstar и др., но среди множества современных ленточных технологий Хельмут Бек, специалист подразделения систем хранения Fujitsu Siemens, в качестве наиболее перспективной указал на LTO.

Храните данные в устройствах NetApp

Крупнейшие ИТ-производители предлагают системы хранения собственной разработки или выпускаемые в альянсе с фирмами, специализирующимися на соответствующем рынке. В число партнеров Fujitsu Siemens Computers в области систем хранения входят EMC, Microsoft, StorageTek и другие компании, однако наиболее плодотворным оказался союз с NetApp.

Среди задач, для решения которых предназначены системы хранения NetApp, — консолидация; резервное копирование и восстановление; регулирование прав доступа; восстановление при катастрофах; обеспечение эффективного доступа в Internet и информационной безопасности.

Спектр предлагаемой NetApp продукции для систем хранения достаточно широк — это решения категории NAS, SAN, аппаратные средства сетевого кэширования, а также линейка продуктов NearStor.

Во всех системах хранения NetApp используется единая, оптимизированная для работы с файлами операционная система Data ONTAP, написанная на C/C++, которая разработана фирмой «с нуля», на базе концепции микроядра.

Важнейшим компонентом этой ОС является журналируемая файловая система WAFL (Write Anywhere File Layout), которая также была разработана «с нуля», хотя в ней и используются некоторые идеи «классической» файловой системы Unix. Конфигурирование серверов NetApp может осуществляться удаленно через Web-браузер.

Системы хранения NearStor предназначены для оперативного резервного копирования информации с рабочих высокопроизводительных и дорогих дисков на более медленные и дешевые.

Такое решение NetApp впервые предложила в 2001 году; оно может рассматриваться как промежуточная ступень по сравнению с копированием на накопителях на магнитных лентах. Различные конфигурации систем NearStor предоставляют для резервного копирования дисковые емкости от 12 до 96 Тбайт.

NAS-решения

Для использования в качестве файловых серверов (то есть в системах категории NAS — Network Attached Storage) предназначена линейка продуктов NetApp Fabric Attached Storage (FAS; в названиях некоторых продуктов «префикс» сокращается до одной буквы F, выступающей, вероятно, как сокращение слова Filer).

По сути, NAS — «обычный» файл-сервер, то есть сервер, обеспечивающий работу сетевой файловой системы (NFS или, в случае Windows, CIFS/SMB). Серверы FAS могут выступать в качестве серверов FTP или Web. Из этих функций и следует исходить при оценке необходимости применения NAS по сравнению с обычными подключаемыми напрямую локальными дисками. Конечно, в случае необходимости достижения максимальной производительности ввода/вывода целесообразно использовать системы прямого доступа с дисками с интерфейсами Fibre Channel или SCSI, подсоединенными к разным каналам, разным шинам PCI и т. д.

Очевидными преимуществами применения хранилищ данных FAS, кроме консолидации, является поддержка мультиплатформенности (Unix и Windows) и удобство системного администрирования (управление хранилищем, резервное копирование/восстановление), включая средства виртуализации дисков. Логические (виртуальные) диски LUN в Data ONTAP являются просто контейнерами дисковых блоков.

Как утверждают в NetApp, применения NFS вполне достаточно (с точки зрения производительности) для большинства баз данных, в частности, при работе с SAP. Для ускорения работы серверов FAS со сложными SAP-приложениями может применяться DAFS (Direct Access File System), работающая с NFS версии 4. При этом применяется технология Virtual Interface, использующая RDMA (Remote DMA) для пересылки данных. Поскольку в традиционной Ethernet-среде, поверх которой работает TCP/IP, нет аппаратной поддержки RDMA, это повышает потенциальную эффективность обладающей такой поддержкой технологии Infiniband. Поэтому в NetApp считают эту технологию перспективной и внимательно отслеживают ее развитие, чтобы вовремя предложить рынку соответствующие решения.

Серверы NetApp серии FAS в общем случае — это монтируемые в стойку устройства, включающие до двух головных модулей со специализированными материнскими платами на базе Pentium III, с оперативной памятью емкостью до 3 Гбайт, встроенным интерфейсом Fast Ethernet и, возможно, несколькими сетевыми платами Gigabit Ethernet, ATM и т. п., а также диски, расположенные на отдельных так называемых полках.

Дублирование головных модулей и полок позволяет создавать конфигурации серверов, обладающие высокой готовностью. Кроме того, все серверы комплектуются энергонезависимой памятью, что позволяет безопасно использовать ее в качестве кэша, в том числе и при записи на дисках.

Можно ли заменить FAS-сервер собственным файл-сервером, скажем, под управлением Linux, соответствующим образом настроенной для эффективной работы в этом окружении? Если отвлечься от мультиплатформенности (мультипротокольности) и некоторых других указанных выше преимуществ рассматриваемых хранилищ данных, то формально можно дать положительный ответ. Конечно, при этом потребуется ИБП с солидным запасом батарей (плата за отсутствие NVRAM), понадобится работа специалиста (что стоит денег) и т. д.

Но есть еще одна замечательная особенность NAS-решений компании NetApp, которую нельзя получить иначе как приобретя соответствующий сервер, это поддерживаемая в Data ONTAP технология snapshoot («моментальных снимков»). Данная технология через определенные промежутки времени делает нечто типа «контрольной точки» для управляющих блоков файловой системы WAFL (см. рис.). В этот момент для получения внутренне согласованной картины файловой системы перед записью snapshot все текущие запросы на ввод/вывод будут завершены, а обработка поступающих новых запросов на ввод/вывод при этом откладывается. В случае сбоя WAFL это позволяет осуществить «откат» к ее предыдущему состоянию.

Применение моментальных снимков позволяет, в частности, производить практически мгновенное копирование файла (без физической перезаписи блоков жестких дисков), так что последующие изменения в разных копиях будут писаться в разные блоки дисков. Ясно, что технология snapshot позволяет обезопасить от логических сбоев файловую систему; защита от физических сбоев обеспечивается применением технологии RAID. Отрицательным последствием применения моментальных снимков является потеря дискового пространства (поскольку соответствующие блоки НЖМД не высвобождаются). По оценкам NetApp, дополнительные накладные расходы на дисковое пространство составляют в среднем 20%.

Применение snapshot эффективно при инкрементальном резервном копировании. Другой пример — простое и быстрое резервное копирование при работе с СУБД Oracle (типичное резервное копирование для баз данных емкостью 300 Гбайт — за несколько секунд, со временем восстановления в минутном диапазоне).

Еще один пример, уже не из области резервного копирования, эффективного использования серверов FAS — для известной технологии автономных систем FlexFrame for mySAP, в которой применяются средства виртуализации дисков компании NetApp.

Выше было упомянуто о поддержке технологии RAID на серверах NetApp. Интересно, что при этом используется очень редко применяемая разновидность — RAID4, которая в данном случае выбрана для удобства динамического расширения емкости логических дисков.

Для еще большего увеличения надежности в серверах NetApp возможно применение новой технологии RAID-DP, впервые предложенной фирмой в этом году.

В линейке серверов FAS компании NetApp имеется ряд моделей — от FAS250 до FAS960, обеспечивающих емкости дискового пространства до 24 Тбайт. Для сохранения инвестиций пользователя предусмотрена возможность модернизации этих серверов с переходом от младших моделей к старшим. Для доступа к дискам в данных серверах используются обычно каналы Fibre Channel, а к ленточным библиотекам — Fibre Chan?nel или SCSI.

SAN-решения

Важным преимуществом серверов FAS является то, что они одновременно могут использоваться и как устройства категории NAS, и как компоненты сетей хранения SAN (Storage Area Network). При этом обеспечивается возможность работы с одним LUN и через NAS, и через SAN (так называемая «архитектура унифицированной памяти»), а не более очевидное разбиение сервера на раздел для NAS и раздел для SAN, как предлагают некоторые конкуренты. Подсоединение к SAN может осуществляться как традиционным способом — через сеть на базе Fibre Channel, так и с использованием более дешевого современного стандарта iSCSI. В обоих случаях файловые системы «пользовательских» компьютеров работают с обычными SCSI-драйверами.

В случае iSCSI соответствующие данные на запрашивающем операцию ввода/вывода компьютере инкапсулируются в пакеты TCP/IP и через обычную сетевую плату (например, Gigabit Ethernet) направляются в сеть TCP/IP, к которой подключено дисковое iSCSI-устройство. Для ускорения работы можно применять, например, «спаривание» каналов Gigabit Ethernet на пути от компьютера до устройства iSCSI. Последние имеют собственные сетевые имена, кодируемые определенным образом, и возможно применение службы iSNS (Internet Storage Name Service, некий упрощенный аналог DNS). Если в соответствующем конфигурационном файле прописать iSNS-имя и IP-адрес, то компьютер в Москве может, например, обратиться к iSCSI-устройству в Мюнхене.

Имеется несколько путей усовершенствования описанной схемы. Для уменьшения дополнительной нагрузки на процессор из-за применения TCP/IP возможно использование специальных плат типа TCP/IP offload engine, которые уже не первый год доступны на рынке. Наконец, вместо всей комбинации «драйвер iSCSI плюс стек TCP/IP плюс сетевая плата» можно применять специализированные платы iSCSI (предлагаются, в частности, фирмами Adaptec и QLogic). Недостатком такого подхода является то, что эти платы пока не поддерживают jumbo frames для Gigabit Ethernet, и поэтому в один Ethernet-пакет нельзя будет упаковать сразу несколько дисковых блоков. Конечно, сам по себе iSCSI может работать с любым каналом, поддерживающим работу TCP/IP, например, с Infiniband.

В NetApp полагают, что технология iSCSI окажется в России достаточно популярной. По мнению сотрудника NetApp Манфреда Гутмана, NFS стоит применять в большинстве обычных приложений баз данных на платформе Unix/Linux, что способствует уменьшению общей стоимости владения. Технологию iSCSI хорошо использовать для Windows-приложений, когда отсутствует инфраструктура Fibre Channel. Собственно Fibre Channel применяется при работе с большими базами данных или когда продукты NetApp необходимо интегрировать в уже существующую инфраструктуру. Для увеличения производительности NAS при работе с базами данных можно использовать средства, поддерживающие RDMA. CIFS же для работы с базами данных вообще не рекомендуется.

«Моментальные снимки»

Одной из замечательных особенностей NAS-решений компании NetApp, которую нельзя получить иначе как приобретя соответствующий сервер, является поддерживаемая в Data ONTAP технология snapshoot («моментальных снимков»). К примеру файл FILE.DAT в активной файловой системе занимает три блока на диске — A, B и С, а в структуре файловой системы соответственно имеются ссылки на эти блоки файла. Во время создания моментального снимка snapshot.0 запоминаются эти ссылки. В дальнейшем может произойти модификация FILE. DAT с заменой блока С на блок С?. Тогда блок С с диска не удаляется (он считается занятым, поскольку на него имеется ссылка из snapshot.0) и последующий снимок snapshot.1 сохранит ссылки уже на блоки A, B и С?