Разберем RAID «по косточкам» | Computerworld Россия | Издательство «Открытые системы»

использовали самые разные технологии - от устройств хранения прямого доступа (их еще называли «блинопечками») эпохи IBM 360 до соединенных цепочкой жестких дисков («дисковых ферм»), подключенных к персональным компьютерам, и встроенных в Novell NetWare сетевых систем с зеркальным копированием данных.

При выборе системы хранения данных всегда приходилось искать компромисс между ценой, доступностью данных и производительностью (ЦДП - cost, availability of data and performance, CAP). Технология RAID (redundant array of inexpensive disks, избыточный массив недорогих дисков) - не исключение, но она отличается от других решений своим подходом к ограничениям вечного треугольника ЦДП. RAID - не «монолитная» технология, а сочетание различных методов использования магнитных дисков для хранения данных.

В системах RAID разных уровней специфические характеристики различны. Приписанный каждому уровню цифровой индекс не является количественным показателем. Он используется лишь для описания конкретной конфигурации; то есть RAID уровня 5, например, не обязательно в пять раз «лучше», чем RAID уровня 1. Некоторые из уровней определяются следующим образом.

Уровень 1: зеркальное копирование данных для каждого диска.
Уровень 2: избыточность за счет использования кода Хэмминга [он обеспечивает исправление ошибки в одном бите и обнаружение ошибки в двух битах данных. - Прим. перев.].
Уровень 3: расщепление (stripping) данных на массиве дисков с выделением одного диска на весь набор для контроля четности.
Уровень 4: аналогичен RAID 4, но данные распределяются на дисках не по байтам, а блоками.
Уровень 5: распределение данных в последовательные блоки по всем дискам массива, данные контроля четности также распределяются по всем дискам.
Уровень 6: подобен уровню 5, но с двойным контролем четности.

RAID уровня 0 (который специалисты не признают истинным RAID) использует метод расщепления. Сначала данные расщепляются на блоки, которые затем подорожечно записываются на каждый диск массива (сначала на первую дорожку первого диска, затем на первую дорожку второго диска и так далее).

Такой способ обеспечивает превосходную скорость выполнения операций ввода/вывода, но вовсе не приводит к избыточности данных. Чтобы восстановить данные, система должна быть способна последовательно считывать все диски, на которые была произведена запись. Если при считывании произойдет сбой, то данные будут безвозвратно испорчены.

В массивах RAID уровня 1 применяется диаметрально противоположный подход, называемый зеркальным копированием (mirroring). Копия данных, записанных на один диск массива, заносится одновременно и на второй диск массива, благодаря чему достигается избыточность данных и, следовательно, их высокая надежность. Доступ к дискам массива может происходить через параллельные интерфейсы для повышения скорости передачи данных. Таким образом, ровно половина жестких дисков в массиве используется для обеспечения избыточности.

RAID уровня 4 обеспечивает целостность данных за счет того, что сумма данных по модулю 2 (данные контроля четности, или XOR) записывается на один, специально выделенный жесткий диск массива. Очевидно, это вызывает образование «заторов», поэтому обычно приходится использовать средства ускорения передачи данных. При таком способе независимый доступ к дискам способствует повышению скорости обработки транзакций. Производительность операций чтения значительно выше, чем производительность операций записи.

RAID уровня 5, так же как и RAID 4, осуществляет независимый доступ к дискам, но данные контроля четности распределяются по всем дискам. Расчет делается на то, что такое «расщепление» повышает производительность, так как позволяет избежать заторов, свойственных записи контрольных сумм на один диск массива. Обычно 80% пространства каждого диска используется для данных, а 20% - для контрольных сумм.

RAID 10 (совокупность уровней 1 и 0) - это комбинированный способ, при котором данные «расщепляются» и зеркально копируются без вычисления контрольных сумм. Обычно две пары «зеркалированных» массивов объединяются и образуют один массив RAID 0. Этот способ целесообразно применять при работе с большими файлами.

Некоторые системы RAID могут «на ходу» изменять свою конфигурацию. Например, система AutoRAID компании Hewlett-Packard способна анализировать рабочую нагрузку и выбирать такой уровень, который обеспечит наивысшую производительность операций считывания/записи. Однако в большинстве систем предусмотрен только один, неизменный вариант конфигурации.

В новых продуктах в основном применяется технология RAID 5. Недавно корпорация IBM выпустила на рынок дисковую подсистему 7133 для платформ Unix и Windows NT, в которой используется конфигурация RAID 5. В этой подсистеме классическая шина доступа SCSI модифицирована в кольцо - такой подход гарантирует, что отказ одного кабеля не приведет к потере данных.

Однако системы RAID 5 еще не очень распространены на рынке, в основном из-за того, что для вычисления контрольной суммы необходимы дополнительные ресурсы. Но в последнее время, когда тактовая частота микропроцессоров измеряется уже сотнями мегагерц, эта проблема начинает терять свою остроту.

Между тем произошедшее за последние годы резкое увеличение производительности микропроцессоров выявило другое «узкое место». Оказывается, дело в шине передачи данных между центральным процессором и устройством хранения. Лежащей в основе этой шины архитектуре SCSI, которая передает команды управления диском и данные, уже 15 лет.

Конфигурация RAID 5 специальным образом не оптимизирована для передачи данных, однако новейшие стандарты SCSI 2 (Fast) и SCSI 3 (Ultra Fast) повышают скорость передачи. Архитектура SCSI позволяет подключать жесткие диски цепочкой к одной логической шине, но в большинстве случаев при построении конфигурации RAID этот способ стараются не применять из-за того, что такая топология не обеспечивает необходимой устойчивости. Действительно, при отказе одного диска станут недоступными все диски в цепочке.

Учитывая такие особенности SCSI, некоторые создатели систем хранения попытались повысить скорость работы канала передачи данных между процессором и дисковой подсистемой. Одна из таких попыток привела к появлению технологии Fibre Channel Arbitrated Loop (FC-AL).

Число сторонников технологии FC-AL непрерывно растет. Ее поддерживают такие серьезные игроки на рынке устройств хранения, как HP, Sun Microsystems, Quantum, Silicon Graphics и Unisys. В отличие от SCSI, имеющей пропускную способность 20 Мбит/с, эта шина обеспечивает передачу данных со скоростью 100 Мбит/с в полнодуплексном режиме. В системах FC-AL для управления устройствами обычно используется набор команд SCSI 3 (для достижения обратной совместимости), но на скоростях более высоких, чем у решений SCSI на медном проводе. Технология FC-AL также способна при использовании надлежащих адаптеров обрабатывать другие широко распространенные протоколы передачи данных, такие как TCP/IP, FDDI и ATM.

Системы RAID состоят не только из аппаратных компонентов. В них обычно используется программное обеспечение, не являющееся частью операционной системы. Это скорее промежуточное ПО, которое создает необходимую устойчивость работы, например, выбор альтернативного пути передачи данных и принятие решений в случае отказа управляющего компьютера. Это ПО позволяет добиться высокой степени доступности данных, так как обнаруживает сбои и предпринимает соответствующие меры для обеспечения целостности потока данных (обычно кэшируя данные на избыточный диск, изменив путь прохождения данных на управляющий компьютер или полностью переключившись на другой компьютер).

Оно также способно начать процесс восстановления данных после того, как произойдет сбой. В число производителей ПО для RAID входят такие компании, как CLAM Associates, Veritas Software и Conley. Некоторые производители дисковых массивов, например Hitachi, разработали собственное ПО, оптимизированное для контроллеров, используемых в выпускаемых ими продуктах хранения.

Другой особенностью большинства RAID-систем является возможность «горячей» замены диска: жесткий диск, используемый в массиве, можно изъять без останова работы всего массива. «Горячая» замена возможна только в тех RAID-системах, которые обеспечивают избыточность. Так, в системе RAID 0 «горячая» замена невозможна. Учтите это, выбирая нужный вам уровень системы RAID.

Быть может, будущие массивы RAID будут похожи на последнее творение компании Storage Computer. Она разработала систему по названием RAID 7. Этот массив обеспечивает очень высокую производительность благодаря мощным распараллеленным вычислениям, высокоскоростному центральному процессору, операционной системе реального времени, «усовершенствованным» методам и алгоритмам кэширования, схемам минимизации задержек при записи данных контроля четности, уникальной технологии управления памятью и асинхронной архитектуре. Специалисты компании Storage Computer утверждают, что они используют некое ноу-хау, описание которого отсутствует в патентах, полученных ими на RAID 7. Другими словами, для исключения «узких мест» в тракте ввода/вывода компания Storage Computer, похоже, постаралась «подкрутить» чуть ли не все элементы системы RAID.

Нет сомнений в том, что у будущих систем RAID, производимых другими поставщиками, также повысится скорость, может, даже за счет использования некоторых или всех вышеперечисленных методов.

Ларри Лоэб - нештатный автор Solutions Integrator, работающий в компании New Haven. Ему можно написать по адресу larryloeb@prodigy.net.

Администратору, обдумывающему житье

Предлагаемая шпаргалка поможет выбрать уровень массивов RAID в соответствии с конкретными требованиями. Обычно системы RAID классифицируют по уровням, обозначающим конкретную технологию, которая используется для обеспечения избыточности и доступности данных, хранимых на жестких дисках. Но Консультативный совет по RAID предложил альтернативную схему классификации, основанную не на разновидностях технологии, а на ее функциональных возможностях. В предложенной системе классификации дисковых массивов за основу взяты признаки, обозначающие способность конкретного решения восстанавливать данные.

Самым главным критерием является устойчивость дисковой системы к сбоям (FRDS - failure-resistant disk system), которая характеризуется следующими признаками:

предотвращение потери данных и потери доступа к данным из-за отказа жесткого диска;
восстановление содержимого отказавшего диска на диск замены;
предотвращение потери данных из-за «пробела при записи»;
предотвращение потери данных из-за отказа управляющего компьютера или шины ввода/вывода;
предотвращение потери данных из-за отказа одного из компонентов;
мониторинг блоков, заменяемых на месте эксплуатации, и индикация отказов.

В соответствии с предложенной схемой классификации дисковых массивов следующим шагом для обеспечения надежности является устойчивость дисковой системы к отказам (FTDS - fault-tolerant disk system). Она аналогична FRDS, но здесь дополнительно учитываются следующие признаки:

возможность «горячей» замены дисков;
предотвращение потери данных из-за отказа кэша;
предотвращение потери данных из-за пропадания внешнего электропитания;
предотвращение потери данных из-за выхода значения температуры за пределы допустимого рабочего диапазона;
выдача предупреждения об отказе компонента и отклонении параметров окружающей среды;
предотвращение потери доступа
к данным из-за отказа канала устройства;
предотвращение потери доступа к данным из-за отказа контроллера;
предотвращение потери доступа к данным из-за отказа кэша;
предотвращение потери доступа к данным из-за отказа блока питания.

Наивысшим уровнем в классификации считается устойчивость дисковой системы к авариям. На этом уровне выделяются следующие признаки:

предотвращение потери доступа к данным из-за отказов управляющего компьютера или его шины ввода/вывода;
предотвращение потери доступа к данным из-за пропадания внешнего электропитания;
предотвращение потери доступа к данным в результате замены блоков на месте эксплуатации;
«горячая» замена диска;
предотвращение потери доступа к данным из-за отказа зоны на диске.

RAID для сетей intranet

Если вашему заказчику для его системы хранения информации в корпоративной intranet-сети потребуется высокий коэффициент доступности данных и их избыточность, то сразу ли придет вам в голову использовать RAID?

Когда крупная финансовая компания захотела создать сеть intranet для улучшения связи со своими филиалами, рассредоточенными по всей территории США, то в качестве одного из главных требований она указала высокую степень доступности данных и их целостность.

Вот почему компания-интегратор IwayPC, получившая контракт на создание сети intranet на базе СУБД Microsoft SQL Server, для организации непрерывно доступной системы хранения данных выбрала массивы RAID 1 и RAID 5.

«Нам нужно было обеспечить хранение и обработку огромных объемов данных, - объясняет Рич Нэссер, глава IwayPC. - Выбрав технологию RAID, мы добились отказоустойчивости. Это решение позволило заказчику сэкономить немало средств, чего нельзя было достичь при использовании нескольких резервных серверов данных».

По словам Нэссера, компания IwayPC наверняка смогла бы установить SQL-серверы для хранения резервных копий данных, чтобы удовлетворить требования заказчика по отказоустойчивости, но каждый дополнительный сервер обошелся бы в десятки тысяч долларов. «Неразумно покупать такое дорогое оборудование, которое только занимало бы место и собирало пыль», - говорит он.

Поскольку у заказчика уже имелись компьютерные системы, использующие RAID 1, необходимо было обеспечить их интеграцию. Специалисты IwayPC применили системы конфигураций RAID 1 и RAID 5, причем последняя лучше подошла для нужд заказчиков в плане ввода/вывода данных из SQL Server, так как обеспечивает более высокую скорость записи информации на жесткие диски.

Использование RAID 5 для SQL Server обеспечило еще одно, хоть и менее очевидное преимущество. SQL Server требует ведения так называемого файла регистрации. Когда для хранения файлов данных используется только один диск, производительность можно повысить, ведя этот файл на другом физическом диске.

Однако часто бывает так, что код драйвера диска, на котором хранятся данные, отличается от кода драйвера диска, на который записывается файл регистрации. Это может снизить общую производительность. RAID-решение, предложенное компанией IwayPC, позволило заказчику избежать этой проблемы.

«Так как RAID 5 производит запись несколько быстрее, мы смогли поместить файл данных и файл регистрации в одну и ту же дисковую систему, - поясняет Нэссер. - Наш опыт показывает, что добавление отдельного дискового контроллера для каждого из жестких дисков массива значительно уменьшает 'заторы' при записи данных».

Курс на NT

Прогнозируемое расширение рынка дисковых подсистем производит сильное впечатление даже в условиях быстро развивающейся компьютерной отрасли. International Data Corp. в своем отчете «Прогноз роста продаж дисковых подсистем и обзор мирового рынка» сообщает, что во всем мире в прошлом году было продано жестких дисков и дисковых систем на сумму 24 млрд. долл.

В отчете IDC говорится, что самый большой сегмент рынка занимают системы хранения для Unix, второе место отводится дисковым массивам для сетевых операционных систем, и третье - Windows NT. Давая прогноз на период до 2001 года, IDC считает, что рынок многопользовательских систем хранения будет расти ежегодно на 9,3% и достигнет 36 млрд. долл. Наибольший рост придется на системы на основе Unix и Windows NT, которые завоюют более 73% рынка.