Дисковые подсистемы RAID
Новые технологии
Особенности реализации RAID-S
Особенности реализации RAID-7
Ступени совершенства RAID

Отказоустойчивые архитектуры предназначены для обеспечения работы информационной системы с малыми затратами на сопровождение и нулевым временем простоев. Недостаточная готовность системы может обернуться для компании громадными финансовыми потерями. Поэтому при реализации жизненно важных для предприятия приложений стоит учесть, что цена простоев из-за сбоев системы вполне оправдывает вложение немалых средств в установку отказоустойчивых архитектур.

Отказоустойчивая система автоматически обнаруживает вышедшие из строя компоненты, затем очень быстро определяет причину неисправности и реконфигурирует эти компоненты.

Ключевым моментом разработки отказоустойчивой системы является обеспечение резервного дублирования (защита за счет избыточности) на базе как аппаратного, так и программного обеспечения. Избыточность реализует алгоритмы обнаружения ошибок, которые используются вместе с алгоритмами диагностики, позволяющими выявить причину ошибки.

Отказоустойчивая система должна обеспечивать переключение на альтернативное устройство в случае сбоя, а также информировать администратора о любых изменениях конфигурации так, чтобы он мог восстановить вышедшие из строя компоненты, прежде чем перестанут работать их дубликаты.

Дисковые подсистемы RAID

В 1987 году трое специалистов из университета Беркли опубликовали статью с описанием методов обеспечения отказоустойчивости с помощью массивов небольших (3,5- и 5.25-дюймовых) дисков. Эта технология получила название RAID - Redundant Array of Inexpensive Disks (избыточный массив недорогих дисков). Ниже мы рассмотрим основные характеристики шести уровней RAID.

RAID-уровни имеют различные характеристики производительности и разную стоимость. Самым быстрым является RAID 0 (метод дуплексирования), за ним идут RAID 3 или RAID 5 (в зависимости от размеров записей).

Новые технологии

Традиционные RAID-системы имеют неоспоримые преимущества, но при этом создают немало затруднений. Разные уровни RAID обеспечивают различную производительность и имеют неодинаковую стоимость, поэтому администраторам приходится искать наиболее подходящий для данной системы вариант. Сегодняшние дисковые подсистемы RAID достаточны сложны в управлении и конфигурации.

Для решения этих вопросов разрабатываются новые технологии дисковых массивов с возможностями автоматической настройки на различные уровни. Данные предложения уже не укладываются в традиционные рамки специфицированных уровней RAID.

Например, компания Hewlett-Packard разработала технологию, которая реализует избыточность, присущую традиционным RAID, и при этом ликвидирует многие их недостатки. Дисковая подсистема AutoRAID автоматически выбирает уровень RAID, соответствующий требованиям пользователей.

Ядро технологии составляет набор алгоритмов контроллера дисковой подсистемы для управления адресами блоков данных. Традиционные дисковые массивы, такие как RAID 4 или 5, используют статические, заранее определенные алгоритмы трансляции адресов блоков данных хост-компьютера в адреса их размещения на дисках. Разработчики AutoRAID отказались от подобного подхода и предпочли использовать динамические алгоритмы интеллектуального отображения любого адреса блока на хосте на любой диск массива. Данное отображение может меняться в процессе работы системы.

Динамические алгоритмы позволяют контроллеру перемещать данные, которые хранятся в дисковом массиве, куда угодно на любом диске, не оказывая никакого влияния ни на данные, ни на способ их адресации хост-компьютером. Благодаря этому новая технология делает возможным преобразование одного уровня RAID в другой. Дисковая подсистема адаптируется динамически, основываясь на имеющейся информации о различных характеристиках производительности разных уровней RAID.

Такая простота реконфигурации системы опирается на технологию динамического отображения, реализованную в AutoRAID. Каждый диск массива трактуется как последовательность блоков. При добавлении новых дисков их блоки добавляются к общему пулу доступной памяти. Алгоритмы отображения позволяют контроллеру использовать каждый блок независимо, чем способствуют достижению лучших показателей производительности, стоимости и доступности системы.

Компания EMC также предложила новую технологию дисковых массивов RAID-S, которая обеспечивает более высокую производительность и защиту данных и ликвидирует многие недостатки, свойственные традиционным RAID-системам.

RAID-S нельзя отнести к какому-либо определенному уровню RAID. Используя новые достижения в аппаратном и программном обеспечении и средствах отображения данных, EMC объединяет сильные стороны RAID 4 и 5, а также уровня RAID 6 с новыми технологиями и создает новую схему защиты данных.


Особенности реализации RAID-S

RAID-S вычисляет код коррекции ошибок, обеспечивающий избыточность, на уровне драйвера дисков, а не на уровне контроллера подсистемы. Это разгружает контроллер, освобождая его от обработки запросов ввода/вывода, и тем самым повышает производительность дисковой подсистемы.

В RAID-S данные не распределяются порциями по физическим дискам, как в традиционных реализациях RAID, а остаются нетронутыми на диске. Это дает возможность использовать существующие средства наблюдения и настройки подсистемы ввода/вывода без дополнительного обучения персонала.

Поскольку данные не распределены по дискам, даже в случае одновременного выхода из строя нескольких дисков информация на оставшихся томах группы RAID-S по-прежнему будет доступна приложениям на хост-компьютере.


Наталья Дубова - обозреватель журнала "Открытые Системы".

Особенности реализации RAID-7

Подобно разработчикам других систем, специалисты из Storage Computer стремились избавиться от классических недостатков, свойственных стандартным системам RAID, и развить функциональность этих систем. Конечно, RAID-7 не является, по существу, уровнем RAID, поскольку не предлагает новых способов организации данных. Основные изменения коснулись способов доступа к данным. Все диски, которых может быть до 48 (46 - непосредственно для данных, 1 для четности, 1 - в горячем резерве), подключены к индивидуальным каналам, что позволяет организовать асинхронный доступ к данным. Система поддерживает подключения к 12 хостам, обмен данными с которыми тоже осуществляется асинхронно. Доступом к каждому диску и операциями с каждым хостом заведует свой интеллектуальный контроллер с ассоциированным буфером. В системе имеется объединенный кэш и процессор управления доступом, работающий в системе реального времени. В случае отказа накопителей или других элементов запрос помещается в кэш, в то время как система перестраивает данные. RAID-7, конечно, поддерживает все традиционные уровни RAID, но преимущественно ориентируется на уровни 3 и 5, автоматически адаптируя способ организации хранения данных под конкретные задачи.


Ступени совершенства RAID

RAID 0 RAID 0 по существу не является отказоустойчивой системой, но способен значительно повысить производительность. В обычной системе данные последовательно записываются на диск, пока не будет исчерпан его объем. RAID 0 распределяет данные по дискам массива следующим образом. Если, например, используются четыре диска, то данные записываются на первую дорожку первого диска, затем на первую дорожку второго диска, первую дорожку третьего и первую дорожку четвертого. Затем данные записываются на вторую дорожку первого диска и т. д. Такое распределение данных позволяет одновременно читать и записывать данные на четырех дисках и тем самым увеличивает производительность системы. С другой стороны, если один из дисков выйдет из строя, восстанавливать данные придется тоже на всех четырех дисках.

Picture

Схема RAID 0.

RAID 1 RAID 1 реализует метод зазеркаливания/дуплексирования данных, создавая для каждого диска массива вторую копию данных на отдельном диске. Дуплексирование помимо данных на диске дублирует также адаптерную плату и кабель, обеспечивая еще большую избыточность. Метод хранения двух копий данных - надежный способ реализации отказоустойчивой дисковой подсистемы, и он нашел широкое применение в современных архитектурах.

Picture

Схема RAID 1.

RAID 2 RAID 2 распределяет данные на дисках массива побитно: первый бит записывается на первом диске, второй бит - на втором диске и т. д. Избыточность обеспечивается за счет нескольких дополнительных дисков, куда записывается код коррекции ошибок. Эта реализация дороже, поскольку требует больших накладных расходов: массив с числом основных дисков от 16 до 32 должен иметь три дополнительных диска для хранения кода коррекции. RAID 2 обеспечивает высокую производительность и надежность, но его применение ограничено главным образом рынком компьютеров для научных исследований из-за высоких требований к минимальному объему дискового пространства. В сетевых файловых серверах этот метод в настоящее время не используется.

RAID 3 RAID 3 распределяет данные на дисках массива побайтно: первый байт записывается на первом диске, второй байт - на втором диске и т. д. Избыточность обеспечивает один дополнительный диск, куда записывается сумма данных по модулю 2 (XOR) для каждого из основных дисков. Таким образом, RAID 3 разбивает записи файлов данных, храня их одновременно на нескольких дисках и обеспечивая очень быстрые чтение и запись. XOR-сегменты на дополнительном диске позволяют обнаружить любую неисправность дисковой подсистемы, а специальное ПО определит, какой из дисководов массива вышел из строя. Использование побайтного распределения данных позволяет выполнять одновременное чтение или запись данных с нескольких дисков для файлов с очень длинными записями. В каждый момент времени может выполняться только одна операция чтения или записи.

Picture

Схема RAID 2/3/4.

RAID 4 RAID 4 аналогичен RAID 3, за тем исключением, что данные распределяются на дисках по блокам. Для хранения XOR-сегментов также используется один дополнительный диск. Эта реализация удобна для файлов с очень короткими записями и большей частотой операций чтения по сравнению с операциями записи, поскольку в этом случае при подходящем размере блоков на диске возможно одновременное выполнение нескольких операций чтения. Однако по-прежнему допустима только одна операция записи в момент времени, так как все операции записи используют один и тот же дополнительный диск для вычисления контрольной суммы.

RAID 5 RAID 5, как и RAID 4, использует поблоковое распределение данных, но XOR-сегменты распределены по всем дискам массива. Это позволяет выполнять несколько операций записи одновременно. RAID 5 также удобен для файлов с короткими записями.

Picture

Схема RAID 5.