Варианты конфигурации дисковых подсистем серверов многообразны, и, как следствие, неизбежна путаница. Чтобы помочь вам разобраться в этом непростом вопросе, мы решили рассмотреть основные технологии и экономическую оправданность их применения.


ДИСКОВЫЕ ИНТЕРФЕЙСЫ
КАК РАБОТАЕТ SCSI
IDE
ИЗБЫТОЧНЫЕ ДИСКОВЫЕ СИСТЕМЫ
ЗЕРКАЛИРОВАНИЕ, ДУБЛИРОВАНИЕ И ЗАПОЛНЕНИЕ
ЗАКЛЮЧЕНИЕ

ЗНАКОМСТВО С ФУНКЦИЯМИ ДИСКОВЫХ ПОДСИСТЕМ
"Горячие" функции дисковых подсистем


В случае дисковых подсистем серверов вы имеете выбор из множества вариантов, но изобилие затрудняет нахождение той системы, которая будет в вашем случае лучшей. Ситуация осложняется тем, что в процессе выбора придется разбираться в немалом объеме ложной информации и маркетинговой шумихи.

Понять суть этого вопроса должен помочь предлагаемый нами обзор основных технологий дисковых подсистем серверов и обсуждение целесообразности их применения с точки зрения стоимости, производительности, надежности и отказоустойчивости.

ДИСКОВЫЕ ИНТЕРФЕЙСЫ

Определяете ли вы спецификацию нового сервера или же модернизируете существующий, дисковый интерфейс является важнейшим вопросом. Большинство сегодняшних дисков используют интерфейсы SCSI или IDE. Мы рассмотрим обе технологии, опишем их реализации, обсудим их работу.

SCSI - это стандартизованный ANSI интерфейс, имеющий несколько вариаций. Первоначальная спецификация SCSI, именуемая теперь SCSI-I, использует 8-разрядный канал данных при максимальной скорости передачи данных 5 Мбит/с. SCSI-2 допускает несколько вариаций, в том числе Fast SCSI с 8-разрядным каналом данных и скоростью передачи до 10 Мбит/с; Wide SCSI с 16-разрядным каналом данных и скоростью передачи до 10 Мбит/с; и Fast/Wide SCSI с 16-разрядным каналом данных и скоростью передачи до 10 Мбит/с (см. Таблицу 1).

ТАБЛИЦА 1 - ВАРИАНТЫ SCSI

SCSI-1
Максимальная производительность
Ширина канала
Частота
Число устройств*
5 Мбит/с
8 разрядов
5 МГц
8
SCSI-2
Fast SCSI
10 Мбит/с
8 разрядов
10 МГц
8
Fast/Wide SCSI
20 Мбит/с
16 разрядов
10 МГц
8; 16**
* в число поддерживаемых устройств входит HBA
** с несимметричным выходным сигналом; дифференциальный

С появлением "широкого" 16-разрядного Fast/Wide SCSI 8-разрядные версии стали иногда называть "узкими" - Narrow SCSI. Недавно появилось еще несколько реализаций SCSI: Ultra SCSI, Wide Ultra SCSI и SCSI-3. В сравнении с более распространенными вариантами эти интерфейсы имеют некоторое преимущество в производительности, но, поскольку они распространены еще не очень широко (число использующих данные интерфейсы устройств весьма ограничено), мы не будем обсуждать их в нашей статье.

Кабельная система SCSI-I - это линейная шина с возможностью подключения до восьми устройств, включая главный адаптер шины (host bus adapter, HBA). Такой дизайн шины называется SCSI c несимметричным выходным сигналом (single-ended SCSI), при этом длина шлейфа может достигать девяти метров. SCSI-2 (практически вытеснивший SCSI-I) поддерживает и SCSI c несимметричным выходным сигналом, и дифференциальный SCSI. Дифференциальный SCSI использует иной, нежели SCSI c несимметричным выходом, метод сигнализации и поддерживает до 16 устройств на шлейфе длиной до 25 метров. Он обеспечивает лучшее подавление шума, что во многих случаях означает лучшую производительность.

Одна из проблем с дифференциальным SCSI заключается в совместимости устройств. Например, сегодня количество разновидностей совместимых с дифференциальным SCSI накопителей на магнитной ленте и приводов CD-ROM ограничено. Дифференциальные устройства и HBA обычно немного дороже устройств с несимметричным выходным сигналом, но их преимущество в том, что они поддерживают большее число устройств на канал, имеют более длинный шлейф и, в некоторых случаях, обладают лучшей производительностью.

Выбирая устройства SCSI, вы должны знать о проблемах совместимости. SCSI c несимметричным выходным сигналом и дифференциальный SCSI могут использовать одну и ту же проводку, но сочетать устройства с несимметричным выходным сигналом и дифференциальные устройства нельзя. Wide SCSI применяет отличную от Narrow SCSI кабельную систему, так что использовать на одном и том же канале устройства Wide SCSI и Narrow SCSI невозможно.

КАК РАБОТАЕТ SCSI

В SCSI контроллер устройства (например контроллер диска) и интерфейс с компьютером - устройства разные. Интерфейс с компьютером, HBA, добавляет к компьютеру дополнительную интерфейсную шину для подсоединения нескольких контроллеров устройств: до семи контроллеров устройств на канале SCSI c несимметричным выходным сигналом и до 15 на дифференциальном канале. Технически каждый контроллер может поддерживать до четырех устройств. Однако при высоких скоростях обмена сегодняшних высокоемких дисков контроллер устройства обычно встраивается в диск с целью уменьшения помех и электрических наводок. Это значит, что вы можете иметь до семи дисков на канале SCSI с несимметричным выходным сигналом и до 15 на дифференциальном канале SCSI.

Одно из преимуществ SCSI - обработка нескольких, накладывающихся друг на друга команд. Эта поддержка перекрывающегося ввода/вывода дает дискам SCSI возможность полностью сочетать свои операции чтения и записи с другими дисками системы, благодаря чему разные диски могут обрабатывать команды параллельно, а не по очереди.

Поскольку вся интеллектуальность дискового интерфейса SCSI заключается в HBA, HBA контролирует доступ ОС к дискам. Как результат, HBA, а не компьютер, разрешает конфликты трансляции и доступа к устройствам. В целом это значит, что при условии использования правильно написанных и установленных драйверов компьютер и ОС не видят никакой разницы между устройствами.

Вдобавок, поскольку HBA контролирует доступ между внутренней шиной расширения компьютера и шиной SCSI, он может разрешать конфликты доступа к ним обеим с предоставлением таких расширенных возможностей, как сервис обрыва/восстановления связи. Обрыв/восстановление позволяют ОС послать конкретному устройству команду на поиск, чтение или запись, после чего диск предоставляется самому себе для выполнения команды, благодаря чему другой диск на том же канале может тем временем получить команду. Этот процесс способствует значительному повышению пропускной способности дисковых каналов с более чем двумя дисками, особенно когда данные разнесены или разбросаны по дискам. Другая расширенная функция - синхронный обмен данными, вследствие чего общая пропускная способность дискового канала и целостность данных увеличиваются.

IDE

IDE - фактический стандарт, широко используемый в ПК на базе процессоров х86. Это лишь общая рекомендация для производителей, поэтому каждый мог свободно разрабатывать специфический интерфейс IDE для своих устройств и адаптеров. В итоге продукты от разных производителей, и даже разные модели одного и того же производителя, оказывались несовместимы друг с другом. Когда спецификация устоялась, данная проблема практически исчезла, но несовместимость все же возможна.

В отличие от SCSI, IDE, возлагает выполнение интеллектуальных функций на диск, а не HBA. HBA для IDE практически не обладает интеллектуальностью и просто напрямую выводит шину компьютера к дискам. Без промежуточного интерфейса число устройств на одном канале IDE ограничивается двумя, а длина кабеля тремя метрами.

Поскольку весь интеллект устройств IDE находится на самих устройствах, одно из устройств на канале назначается главным (channel master), а встроенный контроллер на втором отключается, и оно становится подчиненным (chanell slave). Главное устройство контролирует доступ через канал IDE к обоим устройствам и выполняет для них все операции ввода/вывода. Это одна из возможностей конфликта между устройствами из-за различных реализаций производителями интерфейса IDE. Например, один диск может быть рассчитан на работу с конкретной схемой контроллера, а главное устройство, к которому он подключен, может использовать другой тип контроллера. Вдобавок диски более нового расширенного стандарта Enhanced IDE (EIDE) применяют расширенный набор команд и трансляционных таблиц в целях поддержки дисков большей емкости и большей производительности. Если они подсоединены к старому стандартному, главному диску IDE, они не только теряют свои расширенные функции, но и могут не предоставить вам всю свою доступную емкость. Хуже того, они могут сообщать ОС о своей полной емкости, будучи не в состоянии ее использовать, что чревато повреждением информации на диске.

Возможность повреждения данных обусловлена тем, что каждая ОС по-своему воспринимает информацию о конфигурации диска. Например, DOS и системный BIOS допускают максимальную емкость диска только 528 Мбайт. NetWare и другие 32-х разрядные системы не имеют этих ограничений и способны читать весь диск IDE напрямую через его электронику. Когда вы создаете на одном диске несколько разделов различных ОС, каждая из них видит емкость и конфигурацию по-своему, а это может привести к перекрытию таблиц разделов, что, в свою очередь, существенно повышает риск потери данных на диске.

Оригинальная архитектура IDE не позволяет распознавать диски больше 528 Мбайт и может поддерживать только два устройства на канал при максимальной скорости передачи 3 Мбит/с. Для преодоления некоторых ограничений IDE в 1994 году была представлена архитектура EIDE. EIDE поддерживает большую емкость и производительность, однако ее скорости передачи от 9 до 16 Мбит/с по-прежнему медленнее скорости передачи SCSI. Кроме того, в отличие от 15 устройств на канал для SCSI, она может поддерживать максимум четыре на канал. Отметим также, что ни IDE, ни EIDE не реализуют функций многозадачности. И следовательно, не могут обеспечить в типичном серверном окружении тот же уровень производительности, что и интерфейсы SCSI.

Хотя стандарт IDE разрабатывался исходно для дисков, сейчас он поддерживает ленточные устройства и CD-ROM. Однако разделение канала с CD-ROM или ленточным устройством может отрицательно сказаться на производительности диска. В целом преимущества SCSI в производительности и расширяемости делают его в сравнении с IDE или EIDE более предпочтительным для большинства серверных приложений старшего класса, где требуется высокая производительность. Однако для приложений начального уровня, где производительность или расширяемость не играют большой роли, хватит IDE или EIDE. В то же время, если вам требуется избыточность дисков, то IDE из-за потенциальных проблем, связанных с подходом master-slave, не лучший вариант. Кроме того, следует опасаться возможного перекрытия таблиц разделов и проблем несовместимости устройств master-slave.

Тем не менее есть несколько случаев, когда интерфейсы IDE и EIDE могут быть использованы в серверах старшего класса. Обычной практикой является, например, использование небольшого диска IDE для раздела DOS на серверах NetWare. Широко практикуется также применение приводов CD-ROM с интерфейсом IDE для загрузки ПО.

ИЗБЫТОЧНЫЕ ДИСКОВЫЕ СИСТЕМЫ

Еще один важный для обсуждения вопрос при определении спецификации сервера - избыточность. Есть несколько методов повышения надежности дисковой системы из нескольких дисков. Большинство этих схем избыточности - вариации RAID (расшифровывается как "избыточный массив недорогих или независимых дисков"). Оригинальная спецификация RAID была разработана для замены больших и дорогих дисков мэйнфреймов и мини-компьютеров массивами небольших и дешевых дисков, предназначенных для мини-компьютеров, - отсюда слово "недорогие". К сожалению, в системах RAID редко встречается что-нибудь недорогое.

RAID - это серия реализаций избыточных дисковых массивов для обеспечения различных уровней защиты и скорости передачи данных. Поскольку RAID предполагает использование дисковых массивов, лучшим интерфейсом для применения будет SCSI, поскольку он может поддерживать до 15 устройств. Уровней RAID существует 6: от нулевого до пятого. Хотя некоторые производители рекламируют свои собственные схемы избыточности, которые они называют RAID-6, RAID-7 или выше. (RAID-2 и RAID-4 нет в сетевых серверах, поэтому мы о них говорить не будем.)

Из всех уровней RAID нулевой имеет наибольшую производительность и наименьшую защищенность. Он предполагает наличие как минимум двух устройств и синхронизированную запись данных на оба диска, при этом диски выглядят как одно физическое устройство. Процесс записи данных на несколько дисков называется заполнением дисков (drive spanning), а собственно метод записи этих данных - их чередованием (data striping). При чередовании данные пишутся на всех дисках поблочно; этот процесс именуется расслоением блоков (block interleaving). Размер блока определяется операционной системой, но обычно он варьируется в пределах от 2 Кбайт до 64 Кбайт. В зависимости от конструкции дискового контроллера и HBA, эти последовательные операции записи могут перекрываться, в результате чего производительность возрастает. Так, сам по себе RAID-0 может повысить производительность, но не обеспечить защиты от сбоев. Если случается сбой диска, то вся подсистема выходит из строя, что, как правило, приводит к полной потере данных.

Вариантом чередования данных является распределение данных (data scattering). Как и при чередовании, данные записываются последовательно на несколько заполняемых дисков. Однако в отличие от чередования запись не обязательно производится на все диски; если диск занят или полон, данные могут быть записаны на следующем доступном диске - это позволяет добавлять диски к существующему тому. Как и стандарт RAID-0, комбинация заполнения дисков с распределением данных повышает производительность и увеличивает объем тома, но не обеспечивает защиты от сбоев.

RAID-1, известный как зеркалирование диска (disk mirroring), предполагает установку пар одинаковых дисков, причем каждый диск в паре является зеркальным отображением другого. В RAID-1 данные пишутся на две идентичных или почти идентичных пары дисков: когда, например, один диск портится, система продолжает работать с зеркальным диском. Если зеркальные диски имеют общий HBA, то производительность данной конфигурации, по сравнению с однодисковой, будет меньше, поскольку данные должны записываться последовательно на каждый диск.

Novell сузила определение зеркалирования и добавила понятие дублирования (duplexing). Согласно терминологии Novell, зеркалирование относится к парам дисков, когда они подсоединены к серверу или компьютеру через один HBA, в то время как дублирование подразумевает, что зеркальные пары дисков подсоединены через раздельные HBA. Дублирование обеспечивает избыточность всего дискового канала, включая HBA, кабели и диски, и позволяет несколько повысить производительность.

RAID-3 требует как минимум трех одинаковых дисков. Часто это называется технологией "n минус 1" (n-1), поскольку максимальная емкость системы задается, как все количество дисков в массиве (n) минус один диск для контроля четности. RAID-3 использует метод записи, именуемый расслоением битов (bit interleaving), когда данные пишутся на все диски побитово. Для каждого записанного на n-дисках байта на "диск четности" пишется бит четности. Это исключительно медленный процесс, поскольку перед тем, как информация о четности сможет быть сгенерирована и записана на "диск четности", данные должны быть записаны на каждый из n-дисков массива. Вы можете увеличить производительность RAID-3 путем синхронизации механизмов вращения дисков, так чтобы они работали строго "в ногу". Однако из-за ограничений по производительности использование RAID-3 резко снизилось, и сегодня продается очень немного продуктов для серверов, основанных на RAID-3.

RAID-5 - самая популярная на рынке сетевых серверов реализация RAID. Как и RAID-3, она требует, как минимум, трех одинаковых дисков. Однако, в отличие от RAID-3, RAID-5 производит чередование блоков данных без применения выделенного диска для четности. И данные, и контрольная сумма записываются по всему массиву. Этот метод допускает независимое чтение и запись на диск, а также позволяет операционной системе или контроллеру RAID проводить несколько параллельных операций ввода/вывода.

В конфигурациях RAID-5 обращение к диску происходит только тогда, когда с него считывается/записывается информация о четности или данные. Как следствие, RAID-5 имеет более высокую, чем RAID-3, производительность. На практике производительность RAID-5 может иногда достигать или даже превосходить производительность однодисковых систем. Такое повышение производительности, разумеется, зависит от многих факторов, в том числе и от того, как реализован массив RAID и какие собственные возможности есть у операционной системы сервера. RAID-5 обеспечивает также высочайший среди всех стандартных реализаций RAID уровень целостности данных, поскольку и данные, и информация о четности записаны с чередованием. Поскольку RAID-5 использует расслоение блоков, а не битов, синхронизация вращения не дает никаких преимуществ в производительности.

Некоторые производители добавили расширения к своим системам RAID-5. Одно из таких расширений - наличие встроенного в массив диска "горячего резерва" (hot-spare). Если случается сбой диска, то диск из горячего резерва немедленно заменяет аварийный диск и копирует на себя данные путем их восстановления по четности в фоновом режиме. Однако помните то, что восстановление диска RAID-5 оборачивается серьезным падением производительности сервера. (Более подробную информацию о дисках с "горячей заменой" и "горячим резервированием" см. во врезке "Горячие" функции дисков".)

Системы RAID могут быть организованы как при помощи загруженного на сервере и использующего для работы его процессор ПО, так и при помощи специализированного контроллера RAID.

Программно-реализованные системы RAID отнимают значительную часть ресурсов системного процессора, равно как и системной памяти, что сильно понижает производительность сервера. Программные системы RAID иногда включаются в виде функции операционной системы (как это сделано в Microsoft Windows NT Server) или дополнения от третьих поставщиков (как это сделано в NetWare и операционной системе Macintosh).

Аппаратно-реализованные системы RAID используют выделенный контроллер массива RAID; обычно он имеет свой собственный процессор, кэш-память и ПО в ПЗУ - для выполнения дисковых функций ввода-вывода и проверки четности. Наличие выделенного контроллера для выполнения этих операций освобождает процессор сервера для выполнения других функций. Кроме того, поскольку процессор и ПО адаптера специально отлажены для выполнения функций RAID, они обеспечивают большую производительность дисковых операций ввода/вывода и лучшую целостность данных, чем программно-реализованные системы RAID. К сожалению, аппаратно-реализованные контроллеры массивов RAID, как правило, дороже своих программно-реализованных конкурентов.

ЗЕРКАЛИРОВАНИЕ, ДУБЛИРОВАНИЕ И ЗАПОЛНЕНИЕ

Некоторые ОС, включая NetWare и Windows NT Server, позволяют осуществлять зеркалирование дисков на нескольких дисковых каналах, обеспечивая таким образом дополнительный уровень избыточности. Как упоминалось ранее, Novell называет последний подход дублированием дисков. В сочетании с заполнением дисков дублирование может обеспечить большую по сравнению с однодисковыми системами производительность и в целом способно обогнать аппаратные реализации RAID-5. Поскольку каждая половина зеркальной пары дисков использует отдельный дисковый канал, запись на диски, в отличие от случая, когда диски находятся на одном и том же HBA, может производиться одновременно. Также дублирование допускает раздельный поиск - процесс разделения запросов на чтение между дисковыми каналами для более быстрого их выполнения. Эта функция вдвое повышает производительность при чтении дисков, поскольку оба канала параллельно ищут различные блоки из одного набора данных. Это также сокращает влияние на производительность при записи на диск, поскольку один канал может читать данные, в то время как второй производить запись.

NetWare поддерживает до восьми дисковых каналов (некоторые адаптеры SCSI предоставляют несколько каналов), что означает, что вы можете иметь несколько каналов для каждой дублированной пары. Вы можете даже по выбору организовать до восьми отдельных зеркальных каналов. Windows NT Server также предоставляет программные зеркалирование и дублирование, но пока не поддерживает параллельную запись и раздельный поиск.

Выбирая избыточную дисковую систему, вы должны учитывать четыре основных фактора: производительность, стоимость, надежность и защиту от сбоев.

Что касается производительности, встроенные возможности серверной операционной системы являются основным фактором, особенно когда в игру вступает избыточность дисков. Как уже указывалось ранее, дублирование дисков NetWare в сочетании с заполнением дисков дает лучшую производительность, чем аппаратно- или программно-реализованный RAID. Однако производительность аппаратного RAID в целом выше производительности встроенных дисковых служб Windows NT Server. Вообще говоря, в течение нескольких лет технология и производительность систем RAID постоянно улучшаются.

Другая потенциальная проблема производительности систем RAID - это восстановление данных в случае аварии. До недавних пор, если диск ломался, вам приходилось отключать массив RAID для его реставрации. Также, если вы хотели изменить размер массива (увеличить или уменьшить его емкость), надо было сделать полную резервную копию системы, а затем переконфигурировать и переинициализировать массив, стирая во время этого процесса все данные. В обоих случаях система довольно долго оказывается недоступна.

Для решения данной проблемы Compaq разработала контроллер Smart Array-II, позволяющий наращивать емкость массива без переинициализации существующей конфигурации массива. Другие производители, в том числе Distributed Processing Technology (DPT), объявили, что их контроллеры в не столь отдаленном будущем будут выполнять схожие функции. Многие из новых массивов имеют утилиты для различных операционных систем, с помощью которых массив можно реставрировать после замены испорченного устройства без отключения сервера. Однако учтите, что эти утилиты съедают много ресурсов сервера и тем самым отрицательно влияют на производительность системы. Во избежание такого рода трудностей, реставрацию системы следует проводить в нерабочие часы.

В отраслевых изданиях и публикациях производителей RAID неоднократно поднимались дискуссии на тему разницы в стоимости зеркалирования, дублирования и реализаций RAID. Зеркалирование и дублирование дают 100-процентное удвоение дисков и (в случае дублирования) HBA, в то время как реализации RAID имеют один HBA и/или контроллер RAID плюс на один диск больше, чем та емкость, которую вы хотите иметь в итоге. Согласно этим аргументам, RAID дешевле, поскольку число необходимых дисков меньше. Это может быть верно, если ограничения на производительность включенных в операционную систему программных реализаций RAID, как, например, в Windows NT, для вас терпимы. В большинстве случаев, однако, чтобы добиться соответствующей производительности, необходим выделенный контроллер RAID.

Диски и стандартные адаптеры SCSI относительно недороги, в то время как высококачественный контроллер RAID может стоить до 4500 долларов. Чтобы определить стоимость своей системы, вы должны продумать оптимальные конфигурации для всех составляющих. Например, если нужно приблизительно 16 Гбайт адресуемого дискового пространства, то можно реализовать зеркальную конфигурацию с двумя дисками по 9 Гбайт на канал и получить некоторый избыток емкости. В случае RAID-5, по соображениям производительности и надежности, лучше остановиться на пяти дисках по 4 Гбайт, чтобы увеличить число шпинделей для чередования данных и тем самым общую производительность массива.

При использовании внешней дисковой подсистемы стоимость зеркальной конфигурации составит примерно 10500 долларов за 18 Гбайт доступного пространства. Эта цифра основана на реальных розничных ценах: 2000 долларов за один диск, 250 - за один HBA и 300 - за каждую внешнюю дисковую подсистему вместе с кабелями. Система RAID-5, сконфигурированная на 16 Гбайт адресуемого пространства с использованием пяти дисков по 4 Гбайт, будет стоить около 12800 долларов. Эта цифра основана на реальных розничных ценах массива DPT RAID-5.

Многие системы RAID включают в себя "фирменные", разработанные производителем, компоненты. Как минимум, "фирменными" являются корпус и задняя панель. HBA и контроллеры RAID тоже часто бывают "фирменными". Некоторые производители применяют также нестандартные держатели и шины для дисков. Кто-то предоставляет их отдельно за разумную цену, кто-то - только вместе с диском и, как правило, по высокой цене. Последний подход может оказаться дорогостоящим, когда вам надо починить или расширить свою систему. Другой способ, которым поставщик загоняет вас в угол, - предоставление ПО администрирования и наблюдения за дисками, работающее только с конкретными компонентами. Избегая, когда это возможно, нестандартных компонентов, стоимость обычно удается снизить.

При сравнении надежности избыточных дисковых систем надо учесть два фактора: возможность сбоя системы или сбоя любого ее компонента и вероятность потери данных из-за сбоя компонентов. (К сожалению, RAID или зеркалирование не могут спасти от основной причины потери данных - ошибки пользователя!)

Вы можете рассчитать оценку вероятности сбоев, используя следующую формулу:

P = t / Tc, 

где t - время работы, а Tc - комбинированное время наработки на отказ компонентов.

При работе без сбоев в течение года (8760 часов) и Tc гипотетического диска 300000 часов, вероятность сбоя становится равной 3%, или немногим менее чем один случай из 34. По мере того как число компонентов растет, вероятность сбоя любого компонента увеличивается. Как RAID, так и зеркализация увеличивают вероятность сбоя, но уменьшают вероятность потери данных.

Таблица 2, взятая из бюллетеня Storage Dimensions под названием "Отказоустойчивые системы хранения данных для непрерывно работающих сетей", показывает рассчитанную по приведенной выше формуле вероятность сбоя, соотнесенную с вероятностью потери данных для четырех заполняемых дисков, пятидискового массива RAID и восьми зеркальных дисков. (Предполагается, что все диски имеют одинаковый размер и все три системы предоставляют одинаковую полезную емкость. Для получения бюллетеня посетите страницу Storage Dimensions: http://www.storagedimensions.com/raidwin/wp-ovrvw.html.)

ТАБЛИЦА 2 - ОЦЕНКИ ВЕРОЯТНОСТИ СБОЯ

Вероятность сбоя диска
Вероятность потери данных при сбое диска
Заполнение (4 диска)
11,68%
11,68%
RAID-5 (5 дисков)
14,60%
0,00467%
Зеркалирование или дублирование + заполнение (8 дисков)
23,36%
0,00187%

Хотя зеркалирование в сочетании с заполнением из-за увеличения количества дисков имеет большую статистическую вероятность сбоя диска, оно также имеет и значительно меньшую вероятность потери данных при сбое диска. Кроме того, при правильно спроектированной дублированной системе время восстановления может быть значительно короче.

Этот пример не учитывает многие факторы. Для получения статистически правильной цифры должно быть посчитано среднее время наработки на отказ всех компонентов дисковой системы, включая HBA, шлейфы, шнуры питания, вентиляторы и блоки питания. Разумеется, эти вычисления говорят только о том, что может случиться при данной надежности предполагаемых компонентов, но вовсе не обязательно, что это произойдет.

При выборе дисковой системы вы должны четко знать, какие компоненты не продублированы. В системах RAID это могут быть HBA, контроллеры RAID, блоки питания, кабели питания и шлейфы. Одно из преимуществ дублирования с раздельными дисковыми подсистемами на каждом канале - ликвидация большинства единичных мест, где могут произойти сбои.

ЗАКЛЮЧЕНИЕ

В целом устройства SCSI - лучший выбор для дисковой подсистемы сервера, чем диски IDE или EIDE. Приобрести диски SCSI емкостью до 9 Гбайт на диск не составляет труда, в то время как максимальная емкость сегодняшних дисков EIDE около 2,5 Гбайт. При использовании нескольких двухканальных HBA общая емкость SCSI может легко превзойти 100 Гбайт, тогда как предел EIDE - 10 Гбайт. SCSI также имеет лучшую производительность; более того, SCSI не страдает от проблем, которые влечет за собой подход master-slave в IDE/EIDE.

Если вам нужна избыточность дисков, то есть несколько вариантов. Дублирование Novell NetWare в сочетании с заполнением дисков обеспечивает как отличную производительность, так и защиту от сбоев. Аппаратная реализация RAID - тоже хороший выбор, но обычно ее производительность ниже, а цена выше. Если вы используете Windows NT и вам важна производительность, то аппаратный RAID, возможно, будет лучшим выбором.


Патрик Корриган - президент и старший консультант/аналитик консалтинговой и обучающей компании The Corrigan Group. С ним можно связаться по адресу: pcorrigan@corrigan-group.com или через Compuserve: 75170,146. Микки Эпплбаум - старший сетевой консультант в GSE Erudite Software. С ним можно связаться по адресу: mickey@erudite.com

ЗНАКОМСТВО С ФУНКЦИЯМИ ДИСКОВЫХ ПОДСИСТЕМ

"Горячие" функции дисковых подсистем

Широко используемые для описания специфических функций дисковых подсистем термины "горячая замена" (hot-swap), "горячий резерв" (hot spare) и "горячее восстановление" (hot-rebuild) понимаются зачастую неверно.

"Горячая замена" - это функция, позволяющая вам извлечь неисправный диск из дисковой подсистемы без выключения системы. Поддержка "горячей замены" - аппаратная функция вашей дисковой подсистемы, а не RAID.

В системах, допускающих "горячую замену", жесткие диски обычно монтируются на салазках, которые позволяют контактам заземления между диском и корпусом оставаться соединенными дольше, чем линии питания и контроллера. Это защищает диск от повреждения при статическом разряде или электрической дуге между контактами. Диски с "горячей заменой" могут быть использованы как в массивах RAID, так и в зеркальных дисковых системах.

"Горячее восстановление" означает возможность системы восстановить оригинальную конфигурацию дисков автоматически после замены неисправного диска.

Диски "горячего резерва" встраиваются в массив RAID и, как правило, бездействуют до тех пор, пока не понадобятся. В какой-то момент после того, как диск "горячего резерва" заменяет неисправный диск, вам надо заменить неисправный диск и восстановить конфигурацию массива.

Дисковая система с возможностью "горячей замены" и дисками "горячего резерва" не обязательно имеет возможность произвести "горячее восстановление". "Горячая замена" просто позволяет быстро, безопасно и легко удалить/установить диск. "Горячий резерв", казалось бы, обеспечивает "горячее восстановление", поскольку он позволяет немедленно заменить неисправный диск в массиве RAID, но неисправный диск по-прежнему должен быть заменен, после чего необходимо дать команду на восстановление. Сегодня все доступные для платформы ПК системы RAID требуют для начала реставрации данных вмешательства пользователя на каком-либо уровне - хотя бы на уровне загрузки модуля NLM на сервере NetWare или нажатия кнопки запуска в меню приложений NT Server.