Отказоустойчивые компьютеры фирмы Strаtus

Существуют сферы использования компьютеров, где на первое место, если не считать собственно способности выполнять приложения пользователя, выходит не производительность, а отказоустойчивость. Для таких критических приложений используются специальные отказоустойчивые компьютеры. Цены на них всегда "кусаются", и очень даже больно. Впрочем, продукция компании Stratus на фоне иных компьютерных систем данного класса может считаться относительно дешевой.

Компьютеры от Stratus - это классика на рынке отказоустойчивых систем. Цель данной статьи - ознакомить наших читателей с архитектурой и техническими характеристиками этих компьютеров. Сегодня Stratus предлагает два компьютерных семейства: системы Continuum на базе микропроцессоров HP PA-RISC и RADIO Cluster на базе микропроцессоров Intel.

Сontinuum

Stratus характеризует семейство Continuum как системы, обеспечивающие "непрерывную доступность". К этой терминологии мы еще вернемся. Компьютеры Continuum делятся на 3 серии - 400, 600 и 1200. Continuum серии 400 - это младшие модели, которые могут работать с ОС HP-UX или FTX (отказоустойчивый вариант Unix SVR4 - cобственная разработка Stratus). Их особенностью является отличная от серий 600 и 1200 архитектура ввода-вывода, ориентированная на PCI. Мы рассмотрим архитектуру серий 600 и 1200, которые являются отказоустойчивыми SMP-системами.

Прежде всего нужно отметить дублирование всех основных архитектурных блоков, включая системную шину. Собственно, основные отличия между 600-ми и 1200-ми моделями проистекают из различного числа доступных слотов системной шины: в 600-й серии их 6, а в 1200-й - 12.

Процессорные платы Continuum включают (логические) процессоры и содержат 2 или 4 микропроцессора. Такое резервирование позволяет не только детектировать их сбои, но и проводить автоматическое восстановление после сбоя, и обеспечивает исключительно высокую степень надежности работы процессоров. 600-е модели допускают конфигурации, включающие до 2 процессоров (2 слота системной шины), а 1200-е модели - до 4 процессоров (4 слота системной шины).

В качестве микропроцессоров используются HP PA-RISC 7100 c тактовыми частотами 72 и 96 МГц (см. табл.). Ясно, что по современным меркам это выглядит весьма скромно. 9 сентября этого года Stratus объявила о начале поставок новых моделей 400-й, 600-й и 1200-й серий, содержащих до 2 процессоров на базе микропроцессоров HP PA-8000 c тактовой частотой 180 МГц. Это кардинально повышает производительность cоответствующих моделей Continuum.

Конфигурации компьютеров Continuum



серия 600
серия 1200
610/6206251210/12201215/1225/1245
Тактовая частота, МГц72967296
Кэш второго уровня, Мбайт0,520,52
Число процессоров*1(4)/2(8)2(8)1(4)/2(8)1(4)/2(8)/4(16)
Емкость ОП, Мбайт128-2048128-2048128-3072128-3072
Макс. число SCSI-устройств9696192192
Макс. число IOA28288484
* В скобках дано число физических процессоров

Оперативная память в Continuum распределена между процессорными платами. Из других SMP-систем с подобным построением памяти можно упомянуть, например, серверы Sun Ultra Enterprise 10000 (CWR, #14, 1997). Такой подход по сравнению с выделением оперативной памяти на отдельные платы имеет свои плюсы и минусы. Считается, что плюсы, связанные с более быстрым обращением к локальной памяти, перевешивают, о чем свидетельствует и популярность архитектуры ccNUMA. На процессорной плате может располагаться от 128 Мбайт до 2 Гбайт памяти. Оперативная память также задублирована, поэтому емкость физической оперативной памяти вдвое больше емкости логической. Общая емкость (логической) памяти составляет до 2 Гбайт в моделях 600-й серии и до 3 Гбайт - в моделях 1200-й серии.

В Continuum для организации ввода-вывода применяются процессоры ввода/вывода, что характерно для многих мощных SMP-систем. Необычно то, что Stratus предлагает два разных типа процессоров ввода/вывода.

Процессор ввода/вывода К460 реализован в виде дуплексных плат (также с резервированием), в которых используются микропроцессоры Intel 80960 c тактовой частотой 24 МГц. К460 содержит собственную оперативную память емкостью 5 Мбайт, что должно в немалой степени способствовать эффективности обменов данными с системной шиной. К460 обеспечивает работу в режиме DMA. Этот процессор ввода/вывода предназначается для организации связи с Ethernet (10/100 Мбит/с) и поддерживает работу 4 каналов Fast&Wide SCSI-2.

Процессор ввода/вывода К600 также ориентирован на работу в режиме DMA. В нем применяются микропроцессоры Motorola 68030. К600 имеет собственную оперативную память емкостью 4 Мбайт. Основная задача процессора ввода/вывода К600 - управление адаптерами ввода-вывода, которые обеспечивают интерфейс с разнообразными типами сетей, включая, в частности, X.25, SNA, ISDN, Ethernet 10/100 Мбит/с и Token Ring. Имеются также адаптеры ввода/вывода для подключения асинхронных телефонных линий (16 на один адаптер) и универсальные адаптеры каналов связи, поддерживающие как асинхронную, так и синхронную передачу. Наконец, существуют специальные адаптеры ввода/вывода, например обеспечивающие прямое подсоединение к каналу ввода/вывода мэйнфрейма IBM. Каждый такой адаптер подключается сразу к двум шинам, причем сами адаптеры также резервируются.

Внутри каждой из серий Continuum - 600 и 1200 - допускается модернизация с переходом от младших моделей к старшим. Исключение составляет самая младшая модель 610S, содержащая 1 процессор с частотой 72 МГц, 128 Мбайт ОП и до 10 НЖМД; к этой модели нельзя подключать так называемые кабинеты расширения (см. ниже). Модернизация процессорных плат (то есть процессоров и ОП) производится путем их замены.

600-е модели в основном кабинете, кроме двух процессорных плат, имеют еще 4 места на системной шине, на которой может находиться 0 или 2 ПВВ К600 (см. табл.), а остальные места занимает К460. К системе можно подключить до 96 SCSI или до 48 SCSI-устройств, и до 28 IOA.

В основном кабинете размещается до 10 накопителей на жестких дисках (по 5 на каждое из 2 шасси) и 2 накопителя на магнитных лентах; кроме этого, допускается использование большого числа кабинетов расширения.

В 1200-й серии, кроме 4 слотов для процессорных плат, имеется 8 мест, которые могут занимать платы К600 (0/2/4/6 штук) и К460 (2/4/6/8 штук). Поддерживается до 192 SCSI-устройств или до 84 IOA; возможны смешанные конфигурации. Базовые конфигурации этих моделей включают основной кабинет и 1 кабинет расширения. Конфигурации кабинетов расширения - такие же, как в серии 600 (см. выше). Кроме SMP-конфигурации Continuum позволяет строить кластеры с использованием протоколов TCP/IP, работающих поверх Ethernet или FDDI.

Компьютеры Continuum могут поставляться с ОС FTX или VOS. Последняя специально ориентирована на отказоустойчивую обработку транзакций в реальном времени. В ней работают СУБД Oracle, Informix, Sybase. Возможны также поставки с HP-UX, что открывает доступ к большому числу приложений.

С нашей точки зрения, компьютеры Continuum относятся к системам среднего уровня, и их целесобразно применять в диапазоне от "больших" отделов до уровня небольшой корпорации. Что касается "непрерывной доступности", то в терминологии Stratus она не подразумевает обслуживание пользователей при смене версии ОС, что обеспечивают компьютеры Tandem Himalaya. Однако, как утверждают специалисты фирмы, реакция Continuum при сбое гораздо быстрее.

RADIO Cluster

Ни стандартный Unix, ни Windows NT не обеспечивают достаточно высокого уровня отказоустойчивости. Построение кластеров - это сегодня стандартный способ создания относительно недорогих отказоустойчивых систем. Ясно, что такой подход позволяет быстро создавать системы, построенные с использованием самых последних достижений компьютерной технологии. Весьма привлекает, в частности, идея построения кластеров из ПК-серверов, содержащих микропроцессоры Intel и работающих под управлением Windows NT. Понятно, что такие системы будут относительно дешевы, но и уровень их отказоустойчивости, по крайней мере на первых порах, окажется ниже, чем у специально разработанных отказоустойчивых систем типа Continuum.

Именно такую систему представляет собой новая разработка RADIO Сluster. Эти кластеры образуются из 3 типов узлов: вычислительных, ввода-вывода (узлов хранения данных) и сетевых узлов.

Вычислительные узлы включают 2 процессора Intel Pentium Pro/200 МГц c кэш-памятью второго уровня емкостью 512 Кбайт и оперативной памятью емкостью от 64 Мбайт до 1 Гбайт. На каждом узле работает свой экземпляр ОС Windows NT Server 3.5.1. или 4.0. Узел комплектуется также системным диском (IDE) на 4 Гбайт, портом PCI Fast&Wide SCSI-2, мышью, клавиатурой, накопителем CD-ROM, монитором и прочими компонентами стандартного ПК-сервера, включая порт Ethernet 10/100 BaseT. Естественно, каждый вычислительный узел имеет свой блок питания и вентилятор. В стойку RADIO Cluster монтируется до 6 вычислительных узлов с возможностью их горячей замены. Кроме того, несколько стоек также можно объединять в кластер. В настоящее время возможна кластеризация до 4 стоек; в будущем планируется еще увеличить масштабируемость. Кстати, недавно компания Stratus объявила о планах выпуска новой версии RADIO Сluster на базе микропроцессоров Merced.

Узел хранения данных содержит 133-мегагерцевый процессор Intel Pentium, оперативную память емкостью от 16 до 64 Мбайт, 4 накопителя на жестких дисках Fast&Wide SCSI-2, SCSI-плату для шины PCI, а также другие стандартные для ПК-сервера компоненты. В узлах ввода/вывода применяется специализированная ОС Сhorus. Узлы хранения данных обслуживают запросы на дисковый ввод/вывод, поступающие от вычислительных узлов кластера. Как вычислительные узлы, так и узлы ввода/вывода содержат также модули системного управления.

Сетевые узлы содержат хабы, соединяющие между собой вычислительные узлы и узлы хранения данных каждого кластера. Для соединения узлов в кластер используется Fast Ethernet. Общее управление кластером осуществляет программное обеспечение RADIO Cluster Manager. Информацию о состоянии узлов на управляющий ПК передают модули системного управления.

Очень важно расcмотреть также предлагаемые приложения. Windows NT, в отличие от Unix, не отличается пока столь богатым выбором приложений корпоративного уровня. С учетом отсутствия готового индустриального стандарта Wolfpack проблемы разработки кластерного ПО легли на плечи фирм-производителей кластеров. Stratus, как, например, и DEC, и Compaq/Tandem, осуществила собственные разработки.

Stratus для управления распределенными приложениями предлагает Isis Availability Manager (IAM), а также необходимые инструментальные средства разработки в среде IAM. IAM написана с использованием Perl и отвечает за мониторинг работы кластера, переключение приложений на другие узлы при сбоях, обеспечение распределения нагрузки и др. В настоящее время доступны "отказоустойчивые" приложения Microsoft BackOffice (SQL Server, Exchange, IIS).

Cтартовая стоимость RADIO Cluster, содержащего 2 вычислительных узла, 2 узла ввода/вывода и 2 сетевых узла, составляет около 70 тыс. долл. - прямо скажем, не слишком высокая цифра для мира отказоустойчивых систем. Хорошие возможности масштабирования кластера позволяют строить мощные конфигурации, ориентированные на корпоративные приложения. Если несколько моделей Continuum уже функционируют в Москве, то данные о поставках в нашу страну новых систем RADIO Cluster у нас отсутствуют. Однако можно предположить, что в России к ним, как к менее дорогим системам, проявят больше интереса, чем к Continuum.

Поделитесь материалом с коллегами и друзьями