Рабочие станции O2 и Octane компании Silicon Graphics

Михаил Кузьминский
Открытые Системы

Компания Silicon Graphics - общепризнанный мировой лидер в области разработки и производства компьютерных систем, ориентированных на сложные графические приложения и средства мультимедиа. Реорганизация после слияния Cray Research c SGI, судя по всему, практически заканчивается: если в прошлом финансовом году (напомним, что финансовый год в компании завершается летом) на этот процесс было затрачено свыше 100 млн. долл., то в этом году - всего лишь чуть больше 10. Финансовые отчеты SGI выглядели не блестяще вплоть до последнего квартала, когда компания получила наивысшую за всю свою историю прибыль.

Последние успехи SGI во многом определялись продажами суперкомпьютерных систем Cray T3E и Cray J90. Однако влияние суперкомпьютерных технологий и архитектур на продукцию SGI гораздо глубже. Кроме очевидной интеграции суперкомпьютерных средств и средств визуализации следует иметь в виду определенное влияние архитектуры суперкомпьютеров даже на архитектуру относительно недорогих систем - рабочих станций.

В настоящее время SGI предлагает на компьютерном рынке три семейства рабочих станций: Indigo2 Impact на базе процессоров SGI/MIPS R4400 и R10000 (см. Computerworld Россия, #8, 1996), а также появившиеся в конце прошлого года O2 и Octane, о которых речь пойдет в этой статье.

Поскольку рабочие станции SGI очень популярны среди специалистов, занимающихся исследованиями в области химии, биологии и медицины, неудивительно, что O2 тут же окрестили "кислородом".

Что такое "октановое число", знает каждый автолюбитель. Неизвестно, останутся ли в дальнейшем названия новых продуктов "химическими", но то, что грядущие поколения рабочих станций SGI также окажутся в числе лидеров по части графической производительности, равно как и тот факт, что в этих компьютерах будут применяться пришедшие из суперкомпьютерного мира архитектурные решения, предсказать можно, не рискуя ошибиться.

Настольный... пылесос

Взгляните на фотографию - если бы не монитор рядом, вы бы наверняка сочли, что на ней изображен какой-нибудь модный пылесос. Говорят, что, когда О2 впервые привезли в Россию, таможенники просто не поверили, что это изделие и есть компьютер.

Важна, конечно же, не оригинальность дизайна как таковая, хотя SGI отличилась не в первый раз (мне, например, очень нравится "башенный" дизайн Indigo - не Indigo2, а "фиолетовой", на базе R4000). Конструкторам удалось сделать ее исключительно элегантной, предельно упростив обслуживание станции. O2 состоит из пяти модулей, для доступа к которым не нужно отвинчивать винты, снимать корпус и т. д. В частности, доступ к дискам, системному модулю и платам PCI легко осуществляется с задней стороны корпуса - вся процедура занимает считанные секунды.

Но дело, конечно, не только (и не столько) в дизайне. На сегодня О2 - вероятно, самая дешевая рабочая Unix-станция, использующая 64-разрядные RISC-процессоры (SGI/MIPS R5000 или R10000). O2 имеет и очень хороший показатель стоимость/графическая производительность. Несомненно, для российских потребителей это весомый аргумент в пользу O2.

Низкая стоимость О2 достигается как за счет дешевизны процессоров R5000, так и благодаря применению новой "архитектуры объединенной памяти" (UMA, Unified Memory Architecture). В "навороченных" ПК для сложных графических и мультимедийных приложений на 32-разрядную шину PCI c пиковой пропускной способностью 133 Мбайт/с (поддерживаемая величина 50-80 Мбайт/с) "навешивается" видеоплата с видеопамятью, акселератор изображений с памятью для изображений, графическая карта с памятью Z-буфера, текстурной памятью и буфером кадров. Данные многократно пересылаются по шине между памятью различных типов и между разными платами. Поскольку уже одна шина Ultra SCSI обладает пропускной способностью порядка 30 Мбайт/с, шина PCI быстро начинает "захлебываться".

В то же время пропускная способность тракта "процессор-память" значительно выше; скорость самой памяти растет, а цена быстро снижается. Поэтому и появилась идея UMA, состоящая в интеграции всех специальных видов памяти в единый пул и использовании обычной оперативной памяти. Память автоматически перераспределяется по мере надобности; раньше же если какой-либо тип памяти не использовался, то она "простаивала". Теперь же, если не хватает какого-либо типа памяти, например текстурной, - "просто добавь ОП".

"Центр" архитектуры UMA - многопортовая память с пропускной способностью 2,1 Гбайт/с. Такой уникально высокий показатель позволяет избежать узких мест, характерных для традиционных архитектур, и обеспечивать передачу данных на максимальных скоростях от Ethernet 10/100 BaseT, двух шин Ultra SCSI F&W и от 64-разрядной шины PCI. Другим важным преимуществом UMA, о котором заявляет SGI, являются низкие величины задержек.

Емкость оперативной памяти в О2 - от 64 Мбайт до 1 Гбайт; правда, пока из-за чисто программных ограничений можно использовать до 256 Мбайт; в следующем году планируется доработать ОС и снять эти ограничения.

В табл. 1 даны некоторые оценки производительности применяемых в О2 процессоров. Преимущества R5000 - низкая стоимость и отличное соотношение цена/производительность. R5000 с тактовой частотой 180 МГц поставляются как без вторичного кэша (модели РС), так и со вторичным кэшем емкостью 512 Кбайт (модели SC). Оценки SPECint95/fp95 для R5000 уступают Pentium Pro/200 МГц, но, как не без оснований утверждает SGI, на ряде приложений O2 оказывается быстрее соответствующих Intel-систем. В августе представительство SGI в Москве сообщило, что начинаются поставки R5000 с тактовой частотой 200 МГц и внешним кэшем емкостью 1 Мбайт.

Таблица 1.

Производительность микропроцессоров.



SGI O2
SGI Octane
Intel


R5000/180 PC
R5000/180 SC
R5000/200 SC
R10000/175
R10000/175
R10000/195
Pentium Pro/200 (256K L2)
SPECint95
3,70
4,82
7,62
5,4
8,4
9,3
8,20
SPECfp95
4,55
5,42
6,60
5,7
15,5
17
6,2

Более высокую вычислительную мощность обеспечит микропроцессор R10000. Однако в архитектуре O2, рассчитанной на применение R5000, вычислительные ресурсы R10000 используются не самым оптимальным образом.

О2 целесообразно применять для видеоконференций, приложений трехмерной графики, научной визуализации, САПР, при работе с "профессиональным звуком". Встроенные средства сжатия видео в реальном времени говорят сами за себя. О2 - прекрасный инструмент для разработки Web-страниц и организации Web-сервера; что достигается, в частности, благодаря знаменитому инструментарию WebFORCE.

Двухглавая станция

Флагманом рабочих станций SGI сегодня стало семейство Octane. Унаследованные у суперкомпьютеров архитектурные решения, применяемые в серверах Origin2000 и Origin200 (Computerworld Россия, #4, 1997), перекочевали с небольшими изменениями и сюда. В основе архитектуры Octane - коммутатор, а не традиционная системная шина. Коммутаторы широко используются в архитектуре современных серверов, в том числе в SGI Origin, Sun Ultra Enterprise 10000, HP V2200 и др. Применяются они и в рабочих станциях (например, архитектура UPA компании Sun Microsystems). Преимуществом коммутаторов является гарантированная пропускная способность при отсутствии конкуренции, характерной для применения традиционной системной шины.

Коммутатор связывает основные компоненты - процессоры и оперативную память, модули ввода-вывода XIO, графическую подсистему. Нетрудно видеть, что строение Octane напоминает устройство процессорного узла в суперкомпьютерных системах Origin. Поэтому в Octane используется версия ОС IRIX 6.4, как и в серверах Origin, в то время как в О2 с архитектурой UMA - IRIX 6.3. К концу года, кстати, появится "всеплатформенная" версия IRIX 6.5. Пиковая пропускная способность канала между подсистемами в коммутаторе составляет 1,6 Гбайт/с, а поддерживаемая - 1,2 Гбайт/с. Octane имеет архитектуру SMP и может содержать один или два процессора R10000.

Процессор R10000 - суперскалярный, способен выполнять до 4 команд за такт. В нем применяется спекулятивное внеочередное выполнение команд. Внешний кэш R10000 в Octane имеет емкость 1 Мбайт. В сочетании с большим объемом кэш-памяти уровня 1 (64 Кбайт), свойством кэша не прерывать работу процессора при непопадании в кэш-память, короткими конвейерами и некоторыми другими архитектурными особенностями это позволило добиться очень высокой удельной производительности в расчете на 1 МГц. На тестах SPEC95 R10000 достойно соперничает с микропроцессорами HP PA-8x00, DEC Alpha 21164. Однако задержка с появлением более высокочастотной версии (выход R12000 с тактовой частотой 300 МГц запланирован на следующий год) может негативно сказаться на позициях процессора.

Двухпроцессорные SMP-конфигурации (кстати, довольно редкое явление в мире рабочих станций RISC-архитектур, хотя можно отметить, например, двухпроцессорные станции Sun и HP) обладают довольно высокой производительностью.

Оперативная память в Octane строится на базе технологии SDRAM и может иметь емкость от 64 Мбайт до 2 Гбайт; ее пропускная способность составляет 1 Гбайт/с.

Подсистема ввода-вывода в Octane базируется на применении XIO-плат и шин PCI. Пропускная способность двунаправленного XIO-порта составляет 1,6 Гбайт/с. Допустимы следующие типы XIO-плат: графические (в зависимости от их комплектации бывают модели Octane/SI, Octane/SSI и Octane/MXI, причем графические возможности в этом ряду возрастают); видео; сетевые (ATM OC3, Serial HiPPI, Fast Ethernet) и XIO-платы для подключения внешней памяти. XIO-карты ATM и Fast Ethernet предоставляют сразу по 4 порта. XIO-карты внешних устройств позволяют работать по шинам SCSI (4 шины на плату) или Fibre Channel (2 шины на плату). Всего в Octane имеется 4 слота для XIO-плат. Такое строение Octane обеспечивает высокую степень модульности, способствующую сохранению инвестиций.

Octane имеет три посадочных места для 3,5-дюймовых устройств Ultra SCSI и слоты для 32-х или 64-разрядных PCI-карт: двух полноразмерных и одной половинного размера.

Octane разумно применять в приложениях, в которых необходима интеграция вычислительной мощности и визуализации: при сложном трехмерном моделировании, для решения задач виртуальной реальности и в других случаях, требующих наиболее высококачественной графики. Следует отметить, что по формальным показателям типа количества треугольников в секунду компьютеры SGI начинают теснить конкуренты, в первую очередь HP. Последняя даже объявила о разработке графического суперсервера Visualize PxF1, c помощью которого она, вероятно, будет пытаться "бороться" с системами класса SGI Onyx2.

Однако на сложных графических приложениях настоящей конкуренции SGI пока не видно. SGI переводит дискуссии о производительности на более высокий уровень, ближе к реальным приложениям. Совсем недавно фирма объявила о доработках в программном обеспечении, увеличивающих производительность работы OpenGL аж в десять (!) раз. Ясно, что "профессионалы графики" по-прежнему выбирают продукцию SGI.

Таблица 2.

Графическая производительность.

Компьютер
Производительность

треугольников/сек
Viewperf (тесты OpenGL)
cdrs viewset composite
data explorer viewset
design review viewset composite
Indigo2 High Impact
1.5М
32.4
7.4
5.2
Indigo2 Maximum Impact
2.67М
48.4
9.5
6.7
O2 R5000/PC
854К
15.1
2.8
2.2
O2 R5000/SC
854К
15.8
2.9
2.3
O2 R10000
900К
17.2
3.1
2.3
Octane
1.5М
26.5
7.7
3.5
Octane/SS
2.67М
35.9
13.8
5.4
Octane/MX
2.67М
48.6
13.8
8.1