В предыдущей публикации нашей рубрики мы рассказали о компьютерной продукции известной европейской фирмы Bull, в которой используются микропроцессоры PowerPC. Сегодня мы знакомим читателя с компьютерами другой европейской компании, Parsytec, в продуктах которой

также применяется PowerPC. Эта фирма у нас гораздо менее известна, между тем ее компьютеры довольно успешно продвигаются на российский рынок, а недавно в С.-Петербурге открылось представительство компании. Компьютеры от Parsytec давно "прописались" в таблице производительности на тестах Linpack-parallel для MPP-систем. Поскольку в отечественной компьютерной прессе, вероятно, не просто найти данные об этой компании, расскажем сначала о ней самой.

Немного истории

Компания Parsytec GmbH (PARallel SYstems TEChnology) была образована в Германии в 1985 г. В настоящее время отделения фирмы имеются в США, Израиле и Нидерландах. С самого начала компания ориентировалась на разработку и производство высокопараллельных многопроцессорных компьютеров. Естественно, что в те годы Parsytec обратилась к созданию систем на базе транспьютеров.

Она выпускала разнообразную продукцию, от однопроцессорной платы для IBM PC до самостоятельных (stand alone) компьютеров с тысячами процессоров. В системах серий MultiCluster и SuperCluster (модели от SC-1/16 до SC-1/64) использовались процессоры Inmos Ims T800, в компьютерах Parsytec GC (модели от GC-1 до GC-5) были запланированы и процессоры T9000.

Архитектура серии GC строилась на базе "гигакубов" (GigaCube). Каждый гигакуб представлял собой независимый блок, имеющий собственные источники питания, каналы ввода/вывода и 64 процессора. Гигакубы были связаны между собой в единый компьютер, причем модели от GC-3 и выше, т.е. имеющие не менее 1024 процессоров, требовали водяного охлаждения. Внутри гигакуба располагались 4 кластера по 16 процессоров в каждом. Кроме того, кластер обладал оперативной памятью (ОП) емкостью 32 Мбайт. В гигакубе поддерживались интерфейсы ввода/вывода SCSI-2 и HiPPI с пропускной способностью 20 и 100 Мбайт/с, соответственно. Для процессоров T9000 с частотой 50 МГц оценка пиковой производительности GC-1 составляла 1,6 GFLOPS, GC-5 в максимальной конфигурации из 256 гигаузлов с 16384 процессорами - 400 GFLOPS (поддерживаемая - 190 GFLOPS). Завершим ряд этих внушительных данных характеристиками пропускной способности: не менее 80 Мбайт/с между любыми процессорами, 160 Мбайт/с между кластерами, 1,1 Гбайт/с между гиперкубами. Мы привели здесь эту информацию, в частности, для того, чтобы читатель оценил, насколько солидными компьютерными системами занимается Parsytec.

День сегодняшний

В последнее время Parsytec представляла на рынке три семейства компьютеров: Parsytec CC series, на которых мы подробнее остановимся ниже, компьютеры MultiCluster и Power Xplorer Series. Power Xplorer базируется на узлах Power Transputer, включающих PowerPC 601 c тактовой частотой 80 МГц, и коммуникационном процессоре T805. Такой узел имеет 32 Мбайт ОП, построенной по DRAM-технологии. Сеть этих узлов имеет топологию двумерной решетки и наращивается порциями по 4 узла. Интересно, что, хотя Parsytec - относительно небольшая компьютерная фирма, ее продукцию можно увидеть в самых разных точках земного шара. Например, компьютеры Parsytec Xplores инсталлированы в университете далекого Пуэрто-Рико. В таблицы 1 приведены данные о производительности подобных компьютеров от Parsytec на наиболее, пожалуй, популярных для МРР-систем тестах Linpack parallel, в сравнении с данными для ставших "классикой МРР-систем" компьютеров СМ-5 от Thinking Machine.

Компьютер
n, ЦП
Rmax, GFLOPS
Nmax
N1/2
Rpeak, GFLOPS
Parsytec GC
16
0,68
7700
2200
1,3
32
1,5
11000
3600
2,6
64
2,8
16000
4500
5,1
96
3,9
19000
6698
7,7
128
5,2
22000
7800
10
256
8
27000
9500
15
Thinking Machine CM-5
128
7,7
18432
8192
16
256
15,1
26112
12032
33

Таблица 1.
Производительность компьютеров Parsytec GC/Power Plus (80 МГц) на тестах Linpack parallel.

В этой таблице Rpeak - пиковая производительность; Rmax - достигнутая производительность; Nmax - размерность системы, при которой достигается значение Rmax; N1/2 - размерность, при которой достигается производительность Rmax/2. Nmax и N1/2 показывают, насколько большими должны быть размерности задачи (длина векторов) для достижения соответствующих уровней производительности. Их более низкое значение говорит о большей эффективности архитектуры.

Компьютеры серии MultiCluster строятся на основе модулей Power Transputer, которые также включают микропроцессор PowerPC и транспьютер для коммуникаций. Системы MultiCluster могут монтироваться в стандартную стойку 19" (до 14 модулей на кабинет). Мы не будем подробнее рассказывать об этих вычислительных системах, информацию о них можно найти, например, на WWW-сервере фирмы, рассмотрим архитектуру систем Parsytec CC series.

Архитектура компьютеров Parsytec CC

По архитектуре компьютеры Parsytec CC (Cognitive Computing) относятся к MPP-системам с распределенной ОП. Параллельные системы Parsytec CC состоят из полностью самостоятельных узлов, каждый из которых может иметь собственные магнитные диски и иные средства ввода/вывода. Эти узлы связаны между собой посредством высокоскоростной сети, включающей маршрутизаторы (R).

Существует два типа узлов: вычислительные и имеющие расширенные возможности ввода/вывода. Мы будем называть их соответственно P- и I/O-узлами. Разделение на P- и I/O-узлы аналогично разделению на толстые и тонкие узлы в IBM SP2. Маршрутизаторы сети являются отдельными устройствами. Они имеют по 8 портов и могут каскадироваться. Применение таких маршрутизаторов позволяет достаточно легко строить различные топологии соединения узлов, в соответствии с задачами заказчика. Все модули и источники питания имеют стандартные размеры 19". Высокая степень модульности необходима для оптимизации конфигурации модулей под требования конкретных приложений.

Характеристики сети, объединяющей узлы MPP-систем, всегда служат одним из основных показателей, определяющих производительность. Особенно важны они для приложений реального времени, в том числе для распознавания образов - одной из основных областей применения компьютеров Parsytec. В продуктах Parsytec применяются последовательные двунаправленные соединения, называемые HS-Link, в которых используются коаксиальные кабели. Эти соединения были разработаны Bull и SGS Thomson для высокоскоростных ATM-сетей. Они соответствуют стандарту IEEE Р1355 и поддерживают потоки данных со скоростями до 75 Мбайт/с. В дальнейшем планируется применение АТМ-технологий со скоростями от 622 Мбит/с и выше. Скорость в 75 Мбайт/с является пиковым значением; поддерживаемая величина равна 58 Мбайт/с при использовании пакетов емкостью 4 Кбайт. Для сравнения, аппаратная скорость передачи данных между узлами в МРР-компьютерах RM1000 от SNI составляет 100 Мбайт/с, в Intel Paragon - 175 Мбайт/с.

Архитектура узла является общей как для P-, так и для I/O-узлов, и основана на стандарте PReP/CHRP (PowerPC Reference Platform/Common Hardware Reference Platform). Каждый узел, будучи "завершенным" компьютером, может работать со стандартной ОС (AIX, Solaris или Windows NT). Кэш второго уровня может иметь емкость 256/512 Кбайт или вовсе отсутствовать, пропускная способность равна 250 Мбайт/с. ОП узла имеет емкость от 8 до 128 Мбайт и пропускную способность 100 Мбайт/с. Связь с внешними устройствами и с интерфейсом HS-Link осуществляется через шину PCI с пропускной способностью 133 Мбайт/с. Что касается производительности используемых процессоров PowerPC 604, то некоторые данные о ней можно получить из таблицы 2.

Частота, МГц
100
133
166
Пиковая производительность, MFLOPS
200
266
332
SPECint92
140
175
220
SPECfp92
145
170
220

Таблица 2.
Характеристики производительности PowerPC 604 (данные фирмы Parsytec).

Пользователи

Хотя компьютеры Parsytec CC могут применяться в различных приложениях, следует отдельно остановиться на задачах распознавания образов, чему сама Parsytec придает особое значение. Приведем пример, демонстрирующий, как можно оптимизировать аппаратное строение Parsytec CC для конкретной программной модели распознавания образа. Нетрудно увидеть, что возможная топология (конфигурация) Parsytec CC является непосредственным отражением этой программной модели. Такая интересная возможность своеобразной перестройки архитектуры под конкретную задачу, вероятно, в немалой степени может способствовать высокой эффективности использования Parsytec CC для задач распознавания образов, цифровой обработки сигналов (DSP) и т.п. Можно сказать, что Parsytec CC представляет собой эдакий "многопроцессорный глаз", включающий не только внешние органы, но и эффективные средства обработки получаемого изображения, в том числе и в реальном времени.

В России компьютеры от Parsytec инсталлированы в ряде мест, например в Москве в Институте математического моделирования, в ВЦ РАН и т.д. По имеющимся данным, самый высокопроизводительный компьютер среди инсталлированных в нашей стране выпущен Parsytec: недавно в Институте высокопроизводительных систем и баз данных в Санкт-Петербурге собран 16-процессорный компьютер. В нем используются процессоры PowerPC 604 c тактовой частотой 133 МГц; пиковая производительность компьютера составляет соответственно 4,3 GFLOPS. Вот-так Parsytec!