В нашей рубрике уже была публикация о продукции этой фирмы (CW-R, 1996, № 46). За последнее время компьютерная продукция Parsytec почти полностью обновилась; за прошедший год фирма поставила в Россию несколько новых МРР-компьютеров. У любого подобного успеха могут быть две составляющие: эффективное аппаратно-программное обеспечение и эффективные действия фирмы.

Рассмотрим сначала архитектурные и технические особенности новых МРР-cистем Parsytec. В настоящее время компания предлагает следующие многопроцессорные компьютеры: Parsytec IPC, Parsytec PowerMouse и Parsytec CC (серии ССe и СС/ipp). Все они относятся к системам с распределенной (физически и логически) оперативной памятью. Это означает, что каждый процессорный узел имеет один-два микропроцессора и собственную оперативную память. Сами же процессорные узлы связаны между собой посредством некоторой системы коммуникаций (межсоединением). В качестве микропроцессоров в компьютерах Parsytec применяются PowerPC и - в последнее время - Intel x86.

Parsytec IPC

Системы Parsytec IPC (Image Processing Computer) ориентированы, как явствует из названия, на обработку изображений. В процессорных модулях Parsytec IPC применяются процессоры PowerPC 604e c тактовой частотой 300 МГц. Основу процессорных модулей составляют материнские платы Motorola MTX, на которых установлены один или процессора. Однако возможно и применение материнских плат Intel.

Процессоры PowerPC 604e способны выполнять две операции с плавающей запятой за такт и имеют пиковую производительность 600 MFLOPS. Их оценки SPECint95/fp95 = 12,5/10,5 уступают современным показателям для процессоров Intel, однако с точки зрения пиковой производительности с плавающей запятой PowerPC 604e/300 МГц впереди.

Максимальная емкость оперативной памяти узла равна 1 Гбайт. Для организации ввода/вывода применяется шина PCI.

Кроме слота 32-разрядной PCI-шины могут использоваться расположенные на дочерних PCI-платах слоты 64-разрядных PCI-шин, работающих на частоте 33 МГц. Для обмена данными с жесткими дисками используется Fast & Wide UltraSCSI.

Всего в Parsytec IPC может быть до четырех процессорных модулей (до 8 процессоров с пиковой производительностью, достигающей 4,8 GFLOPS). Эти модули, как и модуль концентраторов, помещаются в 19-дюймовую стойку. Модуль концентраторов содержит два концентратора Fast Ethernet, но возможно применение вместо них коммутаторов. Этот модуль служит для организации межузловых коммуникаций. Такое построение позволяет относительно легко реализовать и применение «собственной» шины данных для связи между процессорными модулями, базируясь на использовании дочерних PCI-плат. Кроме того, в стойке размещается модуль операторской панели, к которому подключается консоль системы.

Очевидным потенциальным конкурентом Parsytec IPC могут служить кластеры ПК, построенные, например, по технологии Beowulf c применением ОС Linux. В узлах же Parsytec IPC применяется ОС AIX 4.2.

Применение таких кластеров может дать лучшее соотношение стоимость/производительность. Преимущество IPC - наличие готовых приложений, в первую очередь в области промышленной обработки изображений (например, для автоматической инспекции поверхности материалов, в частности, в металлургии), для компьютерной томографии и др.

Parsytec PowerMouse

Другими системами на базе PowerPC, предлагаемыми Parsytec, являются PowerMouse. Они пришли на смену более ранним системам Parsytec PowerXplorer, которые успешно работают в России.

В PowerMouse используются процессоры PowerPC 604e, работающие на частоте 200 МГц. Соответственно пиковая производительность этих микропроцессоров составляет 400 МFLOPS, а оценка SPECint95/fp95=8.5/8.2. Понятно, что они уступают по производительности старшим моделям Pentium II.

Однако основная идея построения компьютеров PowerMouse - обеспечение своеобразного многопроцессорного «ускорителя» для хоста, в качестве которого Parsytec предлагает станцию на базе SPARC, оснащенную ОС Solaris. В качестве узлов такого ускорителя выступают процессоры PowerPC, к которым через внутреннюю шину с пропускной способностью 422 Мбайт/с подсоединяется оперативная память SDRAM емкостью 64 Мбайт и коммуникационный контроллер.

К этому коммуникационному контроллеру подсоединяются четыре двунаправленных канала с суммарной пропускной способностью 160 Мбит/с. Топология, по которой происходит подсоединение процессорных узлов в этом ускорителе, - плоская решетка, которая наращивается «квадратными» элементами, состоящими из четырех узлов. Масштабирование ввода/вывода в этом случае осуществляется в пределах, доступных для рабочей станции. Однако возможно и образование кластеров из рабочих станций с подсоединенными к ним «ускорителями» PowerMouse; при этом обеспечивается и масштабирование ввода/вывода.

Очевидным недостатком такого подхода, как и для многих иных процессорных ускорителей, является определенная ограниченность класса эффективно решаемых задач. Это вызвано не очень высокой скоростью обмена данными между узлами PowerMouse и небольшой емкостью оперативной памяти узла.

Однако этот подход позволяет относительно дешевым способом построить компьютер с хорошим уровнем пиковой производительности. Например, 16-процессорная конфигурация PowerMouse имеет производительность 6,4 GFLOPS и память емкостью 1 Гбайт. В этой топологии наращивать число процессороа формально можно без ограничения, но с ростом их числа межсоединение может стать узким местом.

Для распараллеливания задач Parsytec предлагает стандартные средства PVM, MPI, компиляторы Fortran 77/90, Си, С++ и инструментарий PARIX/PowerTools. По утверждению фирмы, PowerMouse - cамые быстрые в мире масштабируемые системы на базе PowerPC.

Parsytec CC

Формально единственными компьютерами фирмы, которые «остались в строю поставляемых» со времени нашей предыдущей публикации об этих системах, являются Parsytec CC. Пожалуй, это наиболее универсальные многопроцессорные системы, выпускаемые Parsytec. Сейчас фирма предлагает две серии этих компьютеров: Parsytec ССe (на базе процессоров PowerPC) и Parsytec CC/ipp (на базе процессоров Intel). Рассмотрим сначала модели CCe.

Для объединения узлов в единую систему в моделях CCe применяется внутренняя cеть, в которой узлы связаны друг с другом двунаправленными каналами HS-Link с пиковой пропускной способностью 1 Гбит/с (75 Мбайт/с). Эти каналы соответствуют стандарту IEEE 1335 и поддерживают соединения типа «точка-точка». Для мониторинга состояния аппаратуры используется другая специализированная сеть C-Net.

Каждый узел имеет хотя бы одно соединение с HS-Link через PCI-адаптер. При построении сети применяются маршрутизаторы (см. рис.). Они используют механизм wormhole (что можно перевести на русский язык как «червоточина»), обеспечивающий высокую пропускную способность. Маршрутизаторы могут каскадироваться, обеспечивая различные топологии и высокий уровень масштабирования системы. Две возможные топологии представлены, в частности, на рисунке.

Как и в любом ином межсоединении, производительность его работы определяется двумя параметрами - пропускной способностью и задержками. Из этих данных следует, что основными конкурентами Parsytec CC являются не большие суперкомпьютеры МРР-архитектуры (они имеют более высокую пропускную способность и более низкие величины задержек), а более дешевые кластерные системы, использующие для межсоединения Gigabit Ethernet или ATM. Последние, в свою очередь, уступают по задержкам Parsytec.

В процессорных узлах Parsytec ССe применяются PowerPC 604е/200 МГц. Узлы комплектуются оперативной памятью емкостью до 512 Мбайт с пропускной способностью 130 Мбайт/с. Производительность процессоров в этих системах составляет SPECint95/fp95=7,18 и 6,00.

В качестве средств распараллеливания предлагается MPI, PVM, пакет SCALAPACK, а также специализированный API-интерфейс, называемый EPX, который образует «среду» Embedded PARIX (Parallel Extension to Unix - EPX). Благодаря этому API-интерфейсу можно создавать виртуальные каналы между пользовательскими нитями.

Кроме Parsytec CCe компания предлагает серию Parsytec CC/ipp на платформе Pentium Pro/200 МГц и NT 4.0. Оценки производительности SPECint95/fp95 этих процессоров составляют соответственно 8,1 и 15,9.

Эти системы снабжаются специальными графическими средствами и аппаратурой, предназначенной для работы с изображениями. Есть прецеденты, когда вместо NT применялась ОС Linux. Кроме того, компьютеры CC/ipp могут поставляться и с ОС AIX на базе PowerPC 604e.

Не продажи, а сотрудничество

Хотя компьютеры Parsytec можно найти в самых разных точках земного шара, особо упомянем их инсталляции в Германии, в частности на знаменитых металлургических заводах Круппа.

В России их поставки осуществляет фирма Parsytec Petersburg. Если посмотреть на количество инсталляций (около полутора десятков), можно сказать, что Parsytec в нашей стране «процветает», обгоняя по числу инсталляций всех других производителей суперкомпьютеров.

Причин этому, на наш взгляд, несколько. Во-первых, эти системы относительно дешевы, и хотя их процессоры отнюдь не лидируют по производительности, компьютеры Parsytec позволяют осуществлять разработку параллельных приложений. Во-вторых, Parsytec предлагает приложения в ряде областей, в первую очередь для обработки изображений.

Еще одной важной причиной успеха Parsytec является организация сотрудничества фирмы с российскими потребителями. Совместно с российскими партнерами Parsytec выполняет различные проекты в рамках Евросоюза (в том числе в программах ESPRIT, ACTS и др.). Можно упомянуть, например, проект SIGMA-EAST с Государственным историческим музеем России.

Крупнейшими вычислительными центрами в стране, имеющими сразу по несколько установленных компьютеров Parsytec, являются ИВВиБД (Санкт-Петербург) и ИММ РАН (Москва). В последнем недавно прошла презентация 32-процессорной системы Parsytec CC на базе PowerPC 604.



Михаил Кузьминский - старший научный сотрудник Центра компьютерного обеспечения Института химических исследований РАН. С ним можно связаться по телефону (095) 135-6388.

Характеристики «быстродействия» межсоединения Parsytec CC

Адаптеры PCI/HS-Link:
Пиковая ПС66 Мбайт/с
Поддерживаемая ПС, двунаправленная передача42 Мбайт/с
Поддерживаемая ПС, однонаправленная передача30 Мбайт/с
Аппаратная задержка20 мкс
Задержка на уровне виртуального канала в ОС AIX260 мкс
Маршрутизаторы:
ТипКоммутатор 8х8
Пропускная способность8х2х40 Мбайт/с
Задержка50 нс
Время установки150 нс