Новые решения, которые предлагают сегодня компания SGI - это семейство Impact и архитектура InfiniteReality, а также фирма SUN, комплектующая свои компьютеры UltraSparc графическими комплексами Creator. Сразу после своего появления все эти системы стали поставляться в конфигурации с реальными компьютерами. Для изделий Silicon Graphics это три новых модели среднего класса линии Indigo2 IMPACT Solid, High и Maximum, а также новое поколение высокопроизводительных систем Оnух InfiniteReality. Для SUN - это семейство станций, построенных на базе процессора UltraSparc - компьютеры UltraSparc I и II.

Графическую производительность лучше всего измерять на конкретных приложениях, однако традиционно больше привыкли оценивать числом трехмерных векторов или треугольников, выводимых системой в секунду. Чтобы составить первое впечатление, этого достаточно, но даже при анализе этих скупых данных надо внимательно следить за корректностью сравнений, например за использованием треугольников и векторов нестандартных размеров или за наличием разного рода неочевидных умолчаний.

Большое влияние оказывает и выбор графических программных систем, используемых для визуализации. Выбор специфических фирменных пакетов позволяет добиться более высоких абсолютных цифр; более скромные, но универсальные результаты можно получить при использовании признанного промышленного стандарта OpenGL. В этом случае единственным остается сравнение по числу выводимых примитивов, но давно уже прошло то время, когда пользователя интересовало число векторов, выводимых в секунду - сегодня среди основных потребителей высокопроизводительных систем машинной графики встречаются главным образом специалисты в прикладных областях, мыслящие в терминах реальных изображений, а не абстрактных векторов и треугольников.

Системы Onyx IaliniteReality и i-Station

Долгое время флагманом графических систем компании SGI была архитектура RealityEngine2, первые образцы которой появились еще в 1993 году. Сегодня эстафету приняла архитектура InfiniteReality(в средних и младших моделях используется архитектура IMPACT. Maximum IMPACT имеет две геометрические машины (ГМ), а High только одну, что дает примерно двукратное повышение производительности при работе с геометрией. Кроме этого эти модели отличаются и по объему буфера кадра, а также по числу бит на пиксел (16 и 32). Интегральные показатели производительности IMPACT превышают возможности Reality Engine по скорости работы с трехмерными текстурами, однако эта система не дает такого качества при устранении лестничного эффекта. Видео для серии IMPACT поставляется в виде отдельного адаптера, выполняющего сжатие и обработку цветных изображений, а также закраску с использованием текстур. Все эти возможности сразу находят сегодня конкретные применения - по данным Bussiness Week 27 художников фирмы Pixar, вооруженных станциями Indigo2 заменяют сегодня более сотни аниматоров из Disney, работающих традиционными способами.

Таблица 1. Графическая производительность новых систем SGI


InfiniteRealityi-StationRealityEngine2
Треугольников/с1051.8
Заливка прямоугольников
текстуры без Z-буфера20020055
текстуры, 24 бит Z-буфер16716755
текстуры, 16 бит Z-буфер18418455
Скорость загрузки текстур*220

Мбайт/с
220

Мбайт/с
40

Мбайт/с
Примечание: производительность в млн. единиц;* - скорость для одного растрового менеджера (RM) (в конфигурации может быть до 8 растровых менеджеров).

Высокопроизводительная графическая архитектура InfiniteReality стала доступна одновременно для двух систем: в составе многопроцессорного комплекса Оnух и в качестве однопроцессорного (R4400 или R10000) компьютера, имеющего архитектуру InfiniteReality, но при меньшей производительности (35-40 тыс. долл.), чем более дорогие Оnух. Таким образом, пользователям, нуждающимся в высокой графической производительности, например для визуализации данных, полученных на суперкомпьютере, но приложения которых некритичны к многопроцессорности можно применять относительно недорогие i-Station.

Качественно скорость загрузки текстур, равную 220 Мбайт/с (таблица 1), можно проиллюстрировать следующим сравнением. Если начинать визуализацию в реальном масштабе времени с картинки земного шара из космоса и двигаться дальше, постепенно увеличивая изображение: картинка Северной Америки, Калифорнии, города Mountain View, вплоть до рабочей комнаты программиста и картинки с его дисплея, то все это как раз и доступно при производительности InfiniteReality.

Очевидно, что сегодня от графических систем требуют уже не только работы с геометрическими образами, а и с видео и другими средствами мультимедиа. Что интересного предлагает новая архитектура InfiniteReality в этом плане? В отличие от предыдущих реализаций графических решений компании SGI, данная система позволяет осуществлять параллельную обработку изображений, видео и геометрических данных. Это означает, что поток видеоданных в реальном масштабе времени можно интегрировать с трехмерной геометрической картинкой, причем даже при работе с дисплеями, имеющими более высокое разрешение. Мало того, в новой архитектуре предусмотрены многоканальные дисплейные генераторы DG4-2 и DG4-8, позволяющие подключать по одному монитору к каждому каналу без использования каких-либо дополнительных адаптеров. Таким образом, можно создавать стереоскопические конфигурации, когда для левого и правого глаза используются два разных дисплея, что весьма актуально сегодня в системах виртуальной реальности и в тренажерах. Необходимая масштабируемость конфигурации достигается также путем подключения дополнительных КМ, каждый из который имеет буфер кадра емкостью 80 Мбайт, что при наличии 4 растровых менеджеров, составляет уже 320 Мбайт.

Что вокруг?

Сегодня в этом классе графических комплексов у InfiniteReality конкурентов нет. В "тяжелых" графических приложениях работать наравне с InfiniteReality компьютеры Digital, HP и IBM могут только при использовании графической подсистемы Freedom, причем цена ее адекватных моделей в несколько раз превышает собственную стоимость самой машины.

Но со времени последнего анонса графических систем компаниями Digital и HP прошло уже полгода и, быть может, скоро (особенно после появления систем на базе Apha 21264 и РА-8200) мы станем свидетелями их нового рывка вперед. В настоящий момент достаточно интересные решения (прежде всего, в системах средней стоимости), предлагает фирма Sun, опирающаяся на свою архитектуру Creator.

Архитектура Creator

Архитектура Creator Graphics позволяет повысить скорость передачи графической информации и увеличивает производительность.

Таблица 2. Показатели производительности Creator 3D


Creator 3D
Xmark9316.3M
X11 2-D в/с1.8M
3D векторов/с2.4M
3D т/с*786K
3D т/с**822K
Полигоны/с*261K
PLB WIRE93132.8
PLB SURF93184.9
Примечание: M-млн.; K-тыс.; * - 50 пикселов, прямое освещение от одного луча, отражение, равномерная закраска, Z-буфер; ** - 50 пикселов, равномерная закраска, Z-буфер.

В данной архитектуре была предпринята попытка максимально расширить узкое место, образуемое на трассе процессор/память/буфер кадра. При этом одной из основных задач конструкторов было сближение производительности выполнения 8-и 24-разрядных приложений, что возможно только при трех- и четырехкратном повышении скорости обменов данными. Система Creator Graphics способна сегодня осуществлять копирование картинки из памяти в буфер кадра со скоростью 290 Мбайт/с, что дает возможность обновлять 70 млн. пикселей в секунду. В составе новой архитектуры две основных модели Creator3D и Creator, которые отличаются объемом памяти буфера кадра - 15 против 5 Мбайт.

Другим важным решением, примененным в системе Creator, была максимальная интеграция графической подсистемы в общий процесс вычислений, что позволило увеличить пропускную способность на линии процессор-память, а использование встроенных графических команд процессора позволяет достигать скорости 290-600 Мбайт/с.

Работа с изображениями и операции по трансформации видеоданных также были вынесены разработчиками Creator на уровень процессора UltraSPARC-I. Такое решение было принято по ряду причин.

Во-первых, интеграция кэш-памяти и модуля управления памятью позволила существенно ускорить операции обработки пикселов. Большие изображения могут храниться непосредственно в основной памяти.

Во-вторых, стремясь к масштабированию производительности (повторяя путь HP, впервые предложившей интегрировать процессор и графические адаптеры), разработчики Creator неразрывно связали с процессором, любая модернизация которого автоматически влечет за собой и повышение графической производительности.

Наконец, встроенная система графических команд. В процессоре UltraSPARC-I реализован специальный набор графических команд Visual Instructions Set (VIS). Некоторые из них позволяют процессору напрямую обращаться к пикселям изображения, причем с достаточно высокой степенью параллелизма.

Послесловие

На примере этих новых графических систем отчетливо видно, что борьба за место на рынке развернулась сегодня не только на поприще процессоров, системных шин и внешних накопителей. Прошлый год и начало этого оказались весьма урожайными на новые графические системы - и, если раньше объявление очередного адаптера было событием и следовало не чаще одного раза в два-три года, то теперь требуются системы, непосредственно взаимодействующие с пользователем. Новые приложения (мультимедиа, виртуальная реальность, тренажеры и т.п.) вынуждают ведущих производителей предлагать системы, способные формировать реалистичные изображения в реальном масштабе времени.


С Дмитрием Волковым можно связаться по телефону: (095) 529-1551

Расчет требований к системе

Под производительностью выполнения геометрических операций обычно подразумевается способность системы перемещать , поворачивать и масштабировать трехмерные объекты, поверхность которых обычно задается множеством плоских треугольников. Каждый такой треугольник опирается на вершины - точки в трехмерном пространстве, поэтому в конечном итоге производительность сводится к скорости, с которой графическая система способна работать с точками, выполняя вещественные операции над координатами. Следующим шагом в технологии визуализации является растровая развертка с закраской преобразованных треугольников или нанесением на них элементов текстуры - собственно это и является задачей растрового менеджера. В зависимости от того, как происходит закраска многоугольников - ограничивается она простой заливкой цвета или заключается в нанесении текстуры, - различают плоские (flat shading) или текстурированные (texture mapping) изображения. В последнем случае цвет каждого пиксела вычисляется как среднее по различным направлениям освещенности (обычно от 4 до 8).

Чтобы получить более ясное представление о требованиях для каждого конкретного применения, можно привести несложные расчеты, которые полезно использовать в качестве аргументов при выборе конфигурации. Допустим, на каждый канал требуется подключить монитор с разрешающей способностью 1280х1024 точек, что для двух дисплеев составляет 2.62х1440 пикселей или 671.088.640 бит при использовании 256 бит на пиксел. Преобразовав это число в мегабайты можно получить требуемый объем буфера кадров, который необходим графической системе, работающей с приложением: 671.088.640/8*1024*1024=80 Мбайт.