Скорость при последовательном доступе к оперативной памяти, Мбайт/с

Результаты тестов PC WorldBench 2000

И надо сказать, работал он немного быстрее «родного» интеловского. Очень скоро, однако, Intel «перекрыла кислород» производителям сопроцессоров, разместив блок арифметики с плавающей запятой внутри центрального процессора.

Cyrix ответила на это выпуском кристалла в конструктиве 80386, дав ему имя 486DLC (существовали и другие варианты, например SLC). На деле этот ЦП был улучшенной «троечкой», сопроцессора в своем составе, естественно, не имел, опережал 386-й на 10—20% и до 486-го никак не дотягивал.

Подобная практика повторялась и в дальнейшем. Для процессоров четвертого (Intel 80486) и пятого (Intel Pentium) поколений Cyrix выпускала несколько улучшенные аналоги, присваивая им номер на единичку больше, чем у Intel. Следует сказать, что определение «улучшенные» здесь может быть применено с большими оговорками. Ориентированные на рынок недорогих ПК, процессоры Cyrix хорошо работали с офисными приложениями и очень плохо — на задачах, требующих математических вычислений с плавающей запятой. Кроме того, кристаллы пятого поколения (по терминологии Cyrix — шестого) компания начала маркировать не действительным значением частоты, а индексом так называемого P-рейтинга, т. е. указывала частоту, на которой должен был бы работать процессор Intel, чтобы обеспечить аналогичную производительность. Например, процессор IBM 6х86MX (тот же Cyrix 6х86MX, только выпускаемый на заводах IBM), работая на частоте 187 МГц, обладал P-рейтингом 233. Однако если при обработке целочисленных данных он еще как-то мог состязаться с Pentium MMX-233 (см. «Мир ПК», №2/99, с. 23), то на вычислениях с плавающей запятой недотягивал даже до своей тактовой частоты, находясь на уровне Pentium 100—133.

Дальше — больше. Разрыв в частотах стремительно увеличивался. Так, процессор Cyrix MII с тактовой частотой 250 МГц претендовал уже на значение 366 согласно P-рейтингу.

Одновременно с развитием основного модельного ряда компания Cyrix предприняла попытку запустить в производство кристалл MediaGX, реализующий концепцию PC-on-a-Chip. Суть концепции довольно привлекательна: в одном кристалле объединить ЦП, сопроцессор, кэш-память и блок ММХ, контроллеры памяти и устройств PCI, а заодно и графический адаптер (в чипе-компаньоне при этом расположить южный мост и устройство обработки звука).

Однако дела Cyrix, не имеющей собственных производственных мощностей, шли не слишком успешно. Сначала компания оказалась в составе National Semiconductors, а немногим более года назад была приобретена компанией VIA Technologies, которая кроме Cyrix купила еще и компанию Centaur — в прошлом подразделение IDT, занимавшееся разработкой процессоров (в частности, IDT WinChip).

Таким образом, в составе VIA начали работу сразу два подразделения, специализирующиеся на процессорах: Centaur трудился над устройством под кодовым названием Samuel, а Cyrix — над проектом Joshua.

В начале 2000 г. VIA объявила о выходе процессора Cyrix III, подразумевая, впрочем, под этим именем Joshua. Однако до лета окончательно отладить этот кристалл так и не удалось, поэтому под тем же именем был представлен Samuel. Таким образом, в новом процессоре от Cyrix осталось только имя. VIA Technologies предпочла разработку одного коллектива, воспользовавшись «раскрученной» маркой второго. Такова краткая предыстория появления нового процессора под торговой маркой Cyrix III.

Довольно слов, к барьеру...

Судя по описанию, новый кристалл Cyrix III — вполне реальный конкурент Celeron. Процессор проектировался в первую очередь для рынка недорогих ПК, но с запасом на будущее. Об этом свидетельствуют вдвое большие частота системной шины и объем кэш-памяти как первого, так и второго уровня, а также наличие команд 3DNow!. Но одно дело спецификация... Не стоит забывать, что об истинных возможностях можно судить только по результатам реальных нагрузок.

Мы провели тестирование кристалла VIA Cyrix III, работающего на тактовой частоте 533 МГц, сравнив его с аналогичным по скорости процессором Intel Celeron.

Результаты первых же испытаний (тест на скорость обмена с памятью: чтение, запись и копирование на массиве данных объемом 4 Мбайт) поставили под сомнение истинность заявленных VIA характеристик. Несмотря на вдвое большую частоту системной шины, Cyrix показал в среднем более низкую скорость обмена с памятью, чем Celeron. Причем при использовании MMX — во всех режимах. Однако доступ по случайно выбранным адресам дал несколько иную картину. Если область, из которой осуществлялось чтение, была небольшой, лучшие результаты демонстрировал Celeron, а в тех случаях, когда ее размеры существенно превосходили кэш, вперед вырывался Cyrix.

Скорее всего, дело в том, что у Cyrix хуже оптимизирован блок работы с памятью. И в первую очередь это становится заметным при достаточно высокой скорости обмена. При произвольном доступе основным «тормозом» становится уже оперативная память, а она на системе с Cyrix работает на более высокой частоте.

Сравнение скорости чтения данных с жесткого диска и скорости записи в видеопамять лишь дополняет общую картину, полученную после первой группы испытаний. В обоих случаях Celeron уступает Cyrix примерно на 20%. По всей видимости, определяющей здесь является частота, на которой работает системная шина.

Помимо скоростного конвейера обмена данными, о быстроте которого позволяют судить синтетические тесты, процессор должен «отрабатывать» заложенные в проекте мегагерцы, другими словами, производительность на реальных задачах. Отыскивая простые числа методом «решето Эратосфена», Cyrix легко опередил соперника. На выполнение этой задачи ему потребовалось почти вдвое меньше времени, и это на массиве данных большого объема. А вот работать с собственной кэш-памятью получается лучше у Celeron.

Быстрая сортировка по алгоритму Хоaра очень широко используется в прикладном программировании, причем не только там, где реально надо упорядочивать данные. Зачастую аналогичным методом решаются задачи, имеющие сложность N*ln(N). При сортировке массивов разных объемов в выбранных нами режимах результаты Cyrix оказались более чем скромными. И если в 16-разрядных приложениях они хоть как-то сопоставимы с показателями Celeron, то в 32-разрядных — Cyrix безнадежно отстает. Это более чем странно, поскольку продукт VIA проектировался в первую очередь для современного парка машин.

Одним из критериев оценки производительности ЦП является сжатие и распаковка данных. Существуют две категории ПО для сжатия данных: приложения, которые активизирует пользователь (задавая в командной строке соответствующие параметры), и драйверы, которые в фоновом режиме осуществляют сжатие информации при записи на жесткий диск и ее распаковку при чтении. Очевидно, что от подобных программ требуется быстрая работа. В идеале суммарное время упаковки данных и записи обработанного объема на жесткий диск не должно превосходить времени записи несжатых данных. Коэффициент сжатия в этом случае зачастую приносится в жертву скорости работы. В наших тестах фигурирует как программа, сжимающая текст «более плотным» алгоритмом LZH, так и программа, использующая «быстрый» алгоритм LZW. При выполнении обоих тестов Cyrix продемонстрировал значительное отставание от Celeron, причем в случае «быстрого» алгоритма — более чем вдвое.

При оптимизации процессов на производстве или реализации искусственного интеллекта в игровой программе зачастую возникают задачи, которые имитируют тест на нахождение кратчайшего пути в графе методом Дейкстры. Celeron справился с такой задачей в среднем за 0,028 с, а Cyrix — за 0,065 с, т. е. почти в 2,5 раза медленнее.

Не думай о секундах свысока...

Разобравшись с математикой целых чисел, перейдем к задачам, требующим вычислений с плавающей запятой. В достопамятные времена, когда компьютеры собирались из дискретных элементов и занимали несколько этажей здания, одной из основных сфер их применения были научные расчеты. Строго говоря, научные расчеты проводились и до появления первых ЭВМ. Например, «компьютер», на котором «обсчитывали» первую атомную бомбу, представлял собой длинную комнату, в которой в несколько рядов сидели сотрудники с арифмометрами и передавали друг другу по цепочке карточки с числами. Любопытно, кстати, что и сегодня самый мощный в мире суперкомпьютер тоже предназначен в основном для расчетов ядерных взрывов *.

Говоря «самый мощный», мы подразумеваем, что существует некая единица для измерения вычислительной мощности системы. В настоящее время для этой цели широко используются тест Донгарра и тест Ветстоуна.

Результаты теста Донгарра, усложненного нами для более разностороннего анализа, приведены на рис. 1.

Вертикальной линией отмечен объем данных 78 Кбайт («классическая» постановка задачи для теста Донгарра)

Рис. 1. Производительность ЦП при решении системы линейных уравнений

Достаточно взглянуть на график, чтобы понять: комментарии излишни. Отставание в 15 раз не оставляет никакой надежды тем, кто решится с помощью Cyrix хотя бы изредка заниматься вычислениями с плавающей запятой.

В тесте Ветстоуна Celeron продемонстрировал производительность 375 MWhetstones, тогда как Cyrix — только 46. Любопытно, что испытанный нами два года назад Cyrix 6Ё86MX, работавший на тактовой частоте всего 187 МГц, показал производительность 80 MWhetstones, т. е. в 1,74 раза большую, чем его 533-МГц наследник.

От научных расчетов эпохи начала развития вычислительной техники перейдем к задачам, реально используемым в науке сегодня.

Итоги выполнения программы, определяющей оптические коэффициенты смеси полидисперсного водяного конденсата с воздухом, дали обильную пищу для размышлений: соотношение производительности Celeron и Cyrix отличалось более чем на порядок. Создается впечатление, что Cyrix вообще не имеет блока вычисления с плавающей запятой, а все инструкции сопроцессора эмулируются на уровне микрокода целочисленного ядра.

При решении системы дифференциальных уравнений в частных производных методом конечных разностей Cyrix опять безнадежно отстал от Celeron. Заметим, что в одном из измерений его производительность в точности совпала с производительностью Pentium-100. И это при 7,5-нс SDRAM памяти у Cyrix III против 80-нс FPM у Pentium!

Чтобы оценить эффективность применения исследуемыми процессорами команд MMX, были рассмотрены задачи по обработке цифрового звука и растровой графики. С микшированием восьми каналов звука разных форматов (8- и 16-разрядные, моно- и стереосигналы, с различной частотой дискретизации) в один стереофонический канал оба соперника справились вполне сносно. Однако для преобразования сигнала длительностью в одну минуту Celeron затратил 0,47 с, в то время как Cyrix — 0,85 с. Разница почти вдвое — и, увы, не в пользу Cyrix.

Холостой выстрел?

Традиционные для наших испытаний тесты из пакета PC WorldBench определяли производительность компьютера при работе с наиболее распространенными Windows-приложениями.

Ни в одном из них Cyrix не удалось опередить Celeron. И если при работе в офисных пакетах разница не слишком велика (около 10%), то на графических приложениях отставание Cyrix более ощутимо (в среднем более чем в полтора раза). Объяснение простое: в первом случае основная тяжесть ложится на дисковую систему, которая работает с Cyrix чуть быстрее, чем с Celeron, а во втором — довольно объемную работу приходится выполнять именно процессору. В тесте на многозадачность отставание составило почти 25%.

Вычислительную мощь всей системы (процессор, жесткий диск, оперативную память, чипсет, видеоадаптер) достаточно точно характеризует суммарный индекс производительности, также определяемый тестовым пакетом PC WorldBench. В нашем случае разница в индексах составила около 20%. И хотя вклад процессора в копилку производительности ПК здесь не столь велик, впору делать вывод о ближайшей перспективе проектирования машин на кристаллах компаний... ну, например, V и A. Назвать аутсайдера?

И наконец, чего следует ожидать от компьютеров на базе испытуемых процессоров в наиболее динамично развивающейся сегодня (и наиболее ресурсоемкой) области трехмерных игр? С помощью пакетов 3DMark и 3DMark MAX мы получили уже знакомые результаты. Cyrix и здесь сильно отстал от конкурента. Только если в первом случае Celeron опередил его почти в 2,5 раза, то во втором разница сократилась до 35%. За счет чего? При сравнении полученных результатов с итогами тестирования процессоров Pentium III и Athlon (см. «Мир ПК», №9/2000, с. 14) напрашиваются некоторые выводы.

Первая версия теста 3DMark уже может определять наличие 3DNow!, но еще не умеет распознавать команды SSE. Вторая (3DMark MAX) — умеет и то и другое. Однако одно дело научиться определять ту или иную возможность (для этого достаточно заглянуть на сервер Intel и скопировать оттуда несколько строк в свою программу), и совсем другое — написать тестовые программы, оптимизированные под конкретное оборудование. Скорее всего, второе на шаг отстает от первого. Другими словами, в первом тесте все вычисления с плавающей запятой выполняются с помощью стандартного устройства FPU (сопроцессор), а во втором используется именно блок 3DNow!, если удалось его обнаружить. Если это так, то блок 3DNow! помог Cyrix лишь уменьшить разрыв, но никак не обогнать Celeron. Тогда уже следующая модель Celeron-566, несущая на борту блок SSE, не оставляет Cyrix никаких шансов. Даже если VIA в ближайшее время, не меняя архитектуры, выпустит процессор c частотой 1,5 ГГц.

После каждых испытаний положено делать выводы. А желательно еще и привести рассуждения о том, что де новый процессор, хотя и не... (нужное вписать), но тем не менее... (тоже вписать). Представители VIA, упреждая критику, говорят о том, что их питомец не претендует на высокие места в рейтингах. Даже принимая во внимание эти заявления, с сожалением приходится констатировать, что Cyrix III, смело бросивший вызов соперникам, пока весьма далек от совершенства.

Редакция благодарит компании Abit Computer Co., VIA Technologies Inc., «ПИРИТ», РА «Фантазия» и «Энко-Электроникс» за предоставленное для тестирования оборудование.


Тестовая платформа

Тестовые испытания проводились на системе следующей конфигурации:

  • процессор — Intel Celeron 533 МГц (Mendocino)/VIA Cyrix III 533 МГц;
  • системная плата — Abit SE6 (набор микросхем i815E);
  • оперативная память — 128 Мбайт (2x64 Мбайт PC133; 7,5 нс);
  • жесткий диск — Quantum LA13A008; 13,0 Гбайт (IDE primary master);
  • дисковод компакт-дисков — Lite On 48x (IDE primary slave);
  • дисковод Zip-100 — Panasonic (IDE secondary master);
  • видеоадаптер — встроенный i752 AGP 2X;
  • звуковая плата — встроенный AC?97;
  • операционная система — Windows 98 SE.

Для оценки производительности ЦП были использованы тесты журнала «Мир ПК», а для комплексной оценки системы в целом — новый пакет PC WorldBench 2000, содержащий обширный набор тестов, определяющих быстродействие системы при работе на офисных и Internet-приложениях, графических пакетах и других распространенных задачах.


Основные характеристики Celeron и Cyrix III
 CeleronCyrix III
Тактовая частота, МГц533533
ИсполнениеPPGA 370PPGA 370
Частота системной шины, МГц66133
Объем кэш-памяти 1-го уровня, Кбайт16 (данные) + 16 (инструкции)64 (общий)
Объем кэш-памяти 2-го уровня, Кбайт128 256
Частота работы кэш-памяти 2-го уровня, МГцПолная частота ЦППолная частота ЦП
Целочисленные SIMDMMXMMX
SIMD для чисел с плавающей запятойНет3DNow!
Технологический процесс, мкм0,220,18
Напряжение питания ядра, В2,02,2
Рассеиваемая мощность, Вт> 25< 10
Цена, долл.6575
Примечание. Данные по Celeron приводятся для модели Mendocino.

Результаты тестирования процессоров Celeron и Cyrix III
ТестыCeleronCyrix III
НАУЧНЫЕ ЗАДАЧИ
Производительность системы, MWhetstones37546(80)1
Скорость чтения при произвольном доступе к ОЗУ, Мбайт/с
4 Кбайт
128 блоков по 32 байт35,832,4
128 Кбайт
4 блока по 32 Кбайт23,419,9
1 Мбайт
32 блока по 32 Кбайт10,214,5
4 Мбайт
128 блоков по 32 Кбайт9,217,5
Скорость обмена с внешними устройствами, Мбайт/с
чтение с жесткого диска6,3312,5
запись в видеопамять27,7715,7
Нахождение простых чисел методом "решето Эратосфена", отн. ед.
1 Кбайт286616
3 Кбайт58128
1 Мбайт719450
3 Мбайт190109
40 Мбайт1824950
Сортировка массива, с
63 Kбайт
реальный режим 16-бит0,0560,090
защищенный режим 16-бит0,2310,250
защищенный режим 32-бит0,2000,042
16 Mбайт
защищенный режим 32-бит16,0384,51
Сжатие данных, с
по алгоритму LZH (22 Kбайт)
реальный режим 16-бит1829
защищенный режим 16-бит7883
по алгоритму LZW (6 Mбайт)
защищенный режим 32-бит (сжатие)6341357
защищенный режим 32-бит (распаковка)246484
Нахождение кратчайшего пути в графе, мc0,0280,065
Вычисление оптических коэффициентов, отн.ед.125312956
Решение систем дифференциальных уравнений в частных производных, % от Pentium-100
40 Кбайт796100(103)
400 Кбайт829109(111)
4 Мбайт898137(139)
МУЛЬТИМЕДИЙНЫЕ ЗАДАЧИ
Обработка звука, с 30,470,85
Скорость ЦП в геометрических вычислениях (тест 3DMark), отн. ед.
CPU Geometry Speed6,0912,740
Synthetic CPU 3D Speed (тест 3DMark MAX)4,5553,353
1 В скобках приведен результат для системы на процессоре Cyrix 6x86MX-187. 2 Режим адресации видеопамяти через окно. Шина AGP отсутствует или не используется (например, в «чистом» DOS) 3 Микширование звука (продолжительность звучания сигнала 1 мин) с помощью команд ММХ

* Компьютер ASCI Red, собранный на 9632 процессорах Intel и установленный в Sandia National Labs (Альбукерк, шт. Нью-Мексико, США), эксплуатируется в интересах Министерства энергетики США.

735