долю потребностей среднего пользователя как в профессиональной сфере (Интернет, офис, работа с базами данных и финансовыми документами), так и в области домашних развлечений (аудио, видео, мультимедиа, справочные и обучающие программы, большая часть игр и т.п.) покрывают Celeron и Sempron. Если объективно оценивать ситуацию, то окажется, что основным недостатком этих процессоров является их «непрестижность». Средний ценовой диапазон представлен процессорами Athlon 64 и Pentium 4. За счет более высокой частоты шины и большего объема кэш-памяти они гораздо эффективнее обрабатывают значительные массивы данных. Да и диапазон рабочих частот у них повыше. Поэтому их целесообразно использовать для ресурсоемких приложений, таких как трехмерные компьютерные игры, видеосжатие, генерация фотореалистичных изображений, научные расчеты и т.п. В общем, они предназначены для тех, кто не согласен поступиться универсальностью ради экономии. Но есть категория людей, которые хотят иметь все самое лучшее и не привыкли ни в чем себе отказывать. К этой же группе можно отнести профессионалов, работающих с ресурсоемкими приложениями, и игроков, увлеченных трехмерными играми и не стесненных в средствах. Специально для них придумали Pentium Extreme Edition и Athlon 64 FX. В отличие от других моделей процессоров, выводимых на рынок «линейками», т.е. небольшими партиями, изготовленными по одинаковой технологии и различающимися отдельными характеристиками, процессоры верхнего уровня появляются строго по одному. Действительно, самый мощный процессор может быть только один.

Intel Pentium Extrim Edition 955 AMD Athlon 64 FX 60

Вычислительная техника устаревает чрезвычайно быстро, причем прежде всего морально. Система, бывшая пару лет назад одной из самых мощных, сегодня уже воспринимается как весьма посредственная. Изделия верхнего уровня в какой-то степени защищает от морального старения имя: например, название Pentium Pro, несмотря на несерьезную по сегодняшним меркам максимальную тактовую частоту 200 МГц, до сих пор внушает уважение. Просто потому, что эти процессоры никогда не были дешевыми.

Но самое большое влияние выпуск новейшего сверхмощного процессора оказывает, конечно, на престиж самого производителя. Поэтому и стараются ведущие фирмы, представляя новую модель, не отстать от конкурента. Хотя доля их как в общем объеме выпуска, так и в извлекаемой прибыли чрезвычайно мала.

Сегодня у нас в тестовой лаборатории оказались два только что представленных (собственно, один из них был получен для проведения тестирования даже до официального представления) процессора: AMD Athlon 64 FX 60 и Intel Pentium Extreme Edition 955. Первый интересен тем, что AMD впервые выпустила в линейке FX двухъядерный процессор. До этого, напомним, самыми мощными были одноядерный Athlon 64 FX 57, работающий на частоте 2,8 ГГц и двухъядерный 2,4-ГГц Athlon 64 4800+. Частота работы нового процессора составляет 2,6 ГГц.

Intel придерживается точки зрения, что «экстремальные» модели процессоров должны заметно отличаться по свойствам от всех остальных. Напомним, что первый Extreme Edition, единственный из всех ЦП, предназначенных для ПК, обладал кэш-памятью третьего уровня. В следующей модификации, несущей два ядра (840-я), оба они поддерживали технологию HyperThreading, отключенную в остальных моделях двухъядерных процессоров. Последняя модель, 955-я, в значительной степени повторяет 840, но обладает более высокой частотой ядра (3,46 против 3,2 ГГц) и шины (1066 против 800 МГц), а также имеет по 2 Мбайт кэш-памяти второго уровня для каждого ядра (за счет технологических норм, уменьшенных до 0,065 мкм).

В связи с тем, что для массового пользователя наибольший интерес представляет не столько сравнение производительности последних моделей конкурентов, сколько сам прогресс в целом (т.е. увеличение производительности по сравнению с более ранними моделями), одна и та же группа тестов была проведена на четырех процессорах.

Конечно, не обошлось без неожиданностей, причем почему-то все они оказались связаны с процессорами Intel.

Первое впечатление от процессора Intel Pentium Extreme Edition 955 — очень высокая температура при работе в BIOS Setup — 90+2 °C. Собственно, этот параметр проверяется сразу после сборки — если система подает признаки жизни, то следует запустить BIOS Setup и, выведя на экран окно аппаратного мониторинга, минут десять понаблюдать за температурой компонентов компьютера. Мы честно сделали несколько попыток переставить теплоотвод, повернув его на 90 или 180°, а также заменить термопасту, но это ничего не изменило.

К счастью, это не самый важный показатель. Дело в том, что режим работы компьютера в BIOS Setup отнюдь не является простоем, в то время как в Windows и других современных ОС в отсутствие нагрузки процессор действительно большую часть времени «отдыхает», а его температура при этом опускается примерно до 60°.

Более того, как показывает практика, даже под нагрузкой процессор не достигает тех температур, которые можно наблюдать в BIOS Setup. Так, при выполнении вычислительных задач, интенсивно использующих блок вычислений с плавающей точкой (FPU), температура поднимается приблизительно на 20°, а в играх (на примере 3DMark03 и F.E.A.R.) разница составляет всего около 15°.

Вторая неожиданность, или даже неприятность, ожидала нас с 3600-МГц процессором Intel Pentium 4. Так как для тестов процессорного флагмана представительством Intel нам был передан не только сам ЦП, но и системная плата на новом НМС Intel 975, мы решили протестировать на ней помимо Extreme Edition 955 еще и предыдущий 3600-МГц процессор. Однако, безукоризненно работая с Pentium-955, эта плата временами показывала далеко не самые высокие результаты совместно с Pentium 4-3600. Также наблюдались и некоторые сбои. По-видимому, то ли сама плата, то ли ее BIOS, а возможно, и новый набор микросхем i975 отлажены еще не до конца.

В отличие от Intel с процессорами AMD все прошло гладко — они функционировали стабильно и показывали вполне воспроизводимые результаты. Пожалуй, в этом плане компании Intel, у которой почти каждый очередной процессор требует применения нового НМС, следовало бы поучиться у конкурента.

В принципе сегодня практически любой новый процессор являет собой небольшой эволюционный шажок в сторону планомерного увеличения производительности, не неся в себе никаких революционных идей. Соответственно и полученные нами результаты оказались вполне прогнозируемы: те задачи, которые требуют напряженных вычислений, заметно быстрее (иногда в разы) выполняются на процессорах AMD, а те, что используют интенсивный обмен с памятью, напротив, демонстрируют преимущества процессоров Intel (а точнее, того типа памяти, с которым они работают). Интересно, правда, что по наиболее быстрому виду пересылки данных с использованием инструкций SSE, управляющих работой кэш-памяти, победу одержала компания AMD — явно сказываются преимущества встроенного контроллера памяти.

В то же время системы Intel используют более быструю память типа DDR2, да и кэширование данных у них организовано эффективнее. А «тонкая» технология, позволяющая удвоить объем кэш-памяти L2, в еще большей степени подчеркивает это преимущество.

Здесь, кстати, необходимо сделать оговорку. Вот уже много лет нам не приходилось тестировать процессоры Celeron, предназначенные для нижнего ценового диапазона. А между тем если для старших моделей процессоров, обладающих большим объемом кэш-памяти, преимущества скоростного вычислительного блока AMD и быстрой системы кэширования Intel в значительной степени приводят к паритету по производительности, то для младших, при скромном размере кэш-памяти, преимущества Intel должны сходить на нет. Правда, и AMD применяет для маркировки своих Sempron’ов совершенно другую шкалу, в результате чего Sempron при том же номере модели (рейтинге) обладает существенно меньшей производительностью, чем Athlon 64. Но в любом случае выводы, сделанные на основе тестирования процессоров верхнего уровня, неправомерно механически переносить на массовые модели того же производителя.

А вот тестовые программы SiSoft Sandra и PassMark оценивают различие в производительности процессоров куда скромнее, отдавая первое место в целочисленных вычислениях процессору AMD, а с плавающей точкой — Intel. Здесь скорее всего сказывается эффект компилятора — при оптимизации кода, как правило, количество выполняемых процессором внутренних инструкций уменьшается, а количество обращений к памяти сохраняется, поэтому на результат сильно влияет именно подсистема памяти. Кроме того, немаловажным оказывается и то, под какой именно процессор производится оптимизация. Догадаться нетрудно, особенно учитывая, что около 80% процессорного рынка по-прежнему принадлежит корпорации Intel. Да и высокоэффективные программные средства Intel для разработки и оптимизации программ хорошо известны.

В области трехмерной графики также не все однозначно. И если в программах, написанных с использованием OpenGL, преимущество процессоров AMD не вызывает сомнений, то для DirectX ситуация не так проста. Мало того, что тесты FutureMark 3DMark03 и 3DMark05 сами по себе для общей и процессорной производительности дают прямо противоположные результаты, так эти соотношения еще и меняются местами при переходе от 3-й к 5-й версии.

При домашнем использовании, кроме игр, пожалуй, есть еще только одно ресурсоемкое применение ПК — видеозапись. Процесс оцифровки аналогового сигнала из эфира, с видеокассеты или с аналоговой видеокамеры требует достаточно высоких вычислительных мощностей для сжатия изображения. И здесь требования гораздо жестче, чем для игр, — при недостаточной мощности самым легким последствием может быть пропуск кадров, т.е. невосполнимая потеря качества видеоматериала.

При видеозаписи многопоточность может либо применяться, либо нет. В простейшем случае видеосжатие направляется в один поток, а аудиосжатие — в другой. Сначала рассмотрим, как реагируют на это процессоры AMD, не обладающие технологией HyperThreading, а потому более прогнозируемые в результатах. Отношение частот FX 60 и 3500+ составляет 1,18 и примерно равно отношению значений производительности этих процессоров при использовании одного ядра. В случае видео невысокого разрешения этот параметр при видеосжатии (без аудио) составляет примерно 1,34, т.е. больше ожидаемого. Здесь уместно вспомнить, что у FX 60 вдвое больший объем кэш-памяти, при этом для буфера кадра 384Ё288 точек при 24-разрядной глубине цвета (что соответствует несжатому сигналу) необходимо 324 Кбайт. Наиболее вероятно, что процессу, происходящему в реальном времени, потребуется двойная буферизация, т.е. суммарный объем буферов составит 648 Кбайт и они не будут помещаться в 512-Кбайт кэш-память Athlon 64 3500+, в отличие от 1024-Кбайт Athlon 64 FX 60. За счет этого разница и увеличивается на 16%. А вот при размере кадра 768Ё576 точек необходимый объем памяти составляет уже более 2,5 Мбайт, что выходит за пределы кэш-памяти обоих процессоров и заставляет их интенсивно работать с основным объемом оперативной памяти. Производительность памяти для обоих процессоров одинакова, следовательно, отношение должно быть между 1,00 и 1,18. Точное значение составляет 1,12, что полностью согласуется с ожидаемым. Это все касалось кодеков, не использующих многопоточность в процессе сжатия, т.е. версий 4.12 и 5.2.1. У кодека версии 6.1 заявлена поддержка многопоточности, и для него преимущество нового процессора AMD составляет уже 38% вместо прежних 12%. То есть многопоточность действительно используется. Правда, как-то не слишком эффективно: вместо двукратного роста всего лишь каких-то 20%. Видимо, равномерно распределять нагрузку между ядрами кодек DivX версии 6.1. еще не научился.

Но обычно сжимать приходится и видео, и аудио одновременно. В этом случае двухъядерный процессор «экономит» еще и время, необходимое для сжатия звука. Второе ядро, даже при частичном распараллеливании вычислений кодеком последней версии, эффективно подбирает дополнительную нагрузку, формируемую аудиопотоком, в результате чего время сжатия как с аудио, так и без него оказывается практически одинаковым.

С Pentium Extreme Edition 955 ситуация несколько сложнее: за счет технологии HyperThreading он виден системе как четыре логических ядра. Если сжимать требуется только видеоряд, этот процессор показывает наилучшие результаты во всех номинациях. Однако при одновременном аудио- и видеосжатии уже возможны варианты. Операционная система даже не подозревает о неравноценности присутствующих процессоров и потому запросто может предложить оба имеющихся потока двум логическим устройствам одного ядра, оставив второе вообще без нагрузки. По-видимому, иногда именно это и происходит, иначе трудно объяснить, почему добавление аудиосжатия практически всегда приводит к увеличению времени кодирования, чего мы не наблюдали в случае с Athlon 64 FX 60. Тем не менее, вероятно, за счет глубокой оптимизации кодека под архитектуру процессоров Intel именно продукты этой фирмы остаются наилучшим выбором для компьютера, предназначенного для обработки видео.

Зато по аудиосжатию бесспорным лидером является новый процессор компании AMD. Аудиосигнал по сравнению с видеосигналом имеет гораздо меньший объем. Кроме того, человеческое ухо обладает значительно большей чувствительностью к искажениям, нежели глаз, из-за чего соотношение между интенсивностью работы с памятью и объемом вычислений при аудиообработке существенно смещается в сторону последних. Поэтому даже сравнительно старый Athlon 64 3500+ нередко выигрывает состязание у самого мощного процессора компании Intel.

Как в офисных приложениях пакета SYSmark, так и в трехмерной графике OpenGL SPECViewperf процессор Athlon 64 FX 60 стал безусловным лидером, обойдя конкурентов даже в конфигурации с вдвое меньшим объемом установленной оперативной памяти. И это при том, что все тесты этой группы, как показали измерения, оказались чувствительны к объему ОЗУ.

Производительность процессоров — приложения
Производительность процессоров — набор инструкций

С выходом Athlon 64 FX 60 сегмент высокопроизводительных вычислений полностью перешел во власть двухъядерных (и с большим числом ядер) решений, но существующее ПО пока не очень вразумительно оценивает свойства многоядерных процессоров. Чтобы ликвидировать этот пробел, была написана программа для решения задачи, допускающей эффективное распараллеливание, — построения фрактала Жюлиа (подробнее об этом см. «Мир ПК-диск», №11/05). На графике («Производительность в многопоточном режиме») показана зависимость производительности процессора от числа формируемых потоков при изменении количества последних от 1 до 4096 с шагом в 2 раза. Для типичного одноядерного процессора (например, Athlon 64 3500+) зависимость имеет вид горизонтальной кривой (т.е. неизменной производительности) при количестве потоков примерно до сотни, затем производительность постепенно снижается за счет накладных расходов на создание и уничтожение потоков и переключения между ними. Производительность типичного двухъядерного процессора (например, Athlon 64 FX 60) скачком увеличивается вдвое при переходе с одного на два потока и в дальнейшем ведет себя аналогично предыдущему варианту. В случае с применением технологии HyperThreading производительность также претерпевает скачок, но за счет того, что логические ядра не являются полноценными процессорами, величина скачка составляет только 25%. Впрочем, и 25% — не так уж мало. Такого прироста можно было бы ожидать лишь от увеличения тактовой частоты до 4,5 ГГц, что пока находится за пределами возможностей современных технологий. Хотя в данном случае это всего лишь позволяет 3600-МГц процессору Pentium 4 догнать конкурента от AMD, работающего на тактовой частоте 2200 МГц и имеющего рейтинг 3500+. Двухъядерный же процессор, оснащенный технологией HyperThreading, демонстрирует увеличение производительности в 2,5 раза начиная с четырех— восьми потоков. Правда, это все равно не позволяет ему догнать флагмана компании AMD.

Производительность в многопоточном режиме

Возвращаясь к вопросу видеокодирования, можно обратить внимание на тот факт, что процент прироста производительности за счет HyperThreading и процент мощности, отдаваемый второму логическому устройству кодеком DivX, практически совпадают. Поэтому можно предположить, что последняя версия кодека оптимизирована не под многоядерность, а именно под HyperThreading.

* * *

Ограничения по тепловыделению пока не позволяют двухъядерным процессорам достичь тех же тактовых частот, что и у их одноядерных собратьев. Тем не менее разрыв сокращается.

По части принципиальных новшеств у компании AMD можно отметить только сам факт перехода линейки FX на два ядра — новый процессор отличается от 4800+, представленного более полугода назад, лишь увеличенной на 200 МГц тактовой частотой. У Intel нововведений больше. В сущности первый двухъядерный Extreme Edition 840 и есть тот самый «блин комом», который Intel выпустила второпях, лишь бы обогнать конкурента, давно оповестившего мир о том, что двухъядерные процессоры для персоналок уже на подходе. Новый процессор имеет более высокие тактовую частоту и частоту шины, а также увеличенный в 2 раза объем кэш-памяти второго уровня. Особенно привлекательно, конечно, увеличение частоты шины до 1066 МГц, что позволяет работать в наиболее оптимальном синхронном режиме с памятью, рассчитанной на 533 МГц. Вместе с 2-Мбайт кэш-памятью это обеспечивает ему наивысший уровень производительности при работе с памятью. По сути дела тестом, анализирующим работу с памятью, можно считать и задачу по решению системы линейных уравнений, разработанную первоначально для оценки производительности вычислений с плавающей точкой. Кроме того, изделию Intel удалось наконец хоть ненамного обойти конкурента в скорости видеосжатия, где Intel ранее традиционно была сильна, но в прошлом году временно уступила лидерство. В большинстве же остальных тестов по-прежнему лидируют процессоры компании AMD.

Так что процессорная гонка продолжается. Нас же, простых пользователей, появление новых сверхмощных процессоров должно радовать хотя бы тем, что оно рано или поздно приведет к снижению цен на все остальные.

Редакция благодарит российские представительства компаний AMD и Intel за процессоры, предоставленные для проведения тестирования.


Как мы тестировали

Тестовая платформа была выполнена на базе системных плат Gigabyte GA-K8N-SLI для AMD и Intel D975XBX для Intel, 512-Мбайт ОЗУ типа DDR 400 PC3200 (два модуля по 256 Мбайт) для процессоров AMD и 1024-Мбайт ОЗУ типа DDR2-533 PC4200 (два модуля по 512 Мбайт) для Intel, 256-Мбайт видеоплаты GeForce 6600GT (PCI Express), 200-Гбайт жесткого диска Western Digital WD2000JD-00HBB0 (SATA 150, 7200 об/мин), 525-Вт БП HPU-3S525. ОС — Windows XP SP1.

Разрешение экрана (кроме игровых тестов) составляло 1024x768 точек при отображении 16,7 млн. цветов.

К сожалению, нам не удалось добиться идентичности условий тестирования для процессоров Intel и AMD. Связано это в первую очередь с тем, что в настоящее время ЦП (или, вернее, наборы микросхем, предназначенные для них) работают с различными типами памяти. И если для Intel мы смогли использовать 1-Гбайт память типа DDR2, то для AMD у нас нашлось только 512 Мбайт типа DDR. Тем не менее «ополовинивать» память систем на процессоре Intel было признано нецелесообразным. С одной стороны, объем в 512 Мбайт для системы верхнего уровня сегодня явно недостаточен, а с другой — все результаты измерения складываются в базу знаний, из которой потом, по мере надобности, извлекаются. В этом году планируется перевод процессоров AMD на память типа DDR2, поэтому в дальнейшем мы будем проводить все тесты именно с 1-Гбайт DDR2. Поэтому применение лишь 512-Мбайт памяти лишило бы нас возможности использовать полученные результаты для дальнейшего сравнения.

Вместо этого было проведено лишь несколько тестов на 3600-МГц процессоре Intel Pentium 4 с объемом памяти 512 Мбайт, для которых мы получили ориентировочные коэффициенты пересчета. Кроме того, в этих измерениях был использован видеоадаптер Albatron GeForce PCX 5750. Так как этот видеоадаптер, безусловно, значительно слабее использованного в настоящем тестировании, он сильнее нивелирует производительность системы процессор — память и дает лишь нижнюю оценку для коэффициента пересчета. Кроме того, при построении диаграмм в тех случаях, для которых отсутствовали данные, коэффициент пересчета был принят равным единице, что в еще большей степени снизило прогнозируемую оценку для системы на AMD Athlon 64 FX 60 с 1024 Мбайт оперативной памяти.


"Результаты игровых тестов Kkrieger и F.E.A.R., кадр/с"
"Результаты специализированных тестов — видеосжатие, время сжатия, мин:с"
"Результаты тестов FutureMark, баллы, при разрешении, точки"
"Результаты тестов SiSoft Sandra 2005 SP3 и Performance Test"
882