Вне зависимости от того, следует ли считать архитектуру IA-32 тупиковой, которую вытеснит IA-64, или нет, К7 свидетельствует о достижении процессорами x86 новых рубежей как по производительности, так и по соотношению стоимость/производительность.

Традиционно низкая стоимость микропроцессоров AMD и материнских плат на их основе делает новые продукты компании в отечественных условиях особенно привлекательными. К тому же, как мы увидим ниже, при равных тактовых частотах К7 превосходят по производительности конкурирующие с ними Intel Pentium III (но не высокочастотные Pentium III Coppermine с интегрированным кэшем второго уровня).

Кроме того, если ранее AMD не обеспечивала поддержку SMP-архитектур, то теперь такая функция реализована, причем ее следует признать даже более эффективной, чем у Intel. Это означает, что Athlon претендует и на новый для AMD сегмент рынка на многопроцессорные серверы. Все это и обуславливает очень высокий интерес к ним, в том числе и в России. Оставив в стороне финансовые, маркетинговые и тому подобные темы (которые, конечно, во многом влияют на успех продукции), обсудим только их технические особенности.

Микроархитектура AMD Athlon

Общее представление об микроархитектуре К7 дает рис. 1. В этой микроархитектуре немало усовершенствований по сравнению с AMD K6 [1], включая последнюю модификацию К6-3, и среди них достаточно трудно выделить одно, главное. (С моей точки зрения следует, однако, отметить, что К7 способен выполнять за такт больше команд.)

Рис. 1. Упрощенная схема микроархитектуры AMD K7

Начнем с кэша. Кэш-память первого уровня включает 2-канальные частично-ассоциативные (наборно-ассоциативные) кэши команд и данных емкостью по 64 Кбайт каждый. Это в вдвое больше, чем в К6-3, и вчетверо больше, чем в Pentium III (табл.1). Однако из-за того, что кэши команд и данных первого уровня в Pentium III являются 4-канальными частично-ассоциативными, во многих случаях их «эффективная» емкость, грубо говоря, увеличивается в два раза по сравнению с 2-канальной схемой.

Кэш данных К7 имеет 8 банков и обеспечивает одновременный доступ к двум 64-разрядным величинам при выполнении команд загрузки регистров/записи в память. Другой важной особенностью К7 является наличие в блоке кэша команд специальной кэш-памяти предварительного декодирования, которая используется декодерами команд. Напомним, что в современных высокопроизводительных х86-совместимых процессорах (включая Intel Pentium II/III и AMD K6/K7) произошел отказ от выполнения х86-команд, поскольку они неудобны для достижения максимума производительности. Вместо этого х86-команды декодируются в более простые и эффективные внутренние RISC-подобные команды фиксированной длины, которые собственно и исполняются микропроцессором [1]. В K7 таких декодера три, и они работают параллельно, поэтому кэш предварительного декодирования в существенной степени способствует увеличению пропускной способности.

Кроме того, кэш команд первого уровня в К7 содержит двухуровневый блок быстрой переадресации страниц TLB, используемый для преобразования виртуальных адресов в физические: TLB первого уровня имеет емкость 24 строки, а TLB второго уровня256 строк. Аналогичный блок TLB в кэше данных первого уровня включает TLB первого уровня емкостью 32 строки и TLB второго уровня емкостью 256 строк. Отметим, что емкость TLB по сравнению с К6 сильно возросла. Наконец, кэш команд первого уровня содержит большую таблицу предсказания переходов емкостью 2048 строк, что позволяет достигнуть высокой вероятности правильного динамического предсказания переходов. Несколько неожиданным является то, что емкость этой таблицы оказалась ниже, чем в К6.

Из декодеров команды попадают в ICU-устройство управления командами (рис. 1) емкостью 72 строки. AMD K7, как и Pentium III, является суперскалярным микропроцессором с внеочередным спекулятивным выполнением команд. Большая емкость устройства управления командами позволяет К7 эффективно использовать свои ресурсы: число функциональных исполнительных устройств в этом процессоре больше, чем в К6 и Pentium III.

А именно, К7 имеет 9 функциональных исполнительных устройств, которые являются конвейерными и способны к внеочередному выполнению команд. В числе этих 9 устройств: 3 адресных конвейера, 3 целочисленных конвейера и 3 конвейера с плавающей запятой. Соответственно этому К7 может выполнять до 9 команд за такт, что больше, чем в К6-3 и Pentium III. Общая длина целочисленного конвейера в К7 составляет 10 стадий (в Pentium III - не менее 10 стадий), а конвейера с плавающей запятой - 15 стадий.

Сама AMD характеризует К7 как суперскалярный (т.е. способный выполнять несколько команд за такт) и суперконвейерный процессор. Последнее означает, что конвейеры К7 имеют большую длину (много стадий). Это, как известно, облегчает увеличение тактовой частоты. И действительно, длина целочисленного конвейера в Alpha 21264 почти в 2 раза короче [2]. Поэтому, в частности, неудивительно, что максимальная достигнутая на сегодня тактовая частота К7 (1 ГГц) выше, чем у известных своими высокими частотами процессоров Alpha (700 МГц у Alpha 21264). Однако напомним, что увеличение числа стадий имеет и свой минус: длинные конвейеры сложнее заполнять, и поэтому эффективность их использования может оказаться ниже.

Емкость «целочисленного» планировщика команд составляет 18 строк; через него команды поступают как в целочисленные, так и в адресные функциональные устройства. Аналогичный планировщик команд с плавающей запятой имеет емкость 36 строк. На работе блока команд с плавающей запятой стоит остановиться подробнее.

Прежде всего отметим, что этот блок обеспечивает работу в соответствии со стандартами IEEE754 и IEEE854 с одинарной (32 разряда), двойной (64 разряда) и расширенной (80 разрядов) точностью. Кроме того, эти функциональные исполнительные устройства работают с данными в форматах команд ММХ и 3DNow!. Исполнительное устройство FSTORE выполняет команды загрузки регистров/записи в память. FADD, кроме сложения операндов с плавающей запятой, выполняет команды сложения из набора 3DNow! и ММХ-команды АЛУ и сдвига. FMUL, кроме умножения чисел с плавающей запятой, выполняет ММХ-команды АЛУ и умножения, команды 3DNow! с плавающей запятой, обращение чисел и специальные операции для поддержки деления.

Таким образом, К7 может одновременно выполнять сложение и умножение чисел с плавающей запятой в FADD и FMUL. Это дает пиковую производительность в 2 операции с плавающей запятой за такт, что вдвое больше, чем у Pentium III (мы не рассматриваем здесь мультимедийные команды, которые работают с одинарной точностью).

Это во многом и обуславливает тот факт, что именно по производительности с плавающей запятой К7 наиболее существенно опережает Pentium III (исключая Coppermine, что обусловлено иными причинами, которые мы рассмотрим ниже). Времена выполнения команд с плавающей запятой и пропускная способность (1 означает полностью конвейеризованную операцию) соответствующих функциональных исполнительных устройств приведены в табл. 2. Эти данные показывают, что время (длина конвейера) выполнения сложения в К7 на 1 такт больше, чем у Pentium III, зато умножение на 1 такт короче. Но гораздо важнее то, что умножение в К7 полностью конвейеризировано (пропускная способность равна 1 такту). У Pentium III это не так; по завершению умножения там возникает дополнительная задержка в 1 такт.

Обратимся теперь к мультимедийным командам К7, среди которых имеются и специализированные команды с плавающей запятой. Если ММХ-команды K7 совпадают с Intel x86, то поднабор команд AMD 3DNow! отличается от SSE. Общее число команд SSE равно 71, что много больше, чем в 3DNow!. В AMD K6-3 число команд 3DNow! равно 21; в AMD K7 к ним были добавлены еще 24 новые команды, в том числе 12 команд целочисленной математики (для обработки видео, распознавания речи и др.), 7 команд пересылки данных (используемых, например, в графических Web-приложениях) и 5 команд, ориентированных на цифровую обработку сигналов, не имеющие аналогов в Pentium III.

Не стану пытаться выяснять, что лучше - 3DNow! или SSE, укажу лишь на одну общую особенность: эти расширения позволяют поддерживающим их процессорам AMD и Intel достигать пиковой производительности при операциях с плавающей запятой одинарной точности в 2 раза больше, чем тактовая частота (то есть 2 операции за такт). Это стало возможным благодаря применению SIMD-команд с двухмерными векторами.

Большинство сложных научно-технических приложений требуют вычислений с двойной точностью, при работе с которой лишь K7 способен выполнять 2 команды за такт. Кроме того, для достижения максимума производительности необходимо, чтобы компиляторы генерировали коды, содержащие SIMD-команды при работе с плавающей запятой одинарной точности. На момент написания статьи подобные компиляторы автору не были известны. Кстати, новые процессоры Pentium III Willamette будут содержать SIMD-команды и для работы с двойной точностью.

Внешние интерфейсы и другие характеристики К7

Важнейшим компонентом, определяющим производительность микропроцессора, являются характеристики внешнего кэша второго уровня и внешней системной шины процессора. Начнем с кэша. Выделенная шина между К7 и кэшем второго уровня имеет ширину 64 разряда плюс 8 разрядов на поддержку кодов ECC. Максимальная емкость кэша второго уровня в К7 составляет 8 Мбайт; внешний кэш большей емкости сегодня не поставляется ни с одним микропроцессором.

Реально поставляемые в настоящее время AMD K7 комплектуются кэшем второго уровня емкостью 512 Кбайт, как и Pentium III (у Pentium III Xeon внешний кэш вместительнее; высокочастотные Pentium III Coppermine, напротив, имеют интегрированный кэш второго уровня емкостью всего 256 Кбайт).

Применение с К7 кэша второго уровня емкостью 512 Кбайт в определенном смысле наиболее эффективно, поскольку интегрированный в К7 контроллер кэша второго уровня содержит полные теги для кэша емкостью 512 Кбайт; при большей емкости кэша контроллер будет содержать только часть тега.

Сейчас при частотах K7 от 500 до 650 МГц кэш второго уровня работает на половинной частоте процессора, в моделях на 750/800 МГц применяется 2/5 частоты, от 900 МГц и выше - 1/3 частоты. Для сравнения, в Pentium III на шине кэша второго уровня используется половинная частота, но в Pentium III Xeon и Pentium III Coppermine кэш второго уровня работает на частоте процессора.

В К7 инженеры AMD впервые ввели поддержку SMP-архитектур, догнав в этом отношении Intel. Протокол, с помощью которого поддерживается когерентность кэша в K7, называется MOESI (от первых букв возможных состояний кэша-Modify, Owner, Exclusive, Shared, Invalid). По утверждению AMD, этот протокол впервые реализован в х86-совместимых процессорах.

Кэш первого уровня в К7 имеет отдельный snoop-порт, через который проходит трафик, обусловленной поддержкой когерентности. Трафик поддержки когерентности кэша также отделен от основного трафика и на системной шине, к рассмотрению которой мы и приступаем. Естественно, отделение snoop-трафика повышает эффективную пропускную способность шины, и, следовательно, эффективность SMP-конфигураций.

У шины AMD K7 есть два замечательных свойства. Во-первых, это не обычная общая шина, как в Pentium III, а коммутатор. Это очевидный плюс: коммутатор обеспечивает гарантированную пропускную способность для соединений «точка-точка», в то время как на общей шине возможны конфликты. Во-вторых, шина К7 имеет частоту 200 МГц (и может быть увеличена до 400 МГц). При ширине шины 64 разряда плюс 8 разрядов ЕСС она имеет пропускную способность 1,6 Гбайт/с при частоте 200 МГц против 800 Мбайт/с в 100-мегагерцевой шине Pentium III.

Такая более быстрая шина нужна не только для поддержки более быстрой оперативной памяти (скажем, РС133 или DDR), но и для обеспечения трафика ввода-вывода от шин PCI и графической платы. К этому вопросу мы еще вернемся при обсуждении наборов микросхем.

Такую высокую тактовую частоту системной шины AMD смогла достигнуть, в частности, благодаря более совершенной технологии синхронизации (управления временами событий). Собственно интерфейс системной шины К7 электрически совместим с протоколом шины Alpha EV6 [2]. Микропроцессор К7 подсоединяется через Slot A, который механически совместим со Slot 1, используемом в Pentium III. Соответственно число используемых контактов в Slot 1 и в Slot A совпадает (по 242).

Еще одной важной особенностью, влияющей на пропускную способность шины К7, является объем передаваемых по шине пакетов. Такая пакетная передача данных способствует конвейеризации обработки транзакций на шине. Для К7 размер пакета 64 байта (длина строки кэша), что вдвое больше, чем для Pentium III и AMD K6-3. При больших объемах передаваемых данных это, очевидно, плюс, но при маленьких передачах может несколько повысить задержки.

Другая важная особенность К7, способствующая эффективному использованию системной шины, является расщепленная обработка транзакций. Она, как известно, позволяет перекрывать выполнение различных транзакций во времени, разрешая начинать обработку новых транзакций, не дожидаясь завершения предыдущих. Если в Pentium III возможно выполнение до 8 транзакций на шине, то в К7 - уже до 24.

Теоретически максимальная емкость адресуемой шиной оперативной памяти в К7 составляет 8 Тбайт, но реально это может ограничиваться набором микросхем. В целом же следует сказать, что системная шина К7 по основным параметрам существенно превосходит шину Pentium III.

Приведем некоторые технологические данные об AMD K7. Его начали изготавливать по 0,25-микронной технологии, и при площади 184 кв. мм он содержит 22 млн. транзисторов (в Pentium III 21 млн. транзисторов); данный производственный процесс с 6-слойной металлизацией осуществляется на заводе AMD Fab25. При переходе к тактовым частотам 750 МГц и выше AMD также сменила и технологию, перейдя к медной технологии на 0,18 мкм (завод Fab30 в Дрездене). При этом удалось также понизить энергопотребление; к этому вопросу мы еще вернемся.

Наборы микросхем и материнские платы

AMD cама разработала и выпускает первый набор микросхем AMD750, поддерживающий К7. Набор микросхем - второй по значимости фактор, вслед за самим процессором, определяющий характеристики ПК. В составе AMD750 две микросхемы: cистемный контроллер AMD751 (аналог традиционного «северного моста») и контроллер периферийных шин AMD756 (аналог «южного моста»). Эти микросхемы определяют «логический облик» ПК (рис. 2).

Рис. 2. Типовая «архитектура» набора микросхем для К7

Кроме поддержки 200-мегагерцевой системной шины К7, характеристики AMD750 выглядят достаточно стандартно: поддержка «двухскоростного» порта AGP, 64-разрядной (плюс разряды ECC) шины памяти SDRAM, 32-разрядной шины PCI, UltraDMA/66, USB, 16-разрядной шины ISА и т.д. К сожалению, поддерживается только до 768 Мбайт оперативной памяти, и только стандарт PC100 (отсутствует поддержка PC133). Ограничение емкости памяти обидно: более мощный, по сравнению с Pentium III, процессор должен был, казалось бы, поддерживать не меньше оперативной памяти, а ведь материнские платы с Pentium III и набором микросхем Intel 440BX могут иметь до 1 Гбайт памяти.

AMD751 и AMD756 используют корпуса PBGA и имеют соответственно 492 и 272 контакта. Этот набор микросхем можно считать конкурентом Intel 440BX (материнские платы на основе последнего набора на момент подготовки статьи были в целом чуть дешевле).

В марте появились материнские платы с набором микросхем VIA KX133. В этом наборе микросхем имеется поддержка 133-мегагерцевой шины оперативной памяти, максимальная емкость которой увеличена до 2 Гбайт, а также поддержка AGP 4x. Набор КХ133 включает традиционную пару микросхем: VT8371 (cеверный мост, 516 контактов) и VT82C686A (южный мост, 352 контакта). КХ133 производится по 0,35-микронной технологии.

О планах разработки наборов микросхем для К7 заявляли также AcerLab и SiS, а о планах разработки BIOS - AMI, Award и Phoenix Technologies. По некоторым данным, во второй половине 2000 г. возможно появление набора микросхем, поддерживающего оперативную память типа DDR.

Обратимся теперь к материнским платам на базе К7. Сама AMD рекомендует 5 таких плат. По-видимому, одной из первых появилась плата FIC SD11. В этой материнской плате использован гибридный набор микросхем-AMD751 плюс южный мост от VIA Technologies, а BIOS - от AMI. Максимальная тактовая частота К7, поддерживаемая этой платой, равна 1 ГГц.

Gigabyte выпускает плату 7IX, ASUStek - K7M, Microstar - MS-6167, а Biostar — M7MKA. Все эти платы основаны на наборе микросхем AMD750, в них используется BIOS от Award. Все эти платы (кроме продукции Biostar, соответствующими данными о которых автор не располагает) имеют по 3 слота для DIMM-модулей оперативной памяти и по 5 слотов PCI.

Первой на базе VIA КX133 была выпущена, насколько известно автору, плата EPOX EP-7KXA. Затем появились платы GA-7VX/GA-7VM от Gigabyte и ASUS K7V/K7V-RM с форм-фактором ATX/микро-АТХ соответственно. В этих платах также по 3 слота DIMM и по 5 слотов PCI.

Упомянем некоторые характеристики плат от Gigabyte и ASUS, поскольку эти компании более известны в нашей стране. Обе платы поддерживают К7 с тактоовыми частотами до 1 ГГц. Благодаря поддержке модулей DIMM емкостью до 512 Мбайт максимальная емкость устанавливаемой на платах оперативной памяти составляет 1,5 Гбайт. Платы поддерживают UltraDMA/66 и 4 порта USB. Эти платы только появились, поэтому можно говорить только о первом впечатлении. GA-7VX отличаются высоким уровнем возможностей мониторинга состояния аппаратуры. Платы ASUS K7V поддерживают оперативную память типа PC100/PC133/VCM133 (VC означает Virtual Channel). Приятной особенностью плат К7V является установка основных характеристик не перемычками, а непосредственно из BIOS.

Среди наиболее известных производителей ПК обращают на себя внимание Compaq и Gateway, которые объявили в начале марта о выпуске ПК с гигагерцевыми процессорами К7. Известные автору тесты производительности (Sysmark98, трехмерные игры), проведенные независимыми экспертами, не выявили существенных различий разных материнских плат на базе AMD750.

Однако так получается (быть может, прогресс в микропроцессорных технологиях обгоняет возможности производителей плат и компьютеров), что новейшие разработки как Intel (набор микросхем 820), так и AMD вызвали у OEM-производителей определенные проблемы. Так, например, сообщалось о случайных сбоях типа «page fault» при работе с платами FIC SD11 в среде Linux. Обнаружено, что у SD11 есть проблемы с установкой 128-мегабайтного модуля DIMM в первый слот.

AMD предупредила, что для нормальной работы с К7 требуются блоки питания с мощностью не менее 250 Вт. Следует помнить, что частенько блоки питания не выдают той мощности, которая указана у них «на борту». Кроме того, необходимо использовать качественные модули памяти DIMM.

Наконец, надо позаботиться о хорошем охлаждении микропроцессоражелательно применять сразу два вентилятора. K7M, которая, кстати, выпускается только для OEM-производителей, критиковали именно за трудности установки более мощного охлаждения. Возможно, этих проблем нет у части микропроцессоров К7, выпускаемых по 0,18-микронной технологии и имеющих пониженное тепловыделение. Пользователям можно посоветовать обратиться на Web-сервер AMD, где приведены рекомендации по выбору различных компонентов ПК на базе К7- вплоть до блоков питания и корпусов, а также данные о протестированных в составе компьютеров с К7 периферийных устройствах.

В любом случае ясно, что проблемам надежности компьютеров на базе К7, по крайней мере на настоящий момент, следует уделить особое внимание. Наиболее важно это при применении таких ПК-серверов в качестве узлов кластера Beowulf, где при выполнении длительных расчетов надежность отдельных узлов является критической. В конференции Usenet сomp.arch можно познакомиться с неким «паническим» письмом, автор которого утверждает, что К7, как и К6, имеет массу ошибок при работе с плавающей запятой. Поскольку микропроцессоры архитектуры x86 от Intel также имели подобные ошибки, хотя и немного (отметим, что такие неприятности случались и с известными RISC-процессорами), возможность подобных ошибок в К7 нельзя исключать, хотя свидетельствами этого автор не располагает.

С учетом вышесказанного в суперкомпьютерном центре Института органической химии РАН специально занялись тестированием компьютеров на базе К7 с материнской платой от Gigabyte (именно на этой плате были достигнуты наивысшие для К7 показатели SPECint95). Эти работы поддерживаются РФФИ (проект 98-07-90290) и Московским комитетом по науке и технологиям (проект Б-195).

Оценки производительности

В табл. 3 приведены данные о производительности К7 на разных тактовых частотах на тестах SPEC95. Эти данные свидетельствуют о преимуществе К7 перед Pentium III при равных тактовых частотах, особенно по производительности с плавающей запятой (что, с учетом сказанного выше, достаточно естественно). Однако ситуация становится иной, если проводить сопоставление с Pentium III Coppermine, в котором кэш второго уровня интегрирован в микропроцессор и работает на его тактовой частоте. Эти процессоры обгоняют К7 на тестах SPEC95 при равных частотах. На тестах SPEC95 K7/1ГГц уступает по производительности Coppermine c той же частотой. Вероятно, это определяется низкой частотой шины кэша второго уровня. Имеются данные, что Coppermine обгоняют К7 и на трехмерных играх.

Путь, связанный с интеграцией кэша второго уровня в микропроцессор, уже показал свою эффективность. Так, это позволило HP PA-8500 приблизиться к Alpha 21264 по производительности. Однако следует учесть, что небольшая емкость кэша второго уровня в Сoppermine (вдвое меньше, чем в К7) может привести к падению производительности на задачах, плохо локализуемых в кэше, к числу которых относятся многие задачи «экономического» характера. Поэтому производительность К7 должна быть более стабильной для широкого класса приложений.

Следует также учесть, что, как видно из табл. 3, наиболее высокие результаты для Pentium III Coppermine достигнуты благодаря применению дорогой быстродействующей памяти RDRAM. некоторые модели Сoppermine также может работать с памятью на 133 МГц (PC133). В «равных условиях» (то есть при одинаковой частоте процессора, кэша второго уровня и одинаковом типе оперативной памяти) К7, по мнению автора, должен быть быстрее.

Кроме того, отсутствие на сегодня компиляторов, учитывающих при оптимизации особенности строения К7, означает, что у процессора имеются еще некоторые резервы повышения производительности. Наконец, AMD недавно продемонстрировала и симметричный ответ - К7 с частотой 1,1 ГГц, где кэш второго уровня также интегрирован в процессор. К концу года емкость этого кэша должна быть увеличена до 1 - 2 Мбайт (процессор «Mustang»). На Web-сервере AMD можно найти сравнительные данные о производительности K7 и на тестах, отвечающих массовым приложениям для ПК; эти данные коррелируют со SPEC95.

Наконец, упомянем и о тестах STREAMS, характеризующих пропускную способность оперативной памяти. По этим характеристикам процессоры К7 заметно опережают Pentium III. При использовании набора микросхем КХ133 пропускная способность на этих тестах еще более возрастает. Однако при использовании Сoppermine с памятью типа RDRAM ситуация, возможно, изменится.

В качестве тестов производительности на реальных приложениях могу сослаться на данные в области задач вычислительной химии. В ряде случаев, например, когда удается использовать оптимизированные для К7 библиотечные подпрограммы BLAS, ускорение по сравнению с Pentium III c той же тактовой частотой оказывается значительным. В качестве примеров программ, где достигается существенное ускорение, можно привести DMOL и Jaguar.

Борьба за лидерство в области производительности x86-cовместимых микропроцессоров обострилась до предела. Существенно также и соотношение стоимость/производительность. Хотя подобный анализ лежит вне рамок настоящей публикации, укажем стоимость процессоров (в партиях 1 тыс. штук): она составляет 1299 долл./999 долл./899 долл. для моделей AMD K7 с частотой 1 ГГц/950 МГц/900 МГц соответственно. Pentium III/1 ГГц Coppermine стоит дешевле конкурента — 990 долл., но его массовые поставки пока не начались.

С моей точки зрения, основное, на что следует обратить внимание при приобретении компьютера на базе процессора AMD К7, если речь идет о серьезных и сложных задачах, это вопросы надежности.

Об авторе

Михаил Кузьминский - старший научный сотрудник суперкомпьютерного центра Института органической химии РАН. С ним можно связаться по телефону (095)135-6388.

Литература

[1] Михаил Кузьминский, Сomputerworld Россия, № 20?97, № 47?98.

[2] Михаил Кузьминский, Открытые системы, 1998, № 1, стр. 7.


Таблица 1. Некоторые характеристики x86-МП AMD и Intel
 AMD K7AMD K6-3Intel Pentium III
Тип разъемаSlot ASocket 7Slot 1
Число контактов242321242
Число транзисторов, млн. штук229,521
Емкость кэша первого уровня, Кбайт1286432
Емкость кэша второго уровня, Мбайт0,5-80,2560,5-2
Тактовая частота шины, МГц200-400100100*
Пропускная способность шины, Гбайт/с1,6-3,20,80,8*
Число целочисленных исполнительных устройств322
Число исполнительных устройств с плавающей запятой311
* Для Pentium III/Coppermine при частоте шины 133 МГц пропускная способность равна 1,06 Гбайт/с

Таблица 2. Времена выполнения некоторых команд с плавающей запятой

(задержка/пропускная способность, в тактах, 1 соответствует полностью конвейеризованной операции)

КомандаAMD K7Intel Pentium III
FADD4/13/1
FMUL4/15/2
FDIV (SP)16/1317/17
FDIV (DP)20/1732/32
FSQRT (SP)19/1628/28
FSQRT (DP)27/2457/57

Поделитесь материалом с коллегами и друзьями