По словам Леонида Эйсымонта, характеристики процессоров Barcelona позволяют использовать их для тестирования программного обеспечения, которое будет разрабатываться НИЦЭВТ для суперкомпьютера стратегического назначения А 26 августа "Троник" и московский Научно-исследовательский центр электронной вычислительной техники (НИЦЭВТ), в здании которого разместился центр компетенции кластерных технологий "Троника", обнародовали результаты проведенного ими тестирования, которое продемонстрировало превосходство AMD по масштабируемости многоядерных процессоров.

Специалисты НИЦЭВТ протестировали платы с четырьмя четырехъядерными процессорами AMD Opteron 2350 (Barcelona) и платы с двумя четырехъядерными процессорами Intel Clovertown. Задача стояла в определении их толерантности к задержкам обращений к памяти и коммуникационной сети, что позволяет выявить влияние параллелизма обращений на пропускную способность системы.

С помощью теста STREAM была измерена толерантность при регулярных обращениях к памяти. Увеличение количества ядер на узле с микропроцессором Clovertown с одного до восьми практически не повлияло на пропускную способность. При операции копирования она увеличилась с 3230 до 3374 Мбайт/с. В узле с микропроцессором Barcelona на той же операции пропускная способность выросла с 3563 до 13 270 Мбайт/с на восьми ядрах и до 17 195 Мбайт/с - на шестнадцати.

Интенсивные нерегулярные обращения к памяти, типичные для современных вычислений, по словам начальника отдела "Архитектура и программное обеспечение суперкомпьютеров" НИЦЭВТ Леонида Эйсымонта, в несколько раз снижают производительность суперкомпьютера. Как показало проведенное тестирование, задержка при нерегулярных обращениях к памяти с одним "потоком команд", или "тредом" (от английского thread), на Clovertown составила 300 тактов, а на Barcelona - 350. На 16 тредах показатели обоих процессоров оказались практически равными - чуть более 70 тактов. На 64 тредах результат Clovertown не изменился, а задержка на Barcelona уменьшилась до 47 тактов.

В тесте на толерантность при выполнении операций с коммуникационной сетью также первенствовали процессоры AMD. Исследовалась зависимость пропускной способности от длины сообщений, которыми обмениваются узлы. При длине сообщения 4194304 байт пропускная способность Barcelona варьировалась от 1000 Мбайт/с на одноядерных узлах до 3500 Мбайт/с на восьмиядерных. На 16-ядерных узлах показатель оказался ниже - 2500 Мбайт/с. В аналогичных условиях пропускная способность на Clovertown достигла чуть более 1200 Мбайт/с на одноядерных узлах и 1600 Мбайт/с - на восьмиядерных. Эйсымонт отметил, что, учитывая такие показатели, НИЦЭВТ может использовать плату AMD для тестирования мультитредового программного обеспечения нового поколения, которое будет разрабатываться центром в рамках создания суперкомпьютера стратегического назначения "Ангара".

Тревожными Эйсымонт назвал результаты по обоим процессорам, полученные при определении сбалансированности систем. Сбалансированность памяти и вычислительных мощностей (отношение пропускной способности на тесте STREAM к пиковой производительности процессоров) для Clovertown/2,3 ГГц составила 0,027, а для Barcelona - 0,134. Сбалансированность сети и вычислительных мощностей - 0,017 для Clovertown/3 ГГц и 0,058 - для Barcelona. Тем не менее такие показатели Эйсымонт назвал типичными для многоядерных процессоров. Безоговорочными лидерами по сбалансированности на сегодня остаются процессоры Cray: в Cray X1 она достигает 1,65 по памяти и 0,899 по сети.

Как подытожил результаты проведенного тестирования технический директор "Троника" Михаил Полунин, превосходство AMD Opteron над Intel Xeon проявляется начиная примерно с шести ядер.

Кластер в ПГТУ, созданный совместно с компанией "Саровские суперкомпьютерные технологии", стал первым отечественным суперкомпьютером, построенным на четырехъядерном AMD Opteron. Его пиковая производительность составляет 4,1 GFLOPS, а производительность на тесте Linpack — 3,2 GFLOPS. Кластер состоит из 64 вычислительных узлов, построенных на платформе Supermicro Twin, в каждом из которых находится по два процессора Barcelona, а также оперативная память 8 Гбайт. Объем дисковой подсистемы - 12 Тбайт.

По словам главы российского представительства AMD Александра Беленького, в настоящий момент в России ведется еще один проект по созданию суперкомпьютера с процессорами AMD.