Nvidia Tesla K20X
Графические сопроцессоры содержат тысячи крошечных ядер, которые позволяют эффективно выполнять множество потоков программного кода одновременно

Компании Nvidia и AMD анонсировали выпуск новых высокопроизводительных графических процессоров для суперкомпьютеров.

Nvidia представила графические процессоры K20 и K20X. Вторая модель будет использоваться в суперкомпьютере Titan производительностью в 20 PFLOPS, который планируется развернуть в Национальной лаборатории министерства энергетики США в Окридже. Компания AMD анонсировала графический процессор FirePro SM10000, предназначенный для построения высокопроизводительных компьютеров и серверов в виртуальных средах.

Сопроцессоры имеют более высокую вычислительную мощность по сравнению с центральными процессорами и, как правило, применяются при решении специализированных задач (в том числе и при работе с научными и математическими приложениями). Вычислительная мощность графических процессоров играет важную роль в процессе моделирования и проведения экспериментов в интересах бионаук, энергетики, освоения космического пространства и прогнозирования климата. Ускорители для суперкомпьютеров предлагают также корпорации IBM и Intel.

Многие самые быстрые на сегодняшний день суперкомпьютеры сочетают в себе вычислительную мощь центральных и графических процессоров. В суперкомпьютере Titan установлено 18 688 графических чипов Nvidia Tesla K20X и столько же 16-ядерных центральных процессоров AMD Opteron 6274. При этом 80-90% нагрузки приходится на графические процессоры. Среди других суперкомпьютеров, объединяющих ресурсы центральных и графических процессоров, можно отметить вычислительный комплекс Tianhe-1A, развернутый в китайском Национальном суперкомпьютерном центре в Тяньцзине.

«В области создания графических процессоров для суперкомпьютеров компания Nvidia значительно опережает AMD», – подчеркнул главный аналитик Gabriel Consulting Group Дэн Олдс.

В Nvidia начали продвигать инструменты параллельного программирования много лет назад, благодаря чему у разработчиков появилась возможность писать приложения для графических процессоров. Компания AMD фактически не присутствует на рынке суперкомпьютеров, и ей необходимо создать среду программирования для параллельных фреймворков наподобие OpenCL, которая составила бы достойную альтернативу технологиям Nvidia, Intel и других компаний.

Графический процессор Nvidia K20 имеет 5 Гбайт памяти и демонстрирует производительность на уровне 1,17 TFLOPS с двойной точностью и 3,52 TFLOPS с обычной точностью. Для суперкомпьютерных приложений первый параметр важнее, потому что он характеризует вычисления с плавающей точкой более высокой точности. Процессор K20X имеет 6 Гбайт памяти и обеспечивает проведение вычислений двойной точности с производительностью 1,31 TFLOPS. Чип K20X втрое быстрее своего предшественника, Tesla M2090, который был представлен в середине прошлого года.

Сопроцессоры K20 найдут применение в компьютерах, выпускаемых компаниями Hewlett-Packard, IBM, Asus, Fujitsu, Tyan, Quanta Computer и Cray. Цены в Nvidia пока назвать не смогли, сообщив лишь, что графические процессоры будут продаваться через производителей серверов.

Новые сопроцессоры содержат тысячи крошечных процессорных ядер, которые позволяют эффективно выполнять множество потоков программного кода одновременно. Функция Hyper-Q ускорит выполнение унаследованного кода за счет оптимизации планирования выполнения программного кода.

В AMD утверждают, что максимальная производительность процессора FirePro SM10000 при выполнении операций двойной точности достигает 1,48 TFLOPS. На графической плате установлено 6 Гбайт оперативной памяти.

Модель SM10000 предназначена для систем, состоящих из множества серверов. Графические процессоры способны обслуживать виртуальные рабочие столы на клиентских устройствах – ПК и планшетных компьютерах. Чипы AMD ускоряют обработку графики на стороне сервера и пересылают на клиентские устройства изображения рабочих столов с разрешением full HD.

Ускорение обработки за счет использования SM10000 поможет быстрее развертывать виртуальные машины в вычислительной среде. Одна графическая плата сможет обслуживать сразу несколько виртуальных машин. AMD вместе со своими партнерами Citrix, VMware и Microsoft продолжает работать над увеличением производительности виртуальных систем, выполняемых на графическом процессоре.

Процессоры FirePro SM10000 предполагается устанавливать и на рабочих станциях. Цены, по которым будут продаваться графические платы, и характеристики производительности при выполнении операций с обычной точностью, в AMD сообщить также пока не готовы.