Суперкомпьютеры позволяют исследователям создавать трехмерные визуализации для выполнения бесконечных сценариев по типу "что, если" (отчасти это напоминает компьютерные игры) с высочайшим уровнем детализации. Но какими бы мощными ни были современные суперкомпьютеры, их быстродействия все еще недостаточно. Это стало предметом обсуждения для примерно 11 тыс. специалистов, собравшихся в середине ноября в Портленде (Орегон) на 22-ю ежегодную конференцию по суперкомпьютерам SC09. Приоритетная задача на сегодня – создание экзафлопного компьютера (один экзафлоп равняется 10^18 плавающих операций в секунду. - Прим. ред.).

Какими бы поразительными ни казались суперкомпьютерные системы, они остаются — на своем уровне — примитивными. Существующие сейчас архитектуры требуют слишком много энергии, места и денег

Сейчас до такого уровня еще далеко. Jaguar, самая мощная в мире система, установленная в Национальной лаборатории в Окридже, обладает проектной пиковой производительностью 2,3 PFLOPS. Система, собранная на платформе Cray XT5, работает на базе 224 256 ядер в шестиядерных процессорах AMD Opteron.

Однако рекорд Jaguar, безусловно, продержится недолго. Как заметил Бадди Блэнд, директор проекта в Окридже, Министерство энергетики США уже начало проводить семинары по созданию в тысячу раз более мощного суперкомпьютера. Система с производительностью экзафлопного уровня потребуется для создания климатических моделей с высоким разрешением, разработки биоэнергетических продуктов и поддержки интеллектуальной grid-сети, а также для проектирования термоядерных реакторов (такой проект сейчас ведется, например, во Франции - это Международный экспериментальный термоядерный реактор).

"Есть задачи, для решения которых объективно требуется производительность, измеряемая в экзафлопах, и решить их за разумное время на имеющейся вычислительной базе невозможно", - заметил Блэнд.

Какими бы поразительными ни казались суперкомпьютерные системы, они остаются — на своем уровне — примитивными. Существующие сейчас архитектуры требуют слишком много энергии, пространства и денег. Барьер в 1 TFLOPS впервые преодолела система ASCI Red из Национальной лаборатории в Сандии в 1997 году. В 2008 году IBM Roadrunner в Национальной лаборатории в Лос-Аламосе достиг скорости 1 PFLOPS.

По словам Блэнда, Министерство энергетики США, которое финансировало создание многих выдающихся вычислительных систем, хотело бы иметь в своем распоряжении две машины с производительностью около 10 PFLOPS.

Но следующий этап - это система, способная выполнять в тысячу раз больше выислительных операций по сравнению с существующими сейчас.

По всей вероятности, такие машины появятся примерно в 2018 году, если исходить из того, что выход на новый рубеж производительности происходит каждые десять лет или около того. Такую периодичность в определенном смысле объясняет закон Мура, согласно которому число транзисторов на микросхеме удваивается примерно каждые полтора года. Однако проблемы, которые возникнут в связи с созданием систем экзафлопного уровня, выходят за рамки этого закона.

Энергопотребление Jaguar составляет 7 МВт. Как заметил вице-президент IBM Дейв Турек, экзафлопная система может потребовать мощности 2 ГВт. "Это мощность средней по размеру ядерной электростанции", - заявил он.

Создатели суперкомпьютеров активно ищут пути сократить энергопотребление. Один из возможных подходов состоит в том, чтобы использовать гибридные подходы, которые сочетают сопроцессоры (ускорители) с центральными процессорами.

Когда был анонсирован Roadrunner, потребляющий мощность 3,9 МВт, он имел производительность всего 1 PFLOPS. В нем используется гибридная архитектура, которая объединяет процессоры AMD с процессорами Cell, имеющими девять отдельных процессорных ядер, в том числе одно ядро PowerPC и восемь меньших сопроцессорных модулей, так называемых синергетических процессорных элементов. Применение ускорителей, включающих в себя процессоры графических операций и программируемые логические матрицы, должно помочь снизить энергопотребление за счет переноса определенной работы с центральных процессоров на устройства, способные эффективно решать более специализированные задачи.

Предполагается, что экзафлопные системы будут содержать от 10 млн до 100 млн ядер.

"Производительность в экзафлоп потребует 100 млн ядер, и, по-видимому, не существует никакого другого реального способа достичь этого, - заметил Турек. – Чтобы построить столь мощную машину, исследователи ищут оптимальную архитектуру. Но если наиболее перспективной идеей будет признана 'гибридизация', то каким должно быть соотношение между ядрами специального назначения и традиционными ядрами"?

Подобные системы должны будут использовать меньше оперативной памяти в расчете на ядро и потребуют больше пропускной способности при доступе к памяти. В системах со 100 млн ядер где-то постоянно будут возникать сбои, поэтому, считает Турек, необходимо найти абсолютно новый подход к созданию инструментов, которые позволят справляться с такой ситуацией.

Цель, которую ставят в IBM при разработке экзафлопных архитектур, состоит в том, чтобы ограничить энергопотребление 20 МВт, а размер системы – 70-80 стойками. Jaguar целиком состоит из центральных процессоров, но Блэнд, уверенный, что будущее - за гибридными системами, указывает на тот факт, что и Intel, и AMD разрабатывают архитектуры, которые сочетают центральные процессоры с сопроцессорами.

Эддисон Снелл, директор исследовательской компании InterSect Research, специализирующейся в области суперкомпьютерных вычислений, считает, что ускорители способны предоставить огромную вычислительную мощность для конкретных приложений, в силу чего первыми достигнут экзафлопного уровня системы, созданные специально для определенных применений. "В конечном итоге появятся системы общего назначения с производительностью такого уровня, но сначала будут созданы специализированные компьютеры", - заметил он.

Прежде чем появятся такие системы, ряды петафлопных суперкомпьютеров с производительностью уровня петафлопа будут шириться, и, по-видимому, будет расти и число финансируемых правительствами проектов. Fujitsu планирует в 2011 году построить компьютер с производительностью 10 PFLOPS для японского Института физических и химических исследований, а Китай уже располагает петафлопным компьютером. Целый ряд стран все активнее финансирует разработку крупных систем, готовясь к международной гонке по созданию компьютеров нового поколения, способных решать наиболее сложные и актуальные мировые проблемы.

Поделитесь материалом с коллегами и друзьями