В то время как производители решают проблемы потребляемой мощности и быстродействия, пользователи высокопроизводительных вычислительных систем преодолевают трудности масштабирования кода, чтобы в полной мере использовать возможности новых суперкомпьютеров. Фото: IBM
В то время как производители решают проблемы потребляемой мощности и быстродействия, пользователи высокопроизводительных вычислительных систем преодолевают трудности масштабирования кода, чтобы в полной мере использовать возможности новых суперкомпьютеров. Фото: IBM

На прошедшей в Сиэтле одиннадцатой международной конференции по суперкомпьютерам SC11 самой горячо обсуждаемой темой стала задача достижения быстродействия 1 экзафлопс до конца нынешнего десятилетия, то есть мощности, примерно на три порядка большей, чем у самых быстрых из ныне существующих систем.

Восемь-девять лет - это большой период времени, но участие в SC11 оставило ощущение, что экзафлопс буквально за поворотом. Инициатива отчасти исходит от Министерства энергетики США, которое планирует финансировать разработку этих сверхмощных систем. Прошедшим летом минэнерго сообщило суперкомпьютерной отрасли, что примерно в 2019-2020 году ему понадобится экзафлопсная система, потребляющая не более 20 МВт. С тех пор начались изыскания способов выполнить эту задачу.

Оценить, что такое 20 МВт, можно в сравнении. Сейчас IBM строит для принадлежащей национальной лаборатории им. Лоуренса в Ливерморе, тоже принадлежащей минэнерго, систему мощностью 20 PFLOPS. Это будет один из крупнейших и самых энергоэффективных суперкомпьютеров в мире. Когда в следующем году эта система полностью будет введена в эксплуатацию, она ее энергопотребление составит примерно 7-8 МВт, — сообщают в IBM. Один экзафлопс же это 1000 PFLOPS (а 1 PFLOPS — 1015 операций с плавающей запятой в секунду).

«Мы живем в мире, ограниченном в электроэнергии, — считает Стив Скотт, директор по технологиям отделения Nvidia по процессорам Tesla. — Сегодня быстродействие, которого можно добиться от чипа, ограничивается не предельным числом транзисторов на нем, а его потребляемой мощностью».

Скотт полагает, что возможности архитектуры x86 в области быстродействия ограниченны из-за непроизводительных затрат ресурсов процессора при его работе. Графические же процессоры, утверждает он, в отличие от центральных, выполняют очень малый объем служебных функций, и поэтому расходуют меньше энергии в расчете на операцию.

Сегодня системы высокопроизводительных вычислений строятся на основе чипов Nvidia, используемых совместно с центральными процессорами x86-архитектуры. Аналогичный гибридный подход также применяется в смартфонах, где в качестве центральных используются процессоры на ядре ARM, так что со временем не исключено появление интегрированного гибрида ARM с графическим чипом.

Скотт полагает, что цели, поставленной минэнерго, можно будет достичь к 2022 году. Однако, добавляет он, если государственная экзафлопсная программа будет финансироваться в достаточных объемах, Nvidia сможет интенсифицировать разработку новых схематических и архитектурных решений, благодаря чему нужное сочетание быстродействия и потребляемой мощности может будет достигнуто уже к 2019 году. По оценкам Скотта, чтобы получить такую энергоэффективность, понадобится улучшить уровень утилизации электроэнергии в 50 раз по сравнению с нынешним. Возможно, 20 МВт и кажется огромной цифрой, но сегодня существуют центры обработки данных для систем облачных вычислений, которые потребляют до 100 МВт.

Генеральный менеджер отделения Intel по техническим вычислениям Раджиб Хазра заявил, что корпорация сможет создать экзафлопсную систему, потребляющую 20 МВт, уже к 2018 году, то есть на год раньше, чем требует правительство. Об этом Хазра объявил во время анонса Knights Corner, 50-ядерного процессора Intel c усредненной производительностью 1 TFLOPS.

В то время как производители решают проблемы потребляемой мощности и быстродействия, пользователи высокопроизводительных вычислительных систем преодолевают трудности масштабирования кода, чтобы в полной мере использовать возможности новых суперкомпьютеров.

Прежде, как будет достигнут экзафлопсный порог, появятся системы, обладающие быстродействием в сотни петафлопсов. В IBM, в частности, заявляют, что новая система Blue Gene/Q (Sequoia) будет иметь мощность 100 PFLOPS.

Для Ким Каппс, главы вычислительного отдела лаборатории Лоуренса в Ливерморе и руководителя проекта проекта Sequoia, вполне достаточно и 20 PFLOPS.

«Мы потрясены тем, что можем получить столь мощную машину в свои руки, — заявляет она. — Теперь можно будет решить массу задач национального значения, — в области разработки вооружений, моделирования материалов, климатических изменений, энергетических систем и так далее».

Заявление IBM, о том, что система сможет масштабироваться и до 100 PFLOPS, Каппс прокомментировала так: «Ну, это IBM так утверждает. Я готова поручиться только за 20».