Сергей Абрамов: «Цель программы «СКИФ-Грид» состоит не только в наращивании вычислительных мощностей, но и в реализации комплексного подхода к построению суперкомпьютерных центров» Этот сложный инженерно-технический комплекс построен на базе 625 blade-серверов производства «Т-Платформы» с 1250 четырехъядерными процессорами Intel Xeon E5472.

Пиковая производительность «СКИФа МГУ» составляет 60 трлн операций в секунду, и это — лучший показатель среди скоростных характеристик всех вычислительных систем на базе процессоров Intel Xeon, входящих в первую сотню списка Тор500. Реальное быстродействие суперкомпьютера в тесте Linpack достигает 78,4% пикового. Обеспечиваемые «СКИФом МГУ» 47,04 Тфлопс позволяют ему занять 22-ой позицию текущего мирового рейтинга Тор500. При этом «СКИФ МГУ» является седьмым по мощности среди всех суперкомпьютеров, используемых в мировой системе образования, и пятым в Европе.

В качестве вычислительных узлов суперкомпьютера «СКИФ» применяются первые в индустрии blade-системы российской разработки. По словам Всеволода Опанасенко, генерального директора компании «Т-Платформы», шасси T-Blade отличается уникальной емкостью размещения вычислительной мощности: в корпусе высотой всего 5U расположены 20 четырехъядерных процессоров Intel Xeon c тактовой частотой 3 ГГц каждый. В стандартной стойке достигается концентрация вычислительной мощности 7,68 ТФлопс. Это — и первое в отрасли blade-решение, использующее новые процессоры Intel Xeon серии 5400 с более низким энергопотреблением, чем у представителей предыдущего поколения, а также материнские платы с поддержкой стандарта PCI Express 2.0.

«СКИФ МГУ» оснащен системой хранения данных с параллельной файловой системой T-Platforms ReadyStorage ActiveScale Cluster объемом 60 Тбайт и производительностью более 3 Гбайт/c, ленточной системой резервного копирования данных, выделенной подсистемой мониторинга и управления (с дублированием), подсистемой бесперебойного электропитания и охлаждения с уровнем резервирования N+1. Параметры и состав всех подсистем подобраны так, чтобы обеспечить максимальную эффективность выполнения пользовательских приложений. Система содержит вычислительные узлы с разным количеством памяти и дискового пространства, что обеспечивает наиболее эффективную работу приложений с разными требованиями к ресурсам. Большая часть вычислительных узлов не содержит жестких дисков, что повышает уровень отказоустойчивости системы.

Системы, подобные «СКИФу», потребляют сотни киловатт электроэнергии, требуют специальной инфраструктуры для бесперебойной подачи электроэнергии, надежного охлаждения и корректного завершения работы в аварийных ситуациях. Общее энергопотребление суперкомпьютера в стандартном режиме составляет 520 кВт, а при теоретически возможной пиковой нагрузке может достигать 720 кВт. Вся эта мощь сосредоточена на площади менее чем 100 кв. м, но температура в суперкомпьютерном центре не превышает 20ºС. Для отвода тепла инженеры «Т-Платформы» спроектировали модульную систему охлаждения с герметичным «горячим коридором» между стойками. Решение гарантирует отвод до 30 кВт тепловой энергии от каждой стойки, имеет уровень резервирования всех компонентов N+1 и в случае аварии поддерживает требуемый температурный режим в помещении не менее 10 мин.

Такая система не может считаться законченным решением без программного обеспечения. «СКИФ МГУ» впервые будет использовать российские программные средства для кластерных систем, разработанные в рамках программы «СКИФ-Грид». Они включают в себя специально созданный кластерный дистрибутив операционной системы Linux, а также систему мониторинга и управления, которая объединяет информацию обо всех подсистемах суперкомпьютера в едином Web-интерфейсе.

Суперкомпьютеры семейства «СКИФ» создают новые возможности для решения фундаментальных и прикладных научных задач. К примеру, речь может идти о прогнозировании климатических изменений, диагностике строительных сооружений, обеспечении безопасности атомных станций. Одна из важнейших областей применения суперкомпьютеров — создание новых лекарств. В рамках программы «СКИФ-Грид» совместно с Институтом гематологии за полтора года получен класс ингибиторов тромбина, которые являются основой лекарств от тромбоза, возникающего при переливании крови.

На объединенные средства МГУ им. Ломоносова и программы «СКИФ-Грид» уже построены два суперкомпьютера ряда 3 — уже упомянутый «СКИФ МГУ» и «СКИФ Урал» (18 ТФлопс пиковой производительности). Сергей Абрамов отмечает, что создание пилотных образцов — не самоцель: «Все разработки в рамках программы «СКИФ-Грид» просчитаны на два-три года вперед. Сегодня мы готовим решения, которые позволят суперкомпьютерам перейти петафлопный рубеж производительности». Однако цель «СКИФ-Грид» состоит не столько в наращивании мощностей, сколько в обеспечении комплексного подхода к решению проблем, связанных с внедрением суперкомпьютерных вычислений. Предусмотрены строительство сети суперкомпьютерных центров по всей России и Беларуси, разработка прикладных программных комплексов и массовая подготовка квалифицированных специалистов.

Поделитесь материалом с коллегами и друзьями