Вычислительные тяжеловесы

Список отраслей, использующих мощности высокопроизводительных систем (High-performance computing, HPC), сформировался уже достаточно давно. Ни одна крупная западная автомобильная и авиастроительная компания не обходится без моделирования с их использованием. Практика доказывает, что это гораздо дешевле, чем проведение физических испытаний. Нефтяные компании, применяя HPC, обрабатывают геосейсмические данные, и от качества анализа зависят восьмизначные инвестиции. Отдельным направлением, где используются высокопроизводительные комплексы, являются образование и наука.

Что вполне естественно, технологии становятся доступнее, и поэтому популярность HPC постепенно растет.

«Во-первых, это обусловлено изменением парадигмы программирования в сторону повсеместного использования параллельных вычислений. Во-вторых, благодаря созданию коллективных суперкомпьютерных центров общего доступа снизилась стоимость применения высокопроизводительных расчетов для научного и инженерного анализа», — говорит Андрей Слепухин, главный системный архитектор компании «Т-Платформы». Упростился доступ к таким решениям для более широкого круга организаций; как следствие, расширился и круг задач. Что очень важно, налицо переход от традиционного HPC, ориентированного на область естественных наук, к социально-экономическим, финансовым и другим аналитическим задачам, связанным с обработкой данных, накопленных в глобальном информационном пространстве. В России со стороны академического и образовательного секторов спрос на высокопроизводительные системы уже стал традиционным, и теперь интерес к HPC начали проявлять промышленные предприятия, на которых применяется концепция электронного производства, поэтому поставки высокопроизводительных систем в данный сегмент будут только расти.

«Очень многие приложения, используемые сегодня, были написаны 5, 10 и даже 15 лет назад и ориентированы на выполнение последовательных операций», — отмечает Андрей Ковалев, директор по корпоративным решениям Dell в России. Из-за этого появление технологий для параллельной обработки данных не привело к взрывному повышению производительности: все упирается в исходный код. Но сейчас разработчики прикладных программных продуктов активно перерабатывают свои старые решения под новые технологии, что позволяет распараллелить вычисления и, соответственно, ускорить процессы обработки данных.

«Разумеется, суперкомпьютер — удовольствие не из дешевых. Однако все в бизнесе имеет цену, и если результата можно достичь, только применяя определенный инструмент, то так и поступают», — указывает Николай Местер, директор по развитию корпоративных проектов компании Intel. Дорого или дешево — можно говорить, только сравнивая два результата, полученных разными способами. Но иногда результат возможно получить только одним способом.

Второй в России

Вычислительный комплекс, представленный Российской академией наук в апреле 2013 года, позиционируется как самый энергоэффективный в СНГ и при этом занимает второе место по мощности, уступая лишь «Ломоносову», созданному в МГУ.

Межведомственный суперкомпьютерный центр РАН (МСЦ РАН) был открыт в 1999 году. С тех пор он всегда обладал одним из самых крупных высокопроизводительных комплексов коллективного пользования в России в сфере науки и образования, регулярно обновляя свои мощности.

Последнее обновление в три раза увеличило производительность вычислительного комплекса. Решение обладает пиковой производительностью 523,8 TFLOPS и построено на базе архитектуры «РСК Торнадо» с жидкостным охлаждением. Оно имеет рекордный для России и СНГ уровень энергоэффективноcти — более 1949,3 MFLOPS/Вт. Это крупнейшая за пределами США система с процессорами Intel Xeon Phi.

Основными задачами вычислительного комплекса являются обеспечение ресурсами научных исследований, обеспечение доступа к современным электронным библиотекам, архивам и базам данных, а также решение задач большой сложности.

Новый суперкомпьютер МСЦ РАН оснащен технологией гибкого управления энергопотреблением «РСК ЭКОсистема», которая позволяет уменьшить суммарную стоимость владения на 25%.

В любом случае при принятии решений о построении какой-либо системы нужно тщательно взвешивать несколько подходов, четко определять круг решаемых задач, потребляемые ресурсы и возможности эксплуатации, пытаться оценить стоимость владения системой в течение всего срока ее службы.

Если сравнивать единую большую систему с несколькими распределенными малыми системами, объединенными сетью передачи данных, то построение распределенных систем может оказаться и дороже: возрастут расходы на поддержку передачи данных и аренду каналов, не очевидна и оптимизация расходов. Наконец, не всегда на нескольких распределенных системах удается достичь того результата, который возможен на одной большой.

Не переводя продукцию

Один из самых известных высокопроизводительных комплексов в промышленности построен в НПО «Сатурн». С 2008 года на предприятии функционирует суперкомпьютер производительностью 14,3 TFLOPS. Он главным образом используется для расчетов, связанных с узлами газотурбинных двигателей. Это тот самый случай, когда расчеты позволяют серьезно экономить на испытаниях. Действительно, испытывать авиадвигатели на прочность (например, имитируя попадание в них птицы) крайне дорого, поэтому математическое моделирование помогает решить массу проблем, попутно сокращая сроки проектирования. По крайней мере, все натурные испытания, необходимые для сертификации изделий, предприятие проходит с первого раза.

С другой стороны, в случае если принято неэффективное решение, большая система действительно может стать чрезмерно дорогой и остаться недозагруженной.

Высокопроизводительные вычисления: от серверных процессоров к чипам для смартфонов

Агам Шах

Проанализировав исторические тенденции и результаты эталонных тестов, группа испанских исследователей пришла к выводу, что со временем процессоры для смартфонов способны вытеснить более дорогие и потребляющие больше электроэнергии процессоры x86-архитектуры в большинстве ведущих суперкомпьютеров.

История имеет свойство повторяться, подчеркнули исследователи из Центра суперкомпьютерных технологий в Барселоне в работе «Готовы ли мобильные процессоры к высокопроизводительным вычислениям?» («Are mobile processors ready for HPC?»).

Исследователи напомнили, что в истории уже были случаи, когда относительно дешевые чипы вытесняли из систем высокопроизводительных вычислений (High Performance Computing, HPC) более быстрые, но дорогостоящие процессоры. В 1993 году в списке Top500 самых быстрых в мире суперкомпьютеров доминировали системы на основе векторных процессоров. Со временем им на смену пришли менее дорогие RISC-процессоры. В свою очередь, RISC-процессоры были вытеснены еще более дешевыми процессорами Intel Xeon и AMD Opteron, на базе которых сегодня построено 400 суперкомпьютеров, входящих в список Top500.

Причем всякий раз переход с одних чипов на другие был обусловлен одними и теми же причинами. Микропроцессоры пришли на смену векторным суперкомпьютерам, потому что были гораздо дешевле и потребляли меньше электроэнергии.

Мобильные процессоры работают не быстрее своих серверных собратьев, но зато намного дешевле и экономичнее.

Чипы с пониженным энергопотреблением на основе архитектуры, которая разрабатывается компанией ARM, установлены в большинстве продаваемых сегодня смартфонов и планшетных компьютеров. Область применения процессоров Atom, которые проектировались корпорацией Intel для нетбуков на базе x86-архитектуры, по-прежнему весьма ограниченна.

Интерес к использованию в серверах мобильных процессоров растет. В этом смысле чипы для смартфонов хорошо подходят для решения задач, отличающихся большими объемами мелких транзакций. Более мощные процессоры (Xeon или Opteron) лучше подходят для программного обеспечения, требующего повышенной производительности (для систем управления большими базами данных или приложений ERP).

Исследователи стремились создать прототипы решений, которые помогли бы улучшить соотношение производительности и энергопотребления. Организация, финансируемая испанским правительством и Евросоюзом, построила серверы на базе четырехъядерных чипов Nvidia Tegra 3 с архитектурой ARM Cortex-A9 и двухъядерных процессоров Samsung Exynos 5, созданных на основе более быстрой архитектуры Cortex-A15.

Помимо исторических параллелей, прогнозы о переводе суперкомпьютеров на процессоры для смартфонов основываются на результатах эталонных тестов. Исследователи сравнили оценки, полученные двухъядерным чипом Samsung Exynos 5250 с тактовой частотой 1,7 ГГц, четырехъядерным процессором Nvidia Tegra 3, работающим на частоте 1,3 ГГц, и четырехъядерным чипом Intel Core i7-2760QM, который имеет тактовую частоту 2,4 ГГц и предназначен для настольных компьютеров, а не для серверов.

Выяснилось, что ядра процессоров ARM обладают более высокой эффективностью энергопотребления и хорошей масштабируемостью, а потому пригодны для высокопроизводительных вычислений. Многоядерные чипы ARM демонстрировали ту же эффективность, что и чипы Intel x86, при равной тактовой частоте, но максимальная производительность у процессоров Intel оказалась выше.

При оценке чипов ARM продукт Nvidia Tegra 3 сравнивался с Samsung Exynos 5250. Результаты тестов показали, что у ядра Exynos 5250 производительность 1,7 раза выше, чем у Tegra 3.

Недавно компания Hewlett-Packard выпустила сервер Moonshot, созданный на базе серверных чипов Intel Atom с пониженным энергопотреблением. Ожидается, что со временем в системы Moonshot будут устанавливаться процессоры ARM, выпускаемые компаниями Calxeda и Texas Instruments. Компания Dell также представила прототипы серверов с процессорами ARM и планирует установку чипов с пониженным энергопотреблением в суперкомпьютеры.

В исследовании указаны и слабые места архитектуры ARM. На сегодняшний день чипы ARM выпускаются лишь в 32-разрядном варианте, а следовательно, объем адресуемой ими памяти ограничен. Кроме того, существующая технология ARM не поддерживает коррекцию ошибок, не имеет чипов для обработки сетевой нагрузки и не использует стандартные интерфейсы ввода-вывода.

Тем временем разработчики ARM уже анонсировали 64-разрядную архитектуру, а компании Calxeda, AMD и AppliedMicro намерены наладить выпуск 64-разрядных чипсетов, поддерживающих сетевые функции и операции ввода-вывода. По мере развития рынка серверов на платформе ARM технические проблемы устраняются, а растущая конкуренция приводит к снижению цен.

Мобильные процессоры все сильнее привлекают к себе внимание разработчиков систем высокопроизводительных вычислений, указали исследователи, призвав читателей загодя готовиться к предстоящим переменам.

Центр в Барселоне принимает участие в реализации проектов Mont-Blanc и Axle, направленных на разработку суперкомпьютеров, объединяющих мощности центральных и графических процессоров, а также других вычислительных ресурсов.

Agam Shah. Smartphone chips could replace server processors in HPC, researchers say. IDG News Service (New York Bureau). 05/24/2013

HPC и рыночные тенденции

В мире сейчас наблюдается несколько тенденций, связанных с производительностью и доступностью вычислений. Это облака, Большие Данные, вычисления в оперативной памяти. Как они влияют на востребованность HPC?

«Для весьма существенного класса задач, относящихся к Большим Данным, значимым фактором является скорость обработки гигантских массивов данных за кратчайшее время, — поясняет Слепухин. — Применение высокопроизводительных компьютерных расчетов можно считать одним из перспективных путей решения этой системной задачи».

Массовому использованию суперкомпьютерных комплексов при решении задач, связанных с Большими Данными, препятствует необходимость создавать и оптимизировать алгоритмы параллельной обработки больших неструктурированных массивов данных. В некоторых областях уже созданы такие алгоритмы, в качестве примера можно привести геологическое моделирование, обработку результатов сейсморазведки и генетическое моделирование.

Параллельно будут появляться и узкоспециализированные системы, ориентированные на решение ограниченного круга задач, однако и в них найдут применение технологии, использующиеся в «классических» HPC-решениях.

«Если говорить о Больших Данных, то есть о большом объеме неструктурированных и — возможно — распределенных по разным хранилищам данных, то в целом это задача, попадающая в категорию высокопроизводительных вычислений», — согласен Местер. Однако требуются немного другие подходы к ее решению: в отличие от других категорий задач, здесь много операций ввода-вывода, обмена с хранилищами, сетью.

К тому же существует огромное количество возможных вариаций и сочетаний типов данных, структур их хранения и организации хранения. В результате каждое решение для Больших Данных практически уникально.

А не случится ли так, что на волне перехода к облачным вычислениям резко сузится круг организаций — покупателей высокопроизводительных систем?

Что касается потенциальной угрозы для рынка HPC со стороны облачных провайдеров, то, по словам Слепухина, облачное распределение вычислительных узлов пока не имеет конкурентного преимущества перед параллельными кластерами. Поэтому глобального перехода в облака в ближайшие несколько лет ожидать не стоит.

Во-первых, для большинства традиционных вычислительных задач разработано мало новых алгоритмов, позволяющих их решать с помощью облачных вычислений. Во-вторых, на сегодня существуют различия в аппаратной реализации традиционных и облачных высокопроизводительных систем.

Также стоит отметить требования к обеспечению безопасности обрабатываемых данных и каналов связи для передачи данных при работе в облаке. Эти проблемы частично решаются путем построения отраслевых вычислительных центров, в которых консолидируются вычислительные ресурсы, что можно считать неким аналогом частного облака. Поэтому можно говорить о том, что происходит не снижение числа покупателей, а их консолидация для приобретения более мощных кластеров совместного использования.

Мейстер не исключает, что лет через пять значительная часть вычислений может уйти в облака, это будет во многом обусловлено интеграцией сетевых интерфейсов в процессор и уменьшением за счет этого архитектурных различий между разными классами систем.

Между тем, как отмечает Местер, многие организации уже опробовали НРС-системы в облаках. Такие проекты есть у гигантов, наиболее известны из которых Amazon и Google. Скорее всего, малый и средний бизнес уйдут в облака. Крупные же организации и уникальные проекты будут пользоваться своей инфраструктурой, так как она для них удобнее: у них есть персонал для ее поддержки или их задачи настолько инновационны и уникальны, что требуют специализированных решений, невозможных в рамках облачных сервис-провайдеров.

Виртуальная артиллерия

В апреле 2012 года ЦНИИ «Буревестник» запустил гибридный комплекс мощностью 57 TFLOPS. Он предназначен для проектирования артиллерийских комплексов и других перспективных видов вооружений. Применение вычислительных узлов с интегрированными графическими ускорителями позволяет сократить время решения наиболее ресурсоемких задач, связанных с инженерным анализом.

Технологическую основу кластера составило решение Т-Blade V-Сlass. Для хранения и обработки больших объемов информации решение включает в себя систему хранения данных Panasas Active Store 12. Эта система обладает максимальной производительностью среди СХД с параллельной архитектурой.

Внедрение высокопроизводительного кластера поможет существенно сократить сроки и снизить стоимость создания новой продукции за счет компьютерного моделирования техники, условий и процессов их функционирования, а также оптимизации конструкции.

Как подчеркивает руководство «Буревестника», главная задача оборонной отрасли — перейти на качественно новый уровень создания вооружения, задействуя проектное моделирование и виртуальную разработку. При этом отмечается, что использование комплекса, построенного в интересах одного предприятия, не может быть эффективным. Он должен стать катализатором инновационного развития всей отрасли.

Гонка за дешевизной

В истории уже были случаи, когда относительно дешевые чипы вытесняли из систем HPC более быстрые, но дорогостоящие процессоры. Дешевизна и энергоэффективность всегда были важны, и в будущем их влияние на индустрию еще больше увеличится. Пожалуй, для всех современных процессорных архитектур энергоэффективность является ключевым направлением развития.

«История говорит, что успех продукта во многом зависит не от его технических характеристик, а от активного продвижения на рынок и созданной вокруг продукта экосистемы», — иронизирует Слепухин. Процессоры стандартной архитектуры x86, занимающие в настоящий момент подавляющую часть компьютерного рынка, — яркий тому пример. Спад на рынке, вызванный увеличением роли мобильных устройств, привел к тому, что Intel и ARM, чувствовавшие себя монополистами в своих сегментах, вынуждены предпринимать шаги для экспансии на изначально «чужие» для них рынки. Поэтому можно с достаточной долей уверенности предполагать, что в ближайшие годы появятся процессоры с архитектурой ARM, которые могут быть использованы даже в высокопроизводительных системах.

Вполне возможно, сначала появится небольшое число пилотных систем, построенных на базе процессоров архитектуры ARM. Дальнейшая экспансия «мобильных» процессоров в сегмент HPC будет зависеть от практических результатов решения научных задач и от готовности прикладного программного обеспечения.