по прочтениям

Рандомизация задач ускорит вычисления в многоядерных системах

fujitsuС каждым новым поколением процессоров увеличивается количество вычислительных ядер, и исследователи изучают возможности более эффективного использования многоядерной архитектуры. В Массачусетском технологическом институте решили отойти от традиционного механизма обслуживания задач «первый пришел – первым обслужен» и внести в этот процесс элемент случайности. Новый алгоритм под названием SprayList позволяет многоядерным процессорам распределять нагрузку так, что они не ожидают друг друга, создавая «узкие места» и снижая производительность. Предполагается, что подобные алгоритмы позволят увеличить эффективность функционирования таких многядерных процессоров как новый 18-ядерный серверный процессор Intel E5 2600v3.

 

читать дальше > 01.02.2015

Теги: Новости, конкурентные вычисления, Серверы

AppliedMicro выпустит 64-ядерный процессор ARM для серверов

AppliedMicro X-Gene 3Cерверные процессоры AppliedMicro X-Gene 3 архитектуры ARM будут содержать до 64 ядер. Ближайшим конкурентом X-Gene 3 считается процессор Cavium ThunderX с 48 ядрами, анонсированный в июне. Процессоры X-Gene 2 прежнего поколения насчитывали до 16 ядер. Тестирование X-Gene 3 производителями серверов начнется в следующем году. Новые процессоры с тактовой частотой до 3 ГГц будут потреблять до 160 Вт. Серверы с такими процессорами будут применяться для таких задач как Web-хостинг, облачные приложения и высокопроизводительные вычисления. Будущий процессор ARM от Advanced Micro Devices Opteron A1100 (Seattle) использует восемь ядер. AppliedMicro предпринимает активные усилия для создания экосистемы X-Gene. 

13.08.2014

Теги: newsexport, Новости, Процессоры, Серверы

Intel работает над многоядерным процессором Xeon Phi следующего поколения

Knights LandingIntel обнародовала информацию о процессорах Intel Xeon Phi следующего поколения с кодовым названием Knights Landing и его компонентах: новой высокоскоростной вычислительной сети, которая будет встроена в базовое устройство, а также высокоскоростной встроенной памяти, которые совместно позволят повысить скорость научных исследований. В настоящее время такая память и сеть доступна в качестве отдельных компонентов для сервера, что ограничивает производительность и вычислительную плотность суперкомпьютеров. Новое сетевое решение Intel Omni Scale Fabric разработано с учетом требований следующих поколений систем для высокопроизводительных вычислений (HPC). Оно будет встроено в процессоры Intel Xeon Phi следующего поколения и в будущие модели процессоров Intel Xeon. Такая интеграция направлена на то, чтобы соответствовать требуемому уровню производительности, масштабируемости, надежности, мощности и плотности монтажа супервычислительных систем будущего.

 

читать дальше > 24.06.2014

Теги: newsexport, Высокопроизводительные системы, Суперкомпьютеры, Новости

Исследователи из Массачусетского технологического института разработали 36-ядерный процессор

chipНовый экспериментальный процессор должен сократить число циклов, требуемых для выполнения задачи, и повысить общую производительность. Для этого потребовалось добиться согласованной передачи между вычислительными ядрами и кэш-памятью. Используя мини-маршрутизаторы, исследователи разработали новый способ пересылки пакетов данных в многоядерном процессоре и увеличили внутреннюю полосу пропускания. Новый процессор предназначен для хорошо распараллеливаемых приложений, таких как финансовая аналитика и моделирование элементарных частиц. Внутренняя сеть процессора может «предвидеть» поступление пакетов данных. Большие наборы данных разбиваются на фрагменты и передаются между ядрами, имеющими собственный кэш для временного хранения данных. Если ядру требуются конкретные данные, другие ядра получают широковещательный запрос. При этом занимается часть полосы пропускания, и для решения данной проблемы исследователи использовали прямые коммуникации между ядрами и кэш-памятью, которая может «предвидеть» запросы и приоритезировать пакеты данных. Внутренняя сеть обеспечивает упорядоченный обмен данными и когерентность кэша. Передаваемые между ядрами сообщения и запросы передаются более целенаправленно, в результате снижаются непроизводительные издержки и требования к полосе пропускания. По результатам измерений, производительность 36- и 64-ядерных моделей процессоров увеличивается на 24,1% и на 12,9% по сравнению с их аналогами без внутренней сети. В 36-ядерном процессоре используются ядра архитектуры Power от Freescale Semiconductor, а изготовлен он по 45-нм процессу. Коммерческие поставки не планируются – это чисто экспериментальное изделие. В планах исследователей – изучение влияние внутренней сети  на работу процессоров с сотнями и тысячами ядер. В прошлом году Массачусетский технологический институт разработал 110-ядерный процессор с общей памятью без кэша. 

24.06.2014

Теги: Новости