По прогнозам консорциума исследователей Корейского института науки и технологий, в течение ближайших 10 лет энергопотребление ИИ-ускорителей достигнет 15 КВт на один модуль. Это приведет к перегрузке существующих систем охлаждения центров обработки данных и энергосетей, а также потребует фундаментальных изменений инфраструктуры ЦОДов.

В опубликованном отчете рассматривается, в том числе, масштабирование в видеокартах высокопроизводительной памяти High Bandwidth Memory — от HBM4 в 2026 году до HBM8 к 2038 году. Рабочие нагрузки ИИ, особенно большие языковые модели и крупные предобученные базовые модели требуют высокую пропускную способность памяти и производительность вычислений. Память HBM8 с использованием 16384 интерфейсов ввода-вывода обеспечит быстродействие 64 Тбайт/с. Емкость каждого стека памяти может достигать 240 Гбайт.

Каждая новая модификация HBM повышает производительность, но и предъявляет более серьезные требования к энергопотреблению и тепловыделению. Мощность графических процессоров возрастет с 800 Вт в 2026 году до 1200 Вт к 2035 году, а в сочетании с 32 стеками памяти HBM, каждый из которых потребляет 180 Вт, общая мощность модуля может достичь 15,36 КВт, говорится в отчете.

Самым серьезным препятствием на пути развития ИИ эксперты компании Counterpoint Research называют потребление энергии, так как при переходе от генеративного к агентному ИИ и к ИИ-моделированию сложных физических систем требования к производительности вычислений растут в геометрической прогрессии.

С ростом потребляемой ускорителями мощности до 15 КВт традиционное воздушное охлаждение становится малоэффективным. По оценкам минэнерго США, на охлаждение уже сегодня приходится почти 40% энергопотребления ЦОДов.

Авторы исследования предлагают применять прямое жидкостное охлаждение чипов, погружение оборудования в диэлектрическую жидкость, интегрированные в корпуса микросхем линии теплопередачи. В отводе тепла многослойных кристаллов важнейшую роль будут играть сквозные жидкостные соединения (vias) через кремниевую подложку (F-TSV), полагают они.

Эксперты считают, что резкое увеличение энергопотребления и тепловыделения чревато серьезными проблемами для операторов ЦОДов, так как приведет к коренному пересмотру проектирования дата-центров, включая системы электропитание и охлаждения, а также повлияет на общую архитектуру вычислительных платформ для ИИ. Развитие ИИ-процессоров, таким образом, не только улучшит вычислительные возможности, но и радикально изменит требования к инфраструктуре, что станет важным этапом в эволюции ЦОДов и технологий их охлаждения.