На конференции Siggraph представители Nvidia анонсировали графические ускорители RTX Pro 6000 Blackwell Server Edition и заявили о возможности их установки в стоечные серверы высотой 2U.
Новые карты предназначены для повышения эффективности ресурсоемких ИИ-приложений, аналитических систем, комплексов моделирования, обработки видео и рендеринга высококачественной графики. Они отличаются более тонкими, чем предыдущие модели, корпусами и адресуются локальным центрам обработки данных среднего размера, где устанавливаемые в стойки 2U-серверы — наиболее востребованные вычислительные системы.
Это первый случай, когда видеокарты RTX предлагаются в таком форм-факторе. Ранее для них требовались конструктивы 4U-8U с более высокими затратами на энергопотребление и охлаждение.
Теперь партнеры Nvidia, включая Cisco, Dell, HPE, Lenovo и Supermicro, будут предлагать заказчикам серверы на базе процессоров x86-архитектуры с двумя графическими картами RTX Pro 6000 Blackwell в различных конфигурациях. К примеру, в Dell уже анонсировали сервер PowerEdge R7725 2U с двумя графическими ускорителями RTX Pro 6000, созданными на основе платформы Nvidia AI Data.
Эти видеокарты высотой 2U обладают полной функциональностью, обеспечивающей ускорение рабочих ИИ-нагрузок с помощью оборудования Nvidia, поясняют разработчики. Они содержат платформы для обработки данных BlueField-3 DPUs с пропускной способностью 400 Гбит/с, а также высокопроизводительные сетевые адаптеры ConnectX-8 со встроенными коммутаторами PCIe Gen6 с 48 линиями.
В Nvidia утверждают, что новые карты RTX Pro в 45 раз опережают по производительности и в 18 раз по энергоэффективности 2U-системы, работающие только на центральных процессорах. В компании рассматривают серверы с RTX Pro как альтернативу локальным вычислительным системам для поддержки ИИ-приложений, укомплектованным только центральными процессорами.
В Nvidia представили также готовые к использованию на предприятиях модели с расширенными возможностями формирования логических выводов — Nemotron Nano 2 и Llama Nemotron Super 1.5. По данным компании, они обеспечивают высокую точность в таких областях, как научные рассуждения, кодирование, использование инструментов, выполнение инструкций и общение в чате. Эти модели наделяют ИИ-агентов более глубокими когнитивными способностями и помогают системам ИИ изучать варианты, взвешивать решения, а также добиваться результатов в рамках заданных ограничений.