В Nvidia разработали чип, способный одновременно обрабатывать более миллиона токенов

09.10.2025

1133 прочтения

Компания развивает инфраструктуру и повышает эффективность «фабрик ИИ» на базе новой архитектуры Rubin

В Nvidia анонсировали графические процессоры нового поколения для ИИ и стоечные платформы, предназначенные для обработки огромных объемов данных, кодирования токенов и создания генеративного видео. Новые чипы основаны на архитектуре Nvidia следующего поколения – Rubin, которая приходит на смену технологии Blackwel.

Базовый графический процессор Rubin, ориентированный на задачи обучения и формирование логических выводов ИИ, поддерживает длинные контекстные окна. В его состав входят два процессорных кристалла с производительностью 25 PFLOPS каждый, межсоединение NVLink и 288 Гбайт высокопроизводительной памяти HBM4.

Процессор Rubin CPX содержит один кристалл с производительностью до 30 PFLOPS для операций с 4-битным форматом данных NVFP4, а также 128 Гбайт памяти GDDR7. Этот чип предназначен для логических выводов ИИ и работы с моделями, использующими длинные контексты, и способен обрабатывать более млн токенов одновременно. Rubin CPX поддерживает аппаратное кодирование и декодирование видео.

Память GDDR7 обладает достаточной производительностью и процессор Rubin CPX обеспечивает трехкратное ускорение при работе с длинными контекстами по сравнению с системой GB300 NVL72, утверждают в Nvidia. Сообщается также, но без конкретных данных, о меньшей стоимости Rubin CPX по сравнению с Rubin.

В Nvidia пояснили, что процессоры Rubin CPX разработаны для роста производительности вычислений больших языковых моделей на этапе предварительного заполнения процесса формирования логических выводов. Их совместная работа с чипами Rubin с высокоскоростной памятью HBM, осуществляющими вывод результатов на фазе генерации этого процесса, должна значительно повысить производительность «фабрик ИИ».

Новая стоечная платформа Vera Rubin NVL144 CPX содержит по 144 графических процессора Rubin CPX и Rubin, 36 новых центральных ARM-процессоров Vera, ускоряющих обучение глубоких нейронных сетей и логические выводы, 100 Тбайт памяти HBM4 с пропускной способностью 1,7 Пбайт/с, а также сетевые интерфейсы Quantum-X800 InfiniBand или Spectrum-X Ethernet с сетевыми адаптерами ConnectX-9 NIC. Платформа обладает производительностью 8 EFPLOPS при вычислениях в формате NVFP4 и, согласно Nvidia, в 7,5 раз опережает топовую модель GB300 NVL72.

В двухстоечной конфигурации процессоры Vera и графические процессоры Rubin размещены в одной стойке, а Rubin CPX – в другой. Таким образом, можно будет приобретать системы без серверов CPX, с серверами CPX в отдельной стойке и «смешанные» серверные конфигурации.

Коммерческий выпуск продуктов на основе архитектуры Rubin ожидается с середины и до конца 2026 года. По словам представителей Nvidia, инвестиции в новые системы в размере 100 млн долл могут принести до 5 млрд дохода за счет продажи услуг и продуктов с поддержкой ИИ, включая использования связанных с ИИ токенов в экосистемах блокчейна и криптовалют, а также роста их стоимости.

В Nvidia разработали чип, способный одновременно обрабатывать более миллиона токенов

Zero Trust и Data Governance: как управление данными превращает дата-каталог в ядро контура безопасности