В Broadcom намерены улучшить масштабирование сетей Ethernet в ЦОДах с помощью нового сетевого чипа Tomahawk Ultra, оптимизированного для высокопроизводительных вычислений и масштабируемых приложений ИИ. По данным компании, его главные преимущества в коммутаторах — задержка менее 250 нс при сохранении пропускной способности до 51,2 Тбит/с даже при использовании минимальных 64-байтовых пакетов, а также производительность — до 77 млрд пакетов в секунду.
Пакеты минимального размера особенно важны для высокопроизводительных вычислений, приложения для которых используют различные API, включая интерфейсы передачи сообщений параллельного программирования — MPI (Message Passing Interface), а также поддерживаются системами с симметричной иерархической памятью SHEM (Symmetric Hierarchical Memory).
Эти применения требуют передачи очень маленьких пакетов данных, на полной пропускной способности, что особенно важно для научных и вычислительных задач, а также масштабируемых сетей, где обмен данными между графическими процессорами происходит с помощью только одного устройства (single hop).
Еще одной особенностью Tomahawk Ultra является поддержка исключающей потерю данных технологии Lossless Ethernet за счет реализации некоторых функций, которые впервые полностью определены в в июньской спецификации Ultra Ethernet Consortium (UEC) 1.0.
Для этого на канальном уровне используется повторная передача данных на основе анализа кода с исправлением ошибок FEC (Forward Error Correction), в процессе обработки которого пакет может быть передан повторно по запросу чипа. Предусмотрено также управление потоком на основе кредитов CBFC (Credit-Based Flow Control), предотвращающее потерю пакетов из-за переполнения буфера за счет контроля числа разрешенных пакетов (кредита) и формирования сигналов приостановки или разрешения их передачи.
Наряду с этим, Tomahawk Ultra повышает производительность вычислений, используя технологию коллективных сетевых операций INC (In-network collectives), в ходе которых графические процессоры обмениваются результатами вычислений и объединяют их. Коммутатор теперь, разгружая процессоры может получать их данные, выполнять вычислительные операции, а затем передавать результаты всем графическим процессорам.
Tomahawk Ultra будет поддерживать спецификацию Broadcom Scale-Up Ethernet (SUE), которую в Broadcom передали в ассоциацию Open Compute Project, чтобы сделать общедоступной. В Broadcom хотят превратить Ethernet в «жизнеспособную открытую альтернативу таким проприетарным технологиям, как Nvidia NVLink, причем с более высокой производительностью и широкой поддержкой экосистемы». SUE является также альтернативой спецификации консорциума UALink (Ultra Accelerator Link), которая появилась в мае.