В компании ARM представили лицензируемую платформу (Compute Subsystems, CSS) Lumex, предназначенную для локальной поддержки задач ИИ в мобильных устройствах, которая содержит набор процессорных ядер C1, графическую подсистему и оптимизированный программный стек. Новые процессорные ядра, разработанные для производства по 3-нм техпроцессу, способны, по данным компании, увеличить до 25% однопоточную производительность по сравнению с процессорами серии Cortex X925, выпущенными в мае 2024 года.

ARM является пионером концепции эффективных и производительных процессорных ядер — стратегии Big-Little, открывшей новую эру энергоэффективных вычислений. В платформе Lumex представлены четыре типа ядер: производительные — C1-Ultra и C1-Premium, а также энергоэффективные — C1-Pro и C1-Nano. Эти ядра основаны на архитектуре ARMv9.3-A с поддержкой расширенного набора команд SME2 (Scalable Matrix Extension 2), значительно ускоряющего матричные вычисления, который используются многими ИИ-алгоритмами.

В ARM заявили, что ядро Premium может заменять Ultra в не относящихся к флагманам недорогих устройствах, поскольку у него такая же производительность, но занимаемая площадь на 35% меньше. C1 Pro, в свою очередь, опережает Cortex A75 по производительности и эффективности, а Nano занимает наименьшую площадь и будет использоваться и во флагманских устройствах, и в устройствах начального уровня. ИИ, как ожидают, будет потреблять в три раза меньше энергии, чем предыдущие реализации, а Pro — на 12 % меньше при той же частоте.

Для реализации функций ИИ в ARM применяют не выделенный нейронный процессор, а технологию KleidiAI, которая, использует для этого центральный процессор и программные библиотеки и не зависит от версии архитектуры Arm. Производительность задач ИИ в кластере процессоров C1 вырастет в пять раз, утверждают представители компании.

Это должно повысить производительность таких приложений с ИИ, как генерация аудиоконтента, интеллектуальная обработка изображений в камере (camera inferencing), компьютерное зрение. В частности, в распознавании речи и в задачах с большими языковыми моделями ожидается уменьшения задержки более чем в 4,7 раза, а ускорение генерации аудио — примерно в 2,8 раза.

В ARM также представли графический процессор Mali G1-Ultra, который по сравнению с предыдущим Immortalis-G925 «обещает увеличение графической производительности на 20%, двукратный рост производительности в трассировке лучей, 20-процетное увеличение — в обработке ИИ, а также будет потреблять меньше энергии».

Тесное сотрудничество с производителями чипов должно ускорить вывод объявленных продуктов на рынок, полагают в ARM.