Процессор общего назначения обучает нейросети в 15 раз быстрее, чем GPU

05.07.2021

30529 прочтений

Исследователи свели глубинное обучение к задаче поиска, которую можно эффективно решить с использованием хеш-таблиц, и исключив огромное количество операций перемножения векторов.

Специалисты Intel и Университета Райса убеждены, что методы оптимизации вполне способны избавить мир от нынешних затрат на обучение глубоких нейронных сетей — сегодня для этой цели применяются мощные графические процессоры, стоящие в разы дороже, чем центральные процессоры общего назначения. GPU принято использовать, поскольку при работе нейросетей выполняется огромное количество операций перемножения матриц, с которыми лучше всего справляются именно видеопроцессоры.

В рамках совместного исследования научные сотрудники двух организаций пришли к выводу о возможности сведения задачи глубинного обучения к задаче поиска, которую можно решить с использованием хеш-таблиц. Реализованный ими движок обучения SLIDE способен выполняться на обычных центральных процессорах, без использования специализированных программно-аппаратных архитектур. Недавно та же группа представила доработанную версию движка, производительность которой была повышена благодаря использованию ускорителей векторизации и работы с памятью, которыми оснащаются процессоры новых поколений.

Как выяснили разработчики, благодаря избавлению от операций перемножения матриц обучение моделей искусственного интеллекта с помощью улучшенного SLIDE на обычном процессоре происходит в 15 раз быстрее, чем на графическом.

Процессор общего назначения обучает нейросети в 15 раз быстрее, чем GPU

Zero Trust и Data Governance: как управление данными превращает дата-каталог в ядро контура безопасности