«Паскаль» дает умные ответы | Computerworld Россия | Издательство «Открытые системы»

Для идентификации объектов, объезда препятствий и смены полос автономным автомобилям нужны дополнительные вычислительные мощности. В сложившейся ситуации графические процессоры получают неплохой шанс проявить себя.

Держа в голове такой сценарий, Nvidia представила два новых графических процессора, Tesla P4 и P40, созданные на основе архитектуры Pascal и предназначенные для установки в серверы или компьютеры, которые будут оказывать автономным автомобилям помощь в управлении. В последнее время графические процессоры Tesla были ориентированы на суперкомпьютеры, теперь же их целью становятся системы глубинного обучения, помогающие классифицировать данные и устанавливать взаимосвязи между ними.

Под «глубинным обучением» обычно понимаются алгоритмические технологии, базирующиеся на нейронных сетях — системах простых процессоров (искусственных нейронов), соединенных друг с другом и упорядоченно взаимодействующих между собой.

По мере увеличения объемов данных, собираемых различными системами и устройствами, растет потребность в системах глубинного обучения, позволяющих получать ответы на задаваемые вопросы путем анализа данных с учетом текущего контекста.

Facebook и Google, например, используют графические процессоры в системах глубинного обучения, предназначенных для распознавания образов и обработки естественного языка. В Nvidia утверждают, что платформа распознавания речи Baidu Deep Speech 2 построена на основе графических процессоров Tesla.

Новые модели Tesla обладают значительной по меркам графических процессоров вычислительной мощностью. Чип P40 имеет 3840 ядер CUDA, обеспечивает производительность 12 TFLOPS при выполнении операций одинарной точности, поддерживает 24 Гбайт памяти GDDR5 и потребляет 250 ватт электрической мощности. У P4 имеется 2560 ядер и 8 Гбайт памяти GDDR5. Его производительность при выполнении операций одинарной точности составляет 5,5 TFLOPS, а потребляемая мощность — 75 ватт.

Особенности графических процессоров делают их пригодными для построения систем глубинного обучения. Такие чипы обычно отличаются высоким быстродействием при выполнении операций двойной точности. Новые же модели Tesla поддерживают еще и низкоуровневые вычисления. Каждое ядро обрабатывает определенную порцию информации, при этом блоки данных можно объединять друг с другом для соответствующей интерпретации информации с целью распознавания, например, объектов, присутствующих в изображении, или фраз, которые произносят люди во время беседы.

В начале текущего года Nvidia представила процессор Tesla P100, который опережает по быстродействию P4 и P40.

Корпорация Intel также анонсировала чип Knights Mill, который будет предназначен для глубинного обучения.