Tesla P4 и Tesla P40 созданы на основе новой архитектуры Pascal и заточены под ускорение действий нейросетей по распознаванию речи, изображений и текста в ответ на запрос пользователей или устройств. Для этого они используют специальные инструкции на базе 8-битных данных (INT8). По словам производителя, это обеспечивает в 45 раз более быстрый ответ по сравнению CPU и в 4 раза быстрее по сравнению с GPU, представленными меньше года назад.
Ускоритель Tesla P40 предназначен для сложных и масштабных задач глубокого обучения и заточен на обеспечение максимальной пропускной способности. Tesla P4 отличается экономичностью и компактностью, предназначен для масштабируемых дата-центров. Энергопотребление последнего стартует от 50 Вт. Как отмечает NVIDIA, это в 40 раз экономичнее CPU в задачах использования результатов обучения нейронных сетей при обработке данных. Более того, заявлено, что сервер с одним Tesla P4 может заменить 13 серверов на базе CPU, предназначенных для анализа данных. Сервер же с восемью ускорителями Tesla P40, по словам NVIDIA, может заменить 140 серверов на базе CPU. Характеристики NVIDIA Tesla P4 и P40:
ТФЛОПС одинарной точности: 5,5; 12
INT8 TOPS (тера-операций в секунду): 22; 47
Ядра CUDA: 2560; 3840
Память GPU GDDR5: 8 ГБ; 24 ГБ
Полоса пропускания памяти: 192 ГБ/с; 346 ГБ/с
Энергопотребление: 50 Вт (и выше); 250 Вт
Видеоускорители NVIDIA Tesla P4 и P40 станут доступны в ноябре и октябре, соответственно, в сертифицированных серверах от сборщиков систем и других партнеров NVIDIA.
Источник: NVIDIA