По словам производителя, Pascal обеспечивает 12-кратный прирост производительности по сравнению с архитектурой предыдущего поколения, NVIDIA Maxwell. Одной из особенностей стал интерфейс связи между несколькими графическими NVIDIA NVLink распределяет нагрузку между GPU, увеличивая пропускную способность в 5 раз. NVIDIA NVLink позволяет связать вместе до восьми карт Tesla P100. Двунаправленный интерфейс NVIDIA NVLink обладает скоростью 160 ГБ/с. Ускоритель построен на базе GPU GP100 с 15,3 млрд транзисторов, созданного по 16-нанометровому техпроцессу FinFET. В GPU имеется 3584 потоковых процессора, тактовая частота составляет 1328 МГц, 1480 МГц в режиме Boost. Новый подход к строению памяти CoWoS (Chip-on-Wafer-on-Substrate ) от TSMC с HBM2 (High Bandwidth Memory, память высокой пропускной способности) повышает пропускную способность памяти в 3 раза, до 720ГБ/с, по сравнению с архитектурой Maxwell. Всего используется 16 ГБ памяти CoWoS HBM2 с 4096-битной шиной. Еще одна особенность — инструкции половинной точности, которые обеспечивают пиковую производительность свыше 21 терафлопса в задачах глубокого обучения. Как отмечает NVIDIA, Tesla P100 — первый ускоритель со скоростью вычислений двойной и одинарной точности в 5 и 10 терафлопс соответственно. Показатель TDP достигает 300 Вт. NVIDIA Tesla P100 появятся в составе новой системы глубокого обучения NVIDIA DGX-1 в июне, а в составе серверов — в начале 2017 года.
Источник: NVIDIA