Training ResNet-50, set di dati: ImageNet2012, BS=256 | Confronto con NVIDIA V100: server NVIDIA DGX-2™, 1 V100 SXM3-32GB, MXNet 1.5.1, container=19.11-py3, precisione mista, produttività: 1.525 immagini/sec | Confronto con Intel: Supermicro SYS-1029GQ-TRT, Intel Gold 6240 a 2 GHz/3.9 Hz Turbo socket singolo, Tensorflow 0.18, FP32 (unica precisione disponibile), produttività: 48 immagini/sec
GPU NVIDIA V100 TENSOR CORE
La prima GPU Tensor Core