Evaluación comparativa de las instancias Tesla® de Tensorflow
Resumen de los resultados del modelo de prueba para la clasificación de imágenes con servidores Tesla® LeaderGPU
LeaderGPU® es un nuevo actor en el mercado del GPU computing que pretende cambiar las reglas del juego. En este momento, el mercado de GPU computing está formado por varios grandes actores como Amazon AWS, Google Cloud, etc. Sin embargo, un gran actor no siempre significa la mejor oferta del mercado. El proyecto LeaderGPU®, en comparación con Amazon AWS y Google Cloud, ofrece servidores físicos, no VPS, en los que los recursos de hardware pueden compartirse entre varias decenas de usuarios.
Las pruebas se realizaron en los sistemas informáticos LeaderGPU® Tesla® sobre datos sintéticos de los siguientes modelos de red: ResNet-50, ResNet-152, VGG16 y AlexNet. Al final de este artículo encontrará los resultados de las pruebas realizadas con otros modelos. Las pruebas de datos sintéticos se realizaron utilizando tf.Variable en analogía con los modelos configurados para ImageNet.
Se utilizaron los siguientes comandos para ejecutar la prueba:
git clone https://github.com/tensorflow/benchmarks.git
python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model alexnet (vgg11, vgg16, etc.) --batch_size 32 (64, 128, 256, 512)
Instancias Tesla® de LeaderGPU
Entorno de prueba: 2 x Tesla® P100 PCI (ltbv32), 2 x Tesla® V100 PCI (ltbv20), 2 x Tesla® V100 NVLink™ (ltbv46)
Tipo de instancia: 2 x Tesla® P100 PCI (ltbv32), 2 x Tesla® V100 PCI (ltbv20), 2 x Tesla® V100 NVLink (ltbv46)
Opciones |
Inception V3 |
VGG16 |
ResNet-50 |
ResNet-152 |
Alexnet |
Tamaño del lote en la GPU |
64 |
32 |
64 |
32 |
512 |
Optimización |
sgd |
sgd |
sgd |
sgd |
sgd |

Prueba de datos sintéticos (imágenes / s)
GPUs | InceptionV3 | VGG16 | ResNet-50 | ResNet-152 | Alexnet |
2x P100 |
268.24 | 224.90 | 446.08 | 150.04 | 5252.43 |
2x PCI V100 |
430.77 | 309.82 | 667.62 | 213.04 | 7545.40 |
2x NVlink™ V100 |
450.75 | 417.22 | 698.97 | 236.90 | 8786.56 |
Otros resultados
Prueba de datos sintéticos (imágenes / s)
2x PCI Tesla® P100
Tamaño del lote | Alexnet | vgg11 | vgg16 | vgg19 | lenet | googlenet |
32 | 1411.48 | 378.47 | 224.90 | 199.87 | 14944.76 | 788.43 |
64 | 2460.54 | 473.82 | 256.68 | 225.58 | 29215.60 | 913.38 |
128 | 3576.26 | 539.08 | 278.83 | 243.67 | 47375.83 | 1035.37 |
256 | 4545.45 | 561.73 | - | - | 67116.75 | 1127.05 |
512 | 5252.43 | - | - | - | 83665.27 | 1165.75 |
Tamaño del lote | sobrecarga | inceptionv3 | inception4 | red50 | resnet101 | resnet152 |
32 | 548.55 | 248.72 | 122.22 | 389.73 | 220.26 | 150.04 |
64 | 952.51 | 268.24 | 133.96 | 446.08 | 253.86 | 176.09 |
128 | 1437.54 | 283.39 | - | 483.51 | - | - |
256 | 1847.21 | - | - | - | - | - |
512 | 2186.47 | - | - | - | - | - |
2x PCI Tesla® V100
Tamaño del lote | Alexnet | vgg11 | vgg16 | vgg19 | lenet | googlenet |
32 | 1665.82 | 526.55 | 309.82 | 282.81 | 17583.47 | 1268.95 |
64 | 3056.89 | 695.42 | 374.22 | 331.41 | 32271.30 | 1487.77 |
128 | 4660.06 | 831.39 | 410.27 | 360.79 | 62652.62 | 1704.92 |
256 | 6255.16 | 729.42 | - | - | 98828.17 | 1921.02 |
512 | 7545.40 | - | - | - | 136553.56 | 2039.60 |
Tamaño del lote | sobrecarga | inceptionv3 | inception4 | red50 | resnet101 | resnet152 |
32 | 625.35 | 371.94 | 186.38 | 579.01 | 318.30 | 213.04 |
64 | 1194.50 | 430.77 | 210.41 | 667.62 | 379.37 | 259.16 |
128 | 1934.71 | 462.09 | - | 746.73 | - | - |
256 | 2690.65 | - | - | - | - | - |
512 | 3267.15 | - | - | - | - | - |
2x NVlink™ Tesla® V100
Tamaño del lote | Alexnet | vgg11 | vgg16 | vgg19 | lenet | googlenet |
32 | 3743.79 | 775.95 | 417.22 | 360.08 | 12460.77 | 1250.49 |
64 | 5514.97 | 904.65 | 447.46 | 386.92 | 28038.87 | 1546.01 |
128 | 6990.88 | 982.62 | 465.05 | 401.43 | 50064.03 | 1791.36 |
256 | 7960.86 | 805.59 | - | - | 94842.75 | 1895.35 |
512 | 8786.56 | - | - | - | 131914.42 | 2158.45 |
Tamaño del lote | sobrecarga | inceptionv3 | inception4 | red50 | resnet101 | resnet152 |
32 | 1404.21 | 397.70 | 195.51 | 602.97 | 341.20 | 236.90 |
64 | 2216.08 | 450.75 | 220.00 | 698.97 | 395.01 | 272.37 |
128 | 3005.20 | 475.38 | - | 781.50 | - | - |
256 | 3656.48 | - | - | - | - | - |
512 | 4073.38 | - | - | - | - | - |
Actualizado: 18.03.2025
Publicado: 26.04.2018