NVIDIA Volta hace su debut con acelerador Tesla V100: 5,120 CUDA Cores y HBM 2

No ha pasado mucho tiempo desde que fue introducida la GeForce GTX 1080 Ti como la tarjeta de video más poderosa del mundo con arquitectura “Pascal” de 14nm. Pero de acuerdo a la conferencia de Jen Hsun Huang, CEO de NVIDIA, que tuvo lugar el día de ayer en GTC 2017, lo mejor todavía está por llegar.

Durante esta plática se abordaron diferentes temas relacionados a cómo el GPU está ayudando a resolver problemas de cómputo en áreas como Inteligencia Artificial y HPC (Cómputo de alto rendimiento), pero para nosotros lo más interesante fue que dieron a conocer un vistazo de lo que podemos esperar de productos basados en la arquitectura “Volta” de la cual se habló por primera vez por allá del 2013.

GTC2017-01

En concreto, el anuncio más importante tuvo que ver con el nuevo acelerador NVIDIA Tesla V100 el cual está basado en el GPU GV100 “Volta” y que a su vez reemplazará al actual GPU GP100 “Pascal” que usa el acelerador Tesla P100.

NVIDIA-GPU-Volta-Die-Mexico

¿Qué hace interesante a este nuevo GPU GV100 “Volta”? Antes que nada, no se trata de una versión mejorada del GPU “Pascal” que tiene mayor cantidad de núcleos sino de una arquitectura completamente nueva diseñada desde cero que, entre varias cosas, usa un nuevo tipo de núcleos denominados Tensor Cores.

NVIDIA-GPU-Volta-Die-Diagram-Mexico

Para empezar, el GPU GV100 “Volta” está fabricado por TSMC mediante un proceso de manufactura FFN a 12nm y se trata del chip más grande nunca antes creado por NVIDIA ya que tiene un área de 815mm2 que reúne la impresionante cantidad de 21.1 mil millones de transistores. Básicamente, esto significa que es 33% más grande y tiene 37% más transistores que el GPU GP100 “Pascal”.

NVIDIA-GPU-Volta-GV100-Mexico

El tamaño no es lo único impresionante GPU GV100 “Volta”. Internamente, se localizan 84 SMs con 64 CUDA Cores que dan como resultado una impresionante cantidad de 5,376 núcleos para cómputo de punto flotante de simple precisión (FP32), otros 2688 CUDA Cores para cómputo de punto flotante de doble precisión (FP64), y 640 “Tensor Cores”.

NVIDIA-GPU-Volta-Tensor-core-Mexico

Éstos últimos, los “Tensor Core”, son un nuevo tipo de núcleo dedicado para Volta que están enfocados para mejorar el rendimiento en entrenamientos de redes neuronales. Su característica es que pueden realizar operaciones de multiplicación de matrix-matrix por SM y así entregar mayor poder de cómputo.

NVIDIA-GPU-Volta-Tensor-core-Matrix-matrix

A modo comparación, mientras que un núcleo CUDA Core tradicional solo entregaría 256FLOPS por ciclo al realizar operaciones FP16, un núcleo Tensor Core es capaz de entregar 1024 FLOPS. De acuerdo a NVIDIA, esto representa una mejora de rendimiento de hasta 4 veces comparado a Pascal en redes neuronales.

NVIDIA-GPU-Volta-tensor-core-Performance-Mexico

Otro de los apartados interesantes del acelerador Tesla V100 es que el GPU GV100 “Volta” no está solo. En este caso viene en un módulo SMX que a su vez está conectado mediante una interfaz NV-LINK que entrega un ancho de banda de 300 Gb/s y 16GB de memoria HBM 2 (segunda generación) de Samsung. Esto da como resultado una mejora de hasta 1.5 veces mayor ancho de banda comparado a lo que ofrece el GPU GP100 “Pascal.”

NVIDIA-Volta-GPU-HBM2

Disponibilidad, precio

El acelerador NVIDIA Tesla V100 tendrá un precio  $5,000 dólares, mientras que su precio en una supercomputadora NVIDIA DGX-1 con cuatro Tesla V100 será de 149,000 dólares. Se espera para el Q3 de 2017. En cuanto a productos para consumidor como tarjetas de video con GPU “Volta” todavía no hay palabra oficial, pero nos atrevemos a especular que podríamos ver algo a finales de este 2017 o hasta el 2018.

NVIDIA-GPU-Volta-price-mexico

Más información | NVIDIA

Leave a Reply