Nvidia DGX


Nvidia DGX es una línea de servidores y estaciones de trabajo producidos por NVIDIA que se especializan en el uso de GPGPU para acelerar las aplicaciones de aprendizaje profundo .

Los servidores DGX-1 cuentan con 8 GPU basadas en las tarjetas secundarias Pascal o Volta [1] con memoria HBM 2 , conectadas por una red de malla NVLink . [2] El DGX-1 se anunció el 6 de abril de 2016. [3]

La línea de productos está destinada a cerrar la brecha entre las GPU y los aceleradores de inteligencia artificial, ya que el dispositivo tiene características específicas que lo especializan para cargas de trabajo de aprendizaje profundo. [4] El DGX-1 basado en Pascal inicial entregó 170 teraflops de procesamiento de precisión media , [5] mientras que la actualización basada en Volta aumentó esto a 960 teraflops . [6]

La sucesora de la Nvidia DGX-1 es la Nvidia DGX-2, que utiliza 16 tarjetas V100 de 32 GB (segunda generación) en una sola unidad. Fue anunciado el 27 de marzo de 2018 [7] . Esto aumenta el rendimiento de hasta 2 Petaflops con 512 GB de memoria compartida para abordar problemas más grandes y utiliza NVSwitch para acelerar la comunicación interna.

Además, hay una versión de mayor rendimiento del DGX-2, el DGX-2H con una diferencia notable siendo el reemplazo del Dual Intel Xeon Platinum 8168 a 2.7 GHz con Dual Intel Xeon Platinum 8174 a 3.1 GHz [8]

Anunciado y lanzado el 14 de mayo, 2020 fue la tercera generación de servidor de DGX, incluyendo 8 amperios -basado A100 aceleradores. [9] También se incluyen 15 TB de almacenamiento PCIe gen 4 NVMe , [10] dos CPU AMD Rome 7742 de 64 núcleos , 1 TB de RAM e interconexión HDR InfiniBand con tecnología Mellanox . El precio inicial del servidor DGX A100 fue de 199.000 dólares. [9]


Un bastidor que contiene cinco supercomputadoras DGX-1