Benchmark del desafío de HPC

HPC Challenge Benchmark combina varios puntos de referencia para probar una serie de atributos independientes del rendimiento de los sistemas informáticos de alto rendimiento (HPC). El proyecto ha sido copatrocinado por el programa DARPA High Productivity Computing Systems , el Departamento de Energía de los Estados Unidos y la National Science Foundation . ^[2]

Benchmark del desafío de HPC
Autor (es) original (es)	Laboratorio de Computación Innovadora, Universidad de Tennessee
Versión inicial	2003 ( 2003 )

Lanzamiento estable	1.5.0 / 18 de marzo de 2016 ; Hace 5 años ^[1] ( 18/03/2016 )

Plataforma	Multiplataforma
Licencia	BSD
Sitio web	icl .cs .utk .edu / hpcc /

Contexto

El rendimiento de aplicaciones complejas en sistemas HPC puede depender de una variedad de atributos de rendimiento independientes del hardware. El HPC Challenge Benchmark es un esfuerzo por mejorar la visibilidad en este espacio multidimensional al combinar la medición de varios de estos atributos en un solo programa.

Aunque los atributos de rendimiento de interés no son específicos de ninguna arquitectura de computadora en particular, la implementación de referencia del HPC Challenge Benchmark en C y MPI asume que el sistema bajo prueba es un grupo de sistemas multiprocesador de memoria compartida conectados por una red . Debido a esta suposición de una estructura de sistema jerárquica, la mayoría de las pruebas se ejecutan en varios modos de funcionamiento diferentes. Siguiendo la notación utilizada por los informes de referencia, los resultados etiquetados como "único" significan que la prueba se ejecutó en un procesador elegido al azar en el sistema, los resultados etiquetados como "estrella" significan que una copia independiente de la prueba se ejecutó simultáneamente en cada procesador en el sistema, y los resultados etiquetados como "global" significan que todos los procesadores estaban trabajando en coordinación para resolver un solo problema (con datos distribuidos a través de los nodos del sistema).

Componentes

El benchmark actualmente consta de 7 pruebas (con los modos de operación indicados para cada una):

HPL ^[3] ( LINPACK de alto rendimiento ): mide el rendimiento de un solucionador para un sistema denso de ecuaciones lineales (global).
DGEMM : mide el rendimiento para la multiplicación matriz-matriz (simple, estrella).
STREAM ^[4] : mide el ancho de banda de memoria sostenido hacia / desde la memoria (simple, estrella).
PTRANS: mide la velocidad a la que el sistema puede transponer una matriz grande (global).
RandomAccess : mide la tasa de actualizaciones de 64 bits para elementos seleccionados al azar de una tabla grande (única, estrella, global).
FFT: realiza una Transformada Rápida de Fourier en un gran vector unidimensional utilizando el algoritmo generalizado de Cooley-Tukey (único, estrella, global).
Ancho de banda y latencia de la comunicación: medidas de rendimiento centradas en MPI basadas en la prueba comparativa ^de ancho de banda / latencia b_eff ^[5] .

Atributos de rendimiento

En un nivel alto, las pruebas están destinadas a proporcionar cobertura de cuatro atributos importantes de rendimiento: aritmética de punto flotante de doble precisión (DGEMM y HPL), ancho de banda de memoria local (STREAM), ancho de banda de red para mensajes "grandes" (PTRANS, RandomAccess , FFT, b_eff) y ancho de banda de red para mensajes "pequeños" (RandomAccess, b_eff). Algunos de los códigos son más complejos que otros y pueden tener sensibilidades de rendimiento adicionales. Por ejemplo, en algunos sistemas, el rendimiento de HPL puede verse limitado por el ancho de banda de la red y / o la latencia de la red.

Competencia

La competencia anual de premios HPC Challenge Award en la Conferencia de Supercomputación se centra en cuatro de los puntos de referencia más desafiantes de la suite:

HPL global
Global RandomAccess (O BSS Random Access Benchmark )
EP STREAM (Triad) por sistema
FFT global

Hay dos clases de premios:

Clase 1 : Mejor rendimiento en una ejecución base u optimizada enviada al sitio web de HPC Challenge. ^[6]
Clase 2 : Implementación más "elegante" de cuatro o cinco núcleos computacionales, incluidos tres o más de los puntos de referencia del HPC Challenge. ^[7]

Ver también

Localidad de referencia

Referencias

^ "Lanzamientos · icl-utk-edu / hpcc" . github.com . Consultado el 12 de abril de 2021 .
^ "La supercomputadora Cray X1 tiene las puntuaciones más altas informadas en las pruebas comparativas del desafío HPC patrocinadas por el gobierno" . 2004-06-14. Archivado desde el original el 4 de mayo de 2012 . Consultado el 22 de enero de 2010 .
^ "HPL - Una implementación portátil del Benchmark Linpack de alto rendimiento para computadoras de memoria distribuida" . Laboratorio de Computación Innovadora, Universidad de Tennessee en Knoxville . Consultado el 10 de junio de 2015 .
^ "STREAM: ancho de banda de memoria sostenible en equipos de alto rendimiento" . Consultado el 10 de junio de 2015 .
^ "Benchmark de ancho de banda efectivo (b_eff)" . Centro de Computación de Alto Rendimiento de Stuttgart . Consultado el 10 de junio de 2015 .
^ El punto de referencia está diseñado para permitir la sustitución de un conjunto limitado de funciones con versiones más optimizadas sin dejar de ser una ejecución "básica". Se permiten modificaciones adicionales (pero aún limitadas) en la categoría de ejecuciones "optimizadas".
^ "Concurso de premios HPC Challenge" . Programa DARPA HPCS . Consultado el 23 de enero de 2010 .

enlaces externos

Sitio web oficial de HPC Challenge Benchmark
Sitio web oficial del concurso de premios HPC Challenge
BSS Random Access Benchmark Performance Evaluation and Optimization of Random Memory Access on Multicores with High Productivity (Best Paper Award) en ACM / IEEE HiPC 2010

[1] "Lanzamientos · icl-utk-edu / hpcc" . github.com . Consultado el 12 de abril de 2021 .

[2] "La supercomputadora Cray X1 tiene las puntuaciones más altas informadas en las pruebas comparativas del desafío HPC patrocinadas por el gobierno" . 2004-06-14. Archivado desde el original el 4 de mayo de 2012 . Consultado el 22 de enero de 2010 .

[3] "HPL - Una implementación portátil del Benchmark Linpack de alto rendimiento para computadoras de memoria distribuida" . Laboratorio de Computación Innovadora, Universidad de Tennessee en Knoxville . Consultado el 10 de junio de 2015 .

[4] "STREAM: ancho de banda de memoria sostenible en equipos de alto rendimiento" . Consultado el 10 de junio de 2015 .

[5] "Benchmark de ancho de banda efectivo (b_eff)" . Centro de Computación de Alto Rendimiento de Stuttgart . Consultado el 10 de junio de 2015 .

[6] El punto de referencia está diseñado para permitir la sustitución de un conjunto limitado de funciones con versiones más optimizadas sin dejar de ser una ejecución "básica". Se permiten modificaciones adicionales (pero aún limitadas) en la categoría de ejecuciones "optimizadas".

[7] "Concurso de premios HPC Challenge" . Programa DARPA HPCS . Consultado el 23 de enero de 2010 .

[2]