El SW26010 es un procesador de muchos núcleos de 260 núcleos diseñado por el Centro Nacional de Diseño de Circuitos Integrados de Alto Rendimiento en Shanghai . Implementa la arquitectura Sunway , una arquitectura de computación de conjunto de instrucciones reducido (RISC) de 64 bits diseñada en China . [1] El SW26010 tiene cuatro grupos de 64 elementos de procesamiento informático (CPE) que están dispuestos en una matriz de ocho por ocho. Los CPE admiten instrucciones simples, instrucciones de datos múltiples (SIMD) y son capaces de ejecutar ocho puntos flotantes de precisión doble. operaciones por ciclo. Cada grupo está acompañado por un núcleo de propósito general más convencional llamado Elemento de procesamiento de gestión (MPE) que proporciona funciones de supervisión. [1] Cada clúster tiene su propio controlador SDRAM DDR3 dedicado y un banco de memoria con su propio espacio de direcciones . [2] [3] El procesador funciona a una velocidad de reloj de 1,45 GHz. [4]
Los núcleos CPE cuentan con 64 KB de memoria scratchpad para datos y 16 KB para instrucciones , y se comunican a través de una red en un chip , en lugar de tener una jerarquía de caché tradicional . [5] Los MPE tienen una configuración más tradicional, con cachés de datos e instrucciones L1 de 32 KB y un caché L2 de 256 KB . [1] Finalmente, la red en chip se conecta a una interfaz de interconexión de sistema único que conecta el chip al mundo exterior.
El SW26010 se utiliza en la supercomputadora Sunway TaihuLight , que entre marzo y junio de 2018 fue la supercomputadora más rápida del mundo según la clasificación del proyecto TOP500 . [6] El sistema usa 40,960 SW26010s para obtener 93.01 PFLOPS en el punto de referencia LINPACK .
Ver también
- Matriz de procesadores masivamente paralelos
- Loongson , otra arquitectura desarrollada en China
- Adapteva
- Celda (microprocesador)
Referencias
- ↑ a b c Dongarra, Jack (20 de junio de 2016). "Informe sobre el sistema Sunway TaihuLight" (PDF) . www.netlib.org . Consultado el 20 de junio de 2016 .
- ^ Fu, Haohuan; Liao, Junfeng; Yang, Jinzhe; et al. (2016). "La supercomputadora Sunway TaihuLight: sistema y aplicaciones" . Sci. China Inf. Sci . 59 (7). doi : 10.1007 / s11432-016-5588-7 .
- ^ Trader, Tiffany (19 de junio de 2016). "China estrena 93-Petaflops 'Sunway' con procesadores de cosecha propia" . Alambre HPC . Consultado el 21 de junio de 2016 .
Cada núcleo del CPE tiene una única tubería de punto flotante que puede realizar 8 flops por ciclo por núcleo (aritmética de punto flotante de 64 bits) y el MPE tiene una tubería dual, cada una de las cuales puede realizar 8 flops por ciclo por tubería (64 bits aritmética de coma flotante).
- ^ Hemsoth, Nicole (20 de junio de 2016). "Una mirada al interior de la nueva supercomputadora líder en las listas de China" . La próxima plataforma . Consultado el 20 de junio de 2016 .
- ^ Lendino, Jamie (20 de junio de 2016). "Conozca la nueva supercomputadora más rápida del mundo: TaihuLight de China" . Extremetech . Consultado el 21 de junio de 2016 .
El informe TOP500 dice que el chip también carece de caché L1-L2-L3 tradicional y, en cambio, tiene 12 KB de caché de instrucciones y 64 KB de "memoria virtual" local que funciona como una caché L1.
- ^ "Top 500 The List: noviembre de 2016" . TOP 500 . 14 de noviembre de 2016 . Consultado el 26 de noviembre de 2016 .