El Centro Nacional de Computación Científica de Investigación de Energía , o NERSC , es una instalación de usuario de computación de alto rendimiento (supercomputadora) operada por el Laboratorio Nacional Lawrence Berkeley para la Oficina de Ciencia del Departamento de Energía de los Estados Unidos . Como centro de computación de la misión para la Oficina de Ciencias, NERSC alberga sistemas de datos y computación de alto rendimiento utilizados por 7.000 científicos en laboratorios nacionales y universidades de todo el país. La supercomputadora más nueva y más grande de NERSC es Cori, [1] que ocupó el quinto lugar en la lista TOP500 de las supercomputadoras más rápidas del mundo en noviembre de 2016. [2] NERSC se encuentra en el campus principal de Berkeley Lab enBerkeley, California .
Historia
NERSC fue fundado en 1974 como el Centro de Computación de Investigación Termonuclear Controlada, o CTRCC, en el Laboratorio Nacional Lawrence Livermore.El centro fue creado para proporcionar recursos de computación a la comunidad de investigación de energía de fusión y comenzó con una computadora Control Data Corporation 6600 (SN-1) . La primera máquina adquirida directamente por el centro fue una CDC 7600, instalada en 1975 con un rendimiento máximo de 36 megaflop / s (36 millones de operaciones de coma flotante por segundo). En 1976, el centro pasó a llamarse Centro Nacional de Computación de Energía de Fusión Magnética.
Las supercomputadoras posteriores incluyeron una Cray-1 (SN-6), que se llamó la máquina "c", instalada en mayo de 1978, y en 1985 la primera Cray-2 (SN-1) del mundo, que era la máquina "b", apodado "Burbujas" debido a las burbujas visibles en el fluido de su exclusivo sistema de refrigeración líquida directa. En 1983, el centro comenzó a proporcionar una pequeña parte de sus recursos a investigadores fuera de la comunidad de fusión. A medida que el centro apoyaba cada vez más la ciencia en muchas áreas de investigación, cambió su nombre por el de Centro Nacional de Supercomputación de Investigación de Energía en 1990.
En 1995, el Departamento de Energía (DOE) tomó la decisión de trasladar NERSC de LLNL al Laboratorio Nacional Lawrence Berkeley . Se instaló un grupo de sistemas Cray J90 en Berkeley antes de que se cerraran los sistemas principales de Livermore para la mudanza en 1996, lo que garantiza un apoyo continuo para la comunidad de investigadores. Como parte de la medida, el centro pasó a llamarse Centro Nacional de Computación Científica de Investigación Energética, pero mantuvo el acrónimo NERSC. En 2000, NERSC se mudó a un nuevo sitio en Oakland para adaptarse a la creciente huella de supercomputadoras refrigeradas por aire.
En noviembre de 2015, NERSC regresó al sitio principal de Berkeley Lab y se encuentra en Shyh Wang Hall. [3] Al igual que con el traslado de LLNL, se instaló por primera vez un nuevo sistema en Berkeley antes de que se desmontaran y trasladaran las máquinas de Oakland.
Ordenadores
Para reflejar la misión de NERSC de apoyar la investigación científica, el centro nombra sus principales sistemas en honor a los científicos. El centro está ubicado en Shyh Wang Hall, una de las instalaciones de supercomputadoras con mayor eficiencia energética del país. El edificio fue financiado por la Universidad de California, que administra Berkeley Lab para el Departamento de Energía de EE. UU. (DOE). El DOE proporciona la infraestructura de servicios públicos y los sistemas informáticos.
La supercomputadora más nueva, Perlmutter, lleva el nombre de Saul Perlmutter, un astrofísico del Berkeley Lab que compartió el Premio Nobel de Física 2011 por sus contribuciones a la investigación que muestra que la expansión del universo se está acelerando. [4]
La supercomputadora, Cori, recibe su nombre en honor a Gerty Cori , una bioquímica que fue la primera mujer estadounidense en recibir un premio Nobel de ciencia. Cori es un sistema Cray XC40 con 622,336 núcleos de procesador Intel y un rendimiento máximo teórico de 30 petaflop / s (30 cuatrillones de operaciones por segundo). Cori se entregó en dos fases. La primera fase, también conocida como Partición de datos, se instaló a fines de 2015 y comprende 12 gabinetes y más de 1,600 nodos de cómputo Intel Xeon "Haswell". Se personalizó para respaldar la ciencia intensiva en datos y el análisis de grandes conjuntos de datos a través de una combinación de configuraciones de hardware y software y políticas de cola.
La segunda fase [5] de Cori, instalada en el verano de 2016, [6] agregó otros 52 gabinetes y más de 9.300 nodos con procesadores Intel Xeon Phi de segunda generación (cuyo nombre en código es Knights Landing, o KNL para abreviar), lo que convierte a Cori en el el mayor sistema de supercomputación para ciencia abierta basado en procesadores KNL. Con 68 núcleos físicos activos en cada KNL y 32 en cada procesador Haswell, Cori tiene casi 700.000 núcleos de procesador. Las dos fases de Cori se integran a través de la interconexión Cray Aries, que tiene una topología de red libélula que proporciona un ancho de banda escalable.
Cori cuenta con un Burst Buffer basado en la tecnología Cray DataWarp. Burst Buffer, una capa de almacenamiento NVRAM de 1,5 PB, se encuentra entre la memoria del nodo de cómputo y el sistema de archivos scratch paralelo Lustre de 30 petabytes de Cori. El búfer de ráfagas proporciona aproximadamente 1,5 TB / s de ancho de banda de E / S, más del doble que el del sistema de archivos temporal. NERSC también ha agregado funciones de red definidas por software a Cori para mover datos dentro y fuera del sistema de manera más eficiente, brindando a los usuarios conectividad de extremo a extremo y ancho de banda para el análisis de datos en tiempo real, y una cola en tiempo real para los sensibles al tiempo. análisis de datos.
Está programado que Edison sea reemplazado por Perlmutter a fines de 2020.
El sistema ahora retirado de NERSC es Edison, un Cray XC30 nombrado en honor al inventor y científico estadounidense Thomas Edison , que tiene un rendimiento máximo de 2,57 petaflop / s. Completamente instalado en 2014, Edison consta de 133,824 núcleos de cómputo para ejecutar aplicaciones científicas, 357 terabytes de memoria y 7,56 petabytes de almacenamiento en disco en línea con un ancho de banda de E / S máximo de 168 gigabytes (GB) por segundo. apagado y retirado con la unidad enviada de nuevo a cray. [7]
Otros sistemas en NERSC incluyen:
- PDSF, un grupo de computación distribuida en red diseñado principalmente para cumplir con los requisitos de simulación de detectores y análisis de datos de las colaboraciones en física, astrofísica y ciencia nuclear. PDSF es el clúster de Linux en funcionamiento continuo más largo del mundo.
- Genepool, un clúster basado en Intel dedicado a las necesidades informáticas del DOE Joint Genome Institute .
- Una instalación de sistema de almacenamiento de alto rendimiento (HPSS) de 100 petabytes [8] para almacenamiento de archivos. En uso desde 1998, HPSS es un sistema de almacenamiento masivo moderno, flexible y orientado al rendimiento. NERSC fue uno de los desarrolladores originales de HPSS, junto con otros cinco laboratorios DOE e IBM.
Las instalaciones de NERSC son accesibles a través de Energy Sciences Network , o ESnet, que también es administrado por el Laboratorio Nacional Lawrence Berkeley para el Departamento de Energía.
Proyectos
El personal de NERSC está liderando una serie de proyectos especiales para promover la ciencia computacional y al mismo tiempo ayudar a preparar a la comunidad de investigación en general para la era de la exaescala . Algunos ejemplos son:
NESAP : El Programa de Aplicaciones Científicas Exascale de NERSC es un esfuerzo colaborativo en el que NERSC se asocia con equipos de código y desarrolladores de bibliotecas y herramientas para preparar aplicaciones críticas para hacer el uso más efectivo de la arquitectura de muchos núcleos de Cori. NESAP representa una oportunidad importante para que los investigadores preparen códigos de aplicación para la nueva arquitectura y ayuden a avanzar en las misiones de la Oficina de Ciencias del Departamento de Energía. La asociación NESAP permite que 20 proyectos colaboren con NERSC, Cray e Intel al proporcionar acceso a hardware temprano, capacitación especial y sesiones de preparación con el personal de Intel y Cray. Ocho de esos 20 también tendrán la oportunidad de que un investigador postdoctoral investigue problemas de ciencia computacional asociados con sistemas de muchos núcleos energéticamente eficientes.
Shifter : NERSC está trabajando para aumentar la flexibilidad y la usabilidad de sus sistemas HPC habilitando la tecnología de contenedores Linux similar a Docker. Desarrollado por el personal de NERSC, Shifter es una herramienta de software de código abierto basada en contenedores Docker que permite a los usuarios de NERSC analizar más fácilmente conjuntos de datos de instalaciones experimentales. Dichos contenedores permiten empaquetar una aplicación con toda su pila de software, incluidas algunas partes de los archivos del sistema operativo base, además de definir las variables de entorno de usuario necesarias y el "punto de entrada" de la aplicación.
HPC4Mfg (Computación de alto rendimiento para la fabricación): NERSC es uno de los tres centros de supercomputación del DOE que trabajan para crear un ecosistema que permite a los expertos de los laboratorios nacionales del DOE trabajar directamente con los miembros de la industria manufacturera para enseñarles cómo adoptar o mejorar el uso de la computación de alto rendimiento. (HPC) para abordar los desafíos de fabricación con el objetivo de aumentar la eficiencia energética, reducir los impactos ambientales y promover tecnologías de energía limpia. El proyecto está dirigido por el Laboratorio Nacional Lawrence Livermore.
Comunidad de usuarios de NERSC
En 2016, NERSC apoyó a casi 7.000 usuarios activos de universidades, laboratorios nacionales e industrias que utilizaron alrededor de 3 mil millones de horas de supercomputación. NERSC tiene usuarios en 49 estados de EE. UU., Así como en 45 países de todo el mundo.
Los investigadores universitarios representaron aproximadamente la mitad de todo el tiempo de computación utilizado (1,23 millones) en 2016, seguidos por los laboratorios del DOE (1,51 millones), otros laboratorios gubernamentales (157 millones), la industria (32 millones) y las organizaciones sin fines de lucro (1 millón).
Las 10 principales áreas de investigación (en términos de tiempo de computación) son la energía de fusión, la ciencia de los materiales, el clima, la QCD de celosía, la química, la astrofísica, la física de altas energías, la física nuclear, la informática y las geociencias.
De las 129 universidades que utilizan NERSC, la Universidad de California en San Diego registra la mayor cantidad de tiempo de cómputo (141 millones de horas) con la Universidad de Arizona, el Instituto de Tecnología de Massachusetts, la Universidad de California Berkeley, la Universidad de Princeton, la Universidad de California en Los Ángeles, la Universidad de Kentucky. , La Universidad de California Irvine, la Universidad George Washington y la Universidad de Chicago completan el top 10.
Geográficamente, 5.853 de los usuarios de NERSC se encuentran en América del Norte, 30 en América del Sur, siete en África, 335 en la región de Oriente Medio / Asia Pacífico y 662 en Europa.
Referencias
- ^ "Cori Cray XC40 2016" . www.nersc.gov . Consultado el 23 de marzo de 2017 .
- ^ "Noviembre de 2016 | Sitios de supercomputadoras TOP500" . TOP500 . Consultado el 23 de marzo de 2017 .
- ^ "Berkeley Lab abre una instalación de vanguardia para la ciencia computacional | Berkeley Lab" . Centro de noticias . 2015-11-12 . Consultado el 8 de febrero de 2018 .
- ^ "Perlmutter" .
- ^ "Nodos Cori Intel Xeon Phi (KNL)" . www.nersc.gov . Consultado el 9 de febrero de 2018 .
- ^ "Cori Supercomputer ahora completamente instalado en Berkeley Lab" . www.nersc.gov . Consultado el 9 de febrero de 2018 .
- ^ "Supercomputadora Edison de NERSC para retirarse después de cinco años de servicio" .
- ^ "Acerca de" . www.nersc.gov . Consultado el 8 de febrero de 2018 .
enlaces externos
- Sitio web principal de NERSC
- Historia de NERSC
- ESnet
- Lista TOP500
- Inauguración de Wang Hall en NERSCC