Búfer de ráfagas

En el entorno informático de alto rendimiento , el búfer de ráfagas es una capa de almacenamiento rápida e intermedia ubicada entre los procesos informáticos de front-end y los sistemas de almacenamiento de back-end . Surge como una solución de almacenamiento oportuna para cerrar la brecha de rendimiento cada vez mayor entre la velocidad de procesamiento de los nodos de cómputo y el ancho de banda de entrada / salida (E / S) de los sistemas de almacenamiento. El búfer de ráfagas se crea a partir de matrices de dispositivos de almacenamiento de alto rendimiento, como NVRAM y SSD . Por lo general, ofrece un ancho de banda de E / S de uno a dos órdenes de magnitud mayor que los sistemas de almacenamiento de back-end.

Casos de uso

La aparición del búfer de ráfagas fomenta una amplia variedad de soluciones basadas en búfer de ráfagas que aceleran el movimiento de datos científicos en las supercomputadoras . Por ejemplo, los ciclos de vida de las aplicaciones científicas suelen alternar entre las fases de cálculo y las fases de E / S. ^[1] Es decir, después de cada ronda de cálculo (es decir, fase de cálculo), todos los procesos informáticos escriben simultáneamente sus datos intermedios en los sistemas de almacenamiento de back-end (es decir, fase de E / S), seguido de otra ronda de cálculo y datos. operaciones de movimiento. Con el despliegue del búfer de ráfagas, los procesos pueden escribir rápidamente sus datos en el búfer de ráfagas después de una ronda de cálculo en lugar de escribir en los sistemas de almacenamiento lentos basados en disco duro, y pasar inmediatamente a la siguiente ronda de cómputo sin esperar a que se muevan los datos. a los sistemas de almacenamiento back-end; ^[2]^[3] los datos se vacían de forma asincrónica desde el búfer de ráfagas a los sistemas de almacenamiento al mismo tiempo con la siguiente ronda de cálculo. De esta forma, el largo tiempo de E / S invertido en mover datos a los sistemas de almacenamiento queda oculto detrás del tiempo de cálculo. Además, el almacenamiento en búfer de datos en búfer de ráfagas también brinda a las aplicaciones muchas oportunidades para remodelar el tráfico de datos hacia los sistemas de almacenamiento de back-end para una utilización eficiente del ancho de banda de los sistemas de almacenamiento. ^[4]^[5] En otro caso de uso común, las aplicaciones científicas pueden organizar sus datos intermedios dentro y fuera del búfer de ráfagas sin interactuar con los sistemas de almacenamiento más lentos. Eludir los sistemas de almacenamiento permite que las aplicaciones obtengan la mayor parte del beneficio de rendimiento del búfer de ráfagas. ^[6]

Arquitecturas de búfer de ráfagas representativas

Hay dos arquitecturas de búfer de ráfaga representativas en el entorno informático de alto rendimiento: búfer de ráfaga local de nodo y búfer de ráfaga compartido remoto. En la arquitectura de búfer de ráfaga local de nodo, el almacenamiento de búfer de ráfaga se encuentra en el nodo de cálculo individual, por lo que el ancho de banda del búfer de ráfaga agregado crece linealmente con el recuento de nodos de cálculo. Este beneficio de escalabilidad ha sido bien documentado en la literatura reciente. ^[7]^[8]^[9]^[10] También viene con la demanda de una estrategia de gestión de metadatos escalable para mantener un espacio de nombres global para los datos distribuidos en todos los búferes de ráfagas. ^[11]^[12] En la arquitectura de búfer de ráfaga compartida remota, el almacenamiento de búfer de ráfaga reside en un número menor de nodos de E / S ubicados entre los nodos de cómputo y los sistemas de almacenamiento de back-end. El movimiento de datos entre los nodos de cómputo y el búfer de ráfagas debe pasar por la red. La colocación de búfer de ráfagas en los nodos de E / S facilita el desarrollo, la implementación y el mantenimiento independientes del servicio de búfer de ráfagas. Por lo tanto, se han desarrollado varios productos de software comercializados bien conocidos para administrar este tipo de búfer de ráfagas, como DataWarp e Infinite Memory Engine. Dado que las próximas supercomputadoras se implementarán con múltiples capas de búfer de ráfagas heterogéneas, como NVRAM en los nodos de computación y SSD en los nodos de E / S dedicados, existe un creciente interés en diseñar e implementar una solución de software unificada que se mueva de manera transparente datos en varias capas de almacenamiento. ^[13]^[14]^[15]

Supercomputadoras implementadas con búfer de ráfagas

Debido a su importancia, el búfer de ráfagas se ha implementado ampliamente en las supercomputadoras de escala de liderazgo. Por ejemplo, se ha instalado un búfer de ráfagas de nodo local en la supercomputadora DASH en el Centro de supercomputación de San Diego , ^[16] supercomputadoras Tsubame en el Instituto de Tecnología de Tokio , supercomputadoras Theta y Aurora en el Laboratorio Nacional Argonne , supercomputadora Summit en el Laboratorio Nacional Oak Ridge , y la supercomputadora Sierra en el Laboratorio Nacional Lawrence Livermore , etc. La supercomputadora Tianhe-2 en el Centro Nacional de Supercomputadoras en Guangzhou ha adoptado la memoria intermedia de ráfaga compartida remota , la supercomputadora Trinity en el Laboratorio Nacional de Los Alamos , la supercomputadora Cori en el Laboratorio Nacional Lawrence Berkeley y la supercomputadora ARCHER2 en el Centro de Computación Paralela de Edimburgo .

Referencias

^ Liu, Zhuo; Lofstead, Jay; Wang, Teng; Yu, Weikuan (septiembre de 2013). "Un caso de gestión de energía en todo el sistema para aplicaciones científicas". 2013 IEEE International Conference on Cluster Computing (CLUSTER) . IEEE. págs. 1–8. doi : 10.1109 / CLUSTER.2013.6702681 . ISBN 978-1-4799-0898-1. S2CID 6156410 .
^ Wang, Teng; Oral, Sarp; Wang, Yandong; Settlemyer, Brad; Atchley, Scott; Yu, Weikuan (octubre de 2014). "BurstMem: un sistema de búfer de ráfagas de alto rendimiento para aplicaciones científicas". 2014 IEEE International Conference on Big Data (Big Data) . IEEE. págs. 71–79. doi : 10.1109 / BigData.2014.7004215 . ISBN 978-1-4799-5666-1. S2CID 16764901 .
^ Liu, Ning; Cope, Jason; Carns, Philip; Carothers, Christopher; Ross, Robert; Grider, Gary; Crume, Adam; Maltzahn, Carlos (abril de 2012). "Sobre el papel de los búferes de ráfagas en los sistemas de almacenamiento de clase de liderazgo". 012 28º Simposio de IEEE sobre tecnologías y sistemas de almacenamiento masivo (MSST) . IEEE. págs. 1-11. doi : 10.1109 / MSST.2012.6232369 . ISBN 978-1-4673-1747-4. S2CID 9676920 .
^ Wang, Teng; Oral, Sarp; Pritchard, Michael; Wang, Bin; Yu, Weikuan (septiembre de 2015). "TRIO: Orquestación de E / S basada en búfer de ráfagas". 2015 IEEE International Conference on Cluster Computing . IEEE. págs. 194-203. doi : 10.1109 / CLUSTER.2015.38 . ISBN 978-1-4673-6598-7. OSTI 1265517 . S2CID 12482308 .
^ Kougkas, Anthony; Dorier, Matthieu; Latham, Rob; Ross, Rob; Sun, Xian-He (marzo de 2017). "Aprovechamiento de la coordinación de búfer de ráfagas para evitar interferencias de E / S". 2016 IEEE 12th International Conference on e-Science (E-Science) . IEEE. págs. 371–380. doi : 10.1109 / eScience.2016.7870922 . ISBN 978-1-5090-4273-9. OSTI 1366308 . S2CID 14514395 .
^ Wang, Teng; Mohror, Kathryn; Moody, Adam; Sato, Kento; Yu, Weikuan (noviembre de 2016). "Un sistema de archivos efímero Burst-Buffer para aplicaciones científicas". SC16: Congreso Internacional de Computación, Redes, Almacenamiento y Análisis de Alto Rendimiento . IEEE. págs. 807–818. doi : 10.1109 / SC.2016.68 . ISBN 978-1-4673-8815-3. S2CID 260667 .
^ "BurstFS: un sistema de archivos de búfer de ráfaga distribuido para aplicaciones científicas" (PDF) . Noviembre de 2015.
^ Moody, Adam; Bronevetsky, Greg; Mohror, Kathryn; Supinski, Bronis R. de (noviembre de 2010). "Diseño, modelado y evaluación de un sistema de puntos de control multinivel escalable". 2010 Conferencia Internacional ACM / IEEE para Computación, Redes, Almacenamiento y Análisis de Alto Rendimiento . ACM. págs. 1-11. doi : 10.1109 / SC.2010.18 . ISBN 978-1-4244-7557-5. S2CID 7352923 .
^ "Un sistema de archivos de 1 PB / s para controlar tres millones de tareas MPI" (PDF) . ACM. Junio del 2013.
^ Zhao, Dongfang; Zhang, Zhao; Zhou, Xiaobing; Li, Tonglin; Wang, Ke; Kimpe, Dries; Carns, Philip; Ross, Robert; Raicu, Ioan (octubre de 2014). "FusionFS: Hacia el apoyo de aplicaciones científicas de datos intensivos en sistemas informáticos de alto rendimiento de escala extrema". 2014 IEEE International Conference on Big Data (Big Data) . IEEE. págs. 61–70. doi : 10.1109 / BigData.2014.7004214 . ISBN 978-1-4799-5666-1. S2CID 5288472 .
^ Wang, Teng; Moody, Adam; Zhu, Yue; Mohror, Kathryn; Sato, Kento; Islam, Tanzima; Yu, Weikuan (mayo de 2017). "MetaKV: un almacén de valor clave para la gestión de metadatos de búferes de ráfaga distribuidos". 2017 IEEE International Parallel and Distributed Processing Symposium (IPDPS) . IEEE. págs. 1174-1183. doi : 10.1109 / IPDPS.2017.39 . ISBN 978-1-5386-3914-6. S2CID 8148699 .
^ Li, Tonglin; Zhou, Xiaobing; Brandstatter, Kevin; Zhao, Dongfang; Wang, Ke; Rajendran, Anupam; Zhang, Zhao; Raicu, Ioan (mayo de 2013). "ZHT: una tabla hash distribuida de salto cero, escalable, dinámica, persistente, liviana y confiable". 2013 IEEE 27th International Symposium on Parallel and Distributed Processing . IEEE. págs. 775–787. CiteSeerX 10.1.1.365.7329 . doi : 10.1109 / IPDPS.2013.110 . ISBN 978-1-4673-6066-1. S2CID 16614868 .
^ Wang, Teng; Byna, Suren; Dong, Bin; Tang, Houjun (septiembre de 2018). "UniviStor: almacenamiento jerárquico y distribuido integrado para HPC". 2018 IEEE International Conference on Cluster Computing (CLUSTER) . IEEE. págs. 134-144. doi : 10.1109 / CLUSTER.2018.00025 . ISBN 978-1-5386-8319-4. S2CID 53235423 .
^ "Hermes: un sistema de almacenamiento en búfer de E / S distribuidas de múltiples niveles heterogéneo". ACM. Junio de 2018. doi : 10.1145 / 3208040.3208059 . S2CID 47019714 . Cite journal requiere |journal=( ayuda )
^ Tang, Houjun; Byna, Suren; Tessier, Francois; Wang, Teng; Dong, Bin; Mu, Jingqing; Koziol, Quincey; Soumagne, Jerome; Vishwanath, Venkatram; Liu, Jialin; Warren, Richard (mayo de 2018). "Hacia una gestión de datos escalable y asincrónica centrada en objetos para HPC". 2018 18o Simposio Internacional IEEE / ACM sobre Computación en Cluster, Cloud y Grid (CCGRID) . IEEE. págs. 113-122. doi : 10.1109 / CCGRID.2018.00026 . ISBN 978-1-5386-5815-4. S2CID 13811397 .
^ "DASH: una receta para una supercomputadora intensiva en datos basada en Flash" (PDF) . ACM. Noviembre de 2010.

enlaces externos

Cray DataWarp , un sistema de búfer de ráfagas de producción desarrollado por Cray.
Infinite Memory Engine , un sistema de búfer de ráfagas de producción desarrollado por Data Direct Network.
Supercomputadora Theta , una supercomputadora alojada en el Laboratorio Nacional Argonne.
Supercomputadora Summit , una supercomputadora alojada en el Laboratorio Nacional de Oak Ridge.
Supercomputadora Sierra , una supercomputadora alojada en el Laboratorio Nacional Nacional de Lawrence.
Supercomputadora Trinity , una supercomputadora alojada en el Laboratorio Nacional de Los Alamos.
Supercomputadora Cori , una supercomputadora alojada en el Laboratorio Nacional Lawrence Berkeley.

[1] Liu, Zhuo; Lofstead, Jay; Wang, Teng; Yu, Weikuan (septiembre de 2013). "Un caso de gestión de energía en todo el sistema para aplicaciones científicas". 2013 IEEE International Conference on Cluster Computing (CLUSTER) . IEEE. págs. 1–8. doi : 10.1109 / CLUSTER.2013.6702681 . ISBN 978-1-4799-0898-1. S2CID 6156410 .

[2] Wang, Teng; Oral, Sarp; Wang, Yandong; Settlemyer, Brad; Atchley, Scott; Yu, Weikuan (octubre de 2014). "BurstMem: un sistema de búfer de ráfagas de alto rendimiento para aplicaciones científicas". 2014 IEEE International Conference on Big Data (Big Data) . IEEE. págs. 71–79. doi : 10.1109 / BigData.2014.7004215 . ISBN 978-1-4799-5666-1. S2CID 16764901 .

[3] Liu, Ning; Cope, Jason; Carns, Philip; Carothers, Christopher; Ross, Robert; Grider, Gary; Crume, Adam; Maltzahn, Carlos (abril de 2012). "Sobre el papel de los búferes de ráfagas en los sistemas de almacenamiento de clase de liderazgo". 012 28º Simposio de IEEE sobre tecnologías y sistemas de almacenamiento masivo (MSST) . IEEE. págs. 1-11. doi : 10.1109 / MSST.2012.6232369 . ISBN 978-1-4673-1747-4. S2CID 9676920 .

[4] Wang, Teng; Oral, Sarp; Pritchard, Michael; Wang, Bin; Yu, Weikuan (septiembre de 2015). "TRIO: Orquestación de E / S basada en búfer de ráfagas". 2015 IEEE International Conference on Cluster Computing . IEEE. págs. 194-203. doi : 10.1109 / CLUSTER.2015.38 . ISBN 978-1-4673-6598-7. OSTI 1265517 . S2CID 12482308 .

[5] Kougkas, Anthony; Dorier, Matthieu; Latham, Rob; Ross, Rob; Sun, Xian-He (marzo de 2017). "Aprovechamiento de la coordinación de búfer de ráfagas para evitar interferencias de E / S". 2016 IEEE 12th International Conference on e-Science (E-Science) . IEEE. págs. 371–380. doi : 10.1109 / eScience.2016.7870922 . ISBN 978-1-5090-4273-9. OSTI 1366308 . S2CID 14514395 .

[burstfs-6] Wang, Teng; Mohror, Kathryn; Moody, Adam; Sato, Kento; Yu, Weikuan (noviembre de 2016). "Un sistema de archivos efímero Burst-Buffer para aplicaciones científicas". SC16: Congreso Internacional de Computación, Redes, Almacenamiento y Análisis de Alto Rendimiento . IEEE. págs. 807–818. doi : 10.1109 / SC.2016.68 . ISBN 978-1-4673-8815-3. S2CID 260667 .

[7] "BurstFS: un sistema de archivos de búfer de ráfaga distribuido para aplicaciones científicas" (PDF) . Noviembre de 2015.

[8] Moody, Adam; Bronevetsky, Greg; Mohror, Kathryn; Supinski, Bronis R. de (noviembre de 2010). "Diseño, modelado y evaluación de un sistema de puntos de control multinivel escalable". 2010 Conferencia Internacional ACM / IEEE para Computación, Redes, Almacenamiento y Análisis de Alto Rendimiento . ACM. págs. 1-11. doi : 10.1109 / SC.2010.18 . ISBN 978-1-4244-7557-5. S2CID 7352923 .

[9] "Un sistema de archivos de 1 PB / s para controlar tres millones de tareas MPI" (PDF) . ACM. Junio del 2013.

[10] Zhao, Dongfang; Zhang, Zhao; Zhou, Xiaobing; Li, Tonglin; Wang, Ke; Kimpe, Dries; Carns, Philip; Ross, Robert; Raicu, Ioan (octubre de 2014). "FusionFS: Hacia el apoyo de aplicaciones científicas de datos intensivos en sistemas informáticos de alto rendimiento de escala extrema". 2014 IEEE International Conference on Big Data (Big Data) . IEEE. págs. 61–70. doi : 10.1109 / BigData.2014.7004214 . ISBN 978-1-4799-5666-1. S2CID 5288472 .

[11] Wang, Teng; Moody, Adam; Zhu, Yue; Mohror, Kathryn; Sato, Kento; Islam, Tanzima; Yu, Weikuan (mayo de 2017). "MetaKV: un almacén de valor clave para la gestión de metadatos de búferes de ráfaga distribuidos". 2017 IEEE International Parallel and Distributed Processing Symposium (IPDPS) . IEEE. págs. 1174-1183. doi : 10.1109 / IPDPS.2017.39 . ISBN 978-1-5386-3914-6. S2CID 8148699 .

[12] Li, Tonglin; Zhou, Xiaobing; Brandstatter, Kevin; Zhao, Dongfang; Wang, Ke; Rajendran, Anupam; Zhang, Zhao; Raicu, Ioan (mayo de 2013). "ZHT: una tabla hash distribuida de salto cero, escalable, dinámica, persistente, liviana y confiable". 2013 IEEE 27th International Symposium on Parallel and Distributed Processing . IEEE. págs. 775–787. CiteSeerX 10.1.1.365.7329 . doi : 10.1109 / IPDPS.2013.110 . ISBN 978-1-4673-6066-1. S2CID 16614868 .

[13] Wang, Teng; Byna, Suren; Dong, Bin; Tang, Houjun (septiembre de 2018). "UniviStor: almacenamiento jerárquico y distribuido integrado para HPC". 2018 IEEE International Conference on Cluster Computing (CLUSTER) . IEEE. págs. 134-144. doi : 10.1109 / CLUSTER.2018.00025 . ISBN 978-1-5386-8319-4. S2CID 53235423 .

[14] "Hermes: un sistema de almacenamiento en búfer de E / S distribuidas de múltiples niveles heterogéneo". ACM. Junio de 2018. doi : 10.1145 / 3208040.3208059 . S2CID 47019714 . Cite journal requiere |journal=( ayuda )

[15] Tang, Houjun; Byna, Suren; Tessier, Francois; Wang, Teng; Dong, Bin; Mu, Jingqing; Koziol, Quincey; Soumagne, Jerome; Vishwanath, Venkatram; Liu, Jialin; Warren, Richard (mayo de 2018). "Hacia una gestión de datos escalable y asincrónica centrada en objetos para HPC". 2018 18o Simposio Internacional IEEE / ACM sobre Computación en Cluster, Cloud y Grid (CCGRID) . IEEE. págs. 113-122. doi : 10.1109 / CCGRID.2018.00026 . ISBN 978-1-5386-5815-4. S2CID 13811397 .

[16] "DASH: una receta para una supercomputadora intensiva en datos basada en Flash" (PDF) . ACM. Noviembre de 2010.

[1]