DiaGrid (red informática distribuida)


DiaGrid es una gran red informática de investigación distribuida en varios campus que utiliza el sistema HTCondor y tiene su centro en la Universidad de Purdue en West Lafayette, Indiana . En 2012, incluía casi 43 000 procesadores que representaban 301 teraflops de potencia informática. DiaGrid recibió un premio Campus Technology Innovators de la revista Campus Technology [1] y un premio IDG InfoWorld 100 [2] en 2009 y se empleó en la conferencia de supercomputación SC09 en Portland, Oregon, para capturar casi 150 días de tiempo de cómputo para trabajos científicos. . [3]

DiaGrid es una asociación con Purdue, la Universidad de Indiana, la Universidad Estatal de Indiana , la Universidad de Notre Dame , la Universidad de Louisville , la Universidad de Nebraska , la Universidad de Wisconsin , los campus de Calumet y North Central de Purdue , y la Universidad de Indiana-Universidad de Purdue Fort Wayne . Está diseñado para acomodar computadoras en otros campus a medida que se unen nuevos miembros. La parte de Purdue del grupo, llamada BoilerGrid, es el sistema académico más grande de su tipo.

DiaGrid es administrado por Information Technology at Purdue (ITaP), la organización central de tecnología de la información en el campus de West Lafayette de Purdue, y la unidad informática de investigación de ITaP, el Rosen Center for Advanced Computing, que también opera las supercomputadoras de clúster Steele , Coates , Rossmann, Hansen y Carter. .

A través de HTCondor , desarrollado en la Universidad de Wisconsin, DiaGrid recolecta y administra los ciclos de cómputo de nodos de clúster de cómputo de alto rendimiento inactivos o infrautilizados, servidores, máquinas en la computadora del campus y otros laboratorios, y computadoras de oficina. Cada vez que un usuario local o un trabajo programado necesita una máquina determinada, el trabajo de HTCondor se detiene y se envía automáticamente a otro nodo de HTCondor lo antes posible. Si bien este modelo "oportunista" limita la capacidad de realizar comunicaciones y procesamiento en paralelo , un grupo HTCondor puede proporcionar trabajos en serie más pequeños, una gran cantidad de ciclos en un período de tiempo muy corto. HTCondor, y por extensión, DiaGrid, está diseñado para computación de alto rendimiento y es excelente para barridos de parámetros, simulación de Monte Carlo., o casi cualquier aplicación en serie. Algunas clases de trabajos paralelos (maestro-trabajador) también se pueden ejecutar de manera efectiva a través de HTCondor.

Para agrupar los recursos informáticos repartidos por Indiana y el Medio Oeste, DiaGrid aprovecha I-Light, la red estatal de fibra óptica de alta velocidad que conecta los campus de Indiana entre sí, Internet y las redes nacionales de investigación como Internet2 y National LambdaRail . DiaGrid proporciona recursos computacionales a los investigadores tanto en Open Science Grid como en el sistema Extreme Science and Engineering Discovery Environment (anteriormente TeraGrid ) de la Fundación Nacional de Ciencias de EE. UU .

Investigadores de Purdue y otros lugares han utilizado DiaGrid y BoilerGrid para una variedad de propósitos, [1] como obtener imágenes de la estructura de virus en resoluciones casi atómicas, [4] [5] simular las primeras etapas de la formación del Sistema Solar, proyectando la confiabilidad del suministro eléctrico de Indiana, modelando la propagación de los contaminantes del agua, discerniendo la estructura de las moléculas de proteínas e identificando millones de nuevas formas potenciales de zeolitas , minerales de silicato ampliamente utilizados para catalizar reacciones químicas a escala industrial. [6] DiaGrid también se está utilizando para desarrollar técnicas de procesamiento de datos para el Gran Telescopio de Rastreo Sinóptico.. Purdue agregó un portal web para el procesamiento BLAST con DiaGrid en 2011.