Nirvana era un software de almacenamiento de objetos virtuales desarrollado y mantenido por General Atomics.
![]() | |
Desarrollador (es) | Atómica general |
---|---|
Versión inicial | 8 de agosto de 2003 |
Lanzamiento estable | 5.0 / 15 de septiembre de 2016 |
Versión de vista previa | 5.1 / 15 de septiembre de 2016 |
Escrito en | C |
Sistema operativo | Linux , Microsoft Windows , OS X , Solaris (sistema operativo) |
Plataforma | X86-64 , POWER8 , SPARC |
Tipo | Software de gestión de datos y metadatos |
Licencia | Software comercial patentado |
Sitio web | www |
También se puede describir como software de metadatos , colocación de datos y administración de datos que permite a las organizaciones administrar datos no estructurados en múltiples dispositivos de almacenamiento ubicados en cualquier parte del mundo para orquestar flujos de trabajo intensivos de datos globales y buscar y ubicar datos sin importar dónde se encuentren. o cuando fue creado. Nirvana hace esto capturando el sistema y los metadatos definidos por el usuario para permitir una búsqueda detallada y promulgar políticas para controlar el movimiento y la protección de los datos. Nirvana también mantiene la procedencia , auditoría , seguridad y control de acceso de los datos .
Nirvana puede reducir los costos de almacenamiento al identificar los datos que se moverán a un almacenamiento de menor costo y los datos que ya no necesitan almacenarse.
Historia
Nirvana es el resultado de una investigación iniciada en 1995 en el San Diego Supercomputer Center (SDSC) (que fue fundado y dirigido en ese momento por General Atomics [1] ), en respuesta a un proyecto patrocinado por DARPA para un sistema de análisis de datos masivo. [2] Dirigido por el físico de plasma computacional de General Atomics Dr. Reagan Moore, el desarrollo continuó a través de los esfuerzos cooperativos de General Atomics y SDSC en Storage Resource Broker (SRB), con el apoyo de la National Science Foundation (NSF). SRB 1.1 se entregó en 1998, [3] demostrando un sistema de archivos distribuido lógico con un solo espacio de nombres global en los sistemas de almacenamiento distribuidos geográficamente.
En 2003, General Atomics entregó la operación del SDSC a la Universidad de California en San Diego (UCSD) y el Dr. Moore se convirtió en profesor de tiempo completo allí, estableciendo el Centro de Entornos de Computación Intensiva de Datos (DICE), desarrollo continuo de SRB. En ese mismo año, General Atomics adquirió la licencia exclusiva para desarrollar una versión comercial de SRB, llamándola Nirvana. [4] El equipo de DICE finalizó el desarrollo de SRB en 2006 y comenzó un proyecto de gestión de datos orientado a reglas llamado iRODS [5] para distribución de código abierto . El Dr. Moore y su equipo de DICE se trasladaron a la Universidad de Carolina del Norte en Chapel Hill, donde iRODS ahora es mantenido por el Consorcio iRODS. [6] General Atomics continuó el desarrollo de Nirvana en su sede de San Diego, enfocándose en las capacidades para servir a los usuarios comerciales y gubernamentales, incluyendo alta escalabilidad, fallas, desempeño, implementación, mantenimiento y soporte.
![Nirvana History](http://wikiimg.tojsiabtv.com/wikipedia/commons/thumb/b/be/Nirvana_History1.png/800px-Nirvana_History1.png)
En 2009, General Atomics ganó un contrato de gestión de datos con el Programa de Modernización de Computación de Alto Rendimiento del Departamento de Defensa de los Estados Unidos (DOD). [7] Los requisitos de este contrato se centraron en General Atomics para ampliar el rendimiento, la escalabilidad, la seguridad y la facilidad de uso de Nirvana. Un entregable importante implicado la integración de Nirvana con Oracle Corporation 's SAM-QFS sistema de archivos para proporcionar una basada en políticas de gestión de almacenamiento jerárquico del sistema (HSM) con la sincronización cerca de eventos en tiempo real. General Atomics también anunció que la empresa de marketing digital infoGROUP implementó Nirvana para crear un espacio de nombres global en tres de los centros de operaciones informáticas de infoGROUP en el área de Omaha. [8]
En 2012, General Atomics lanzó la versión 4.3 de Nirvana. [9]
En 2014, General Atomics cambió el modelo comercial de Nirvana de un gran contrato gubernamental, modelo de tarifa por servicio, a un modelo de software comercial estándar.
En 2015, General Atomics inició una relación estratégica con Pixit Media / ArcaStream en el Reino Unido, integrando Nirvana con Pixit Media y los productos de ArcaStream. [10]
En 2016, General Atomics lanzó la versión 5.0 de Nirvana. [11]
En mayo de 2018, sondeos de URL de soporte y marketing de Nirvana bajo el paraguas corporativo de General Atomics (www.Nirvanastorage.com, [12] www.ga.com/nirvana [13] y https://www.nirvanaware.com [14] ) y ofertas de integración de marca más recientes como "Nirvana EasyHSM" (www.ga.com/easyhsm [15] (mencionado en un slideshare de marketing de enero de 2017 en [16] )) devuelve "no se puede encontrar" en www.ga. com o tiempo de espera de conexión. Una búsqueda por palabra clave "Nirvana" en www.ga.com devuelve solo páginas con indicaciones archivadas. Las páginas de Nirvana y los comunicados de prensa archivados por General Atomics se pueden recuperar a través de http://www.ga.com/?Key=Search&q=nirvana [17]
Arquitectura y funcionamiento
Nirvana es un software cliente-servidor compuesto por agentes de ubicación que residen o acceden a los recursos de almacenamiento. Un recurso de almacenamiento puede ser un sistema de almacenamiento conectado en red (NAS), un sistema de almacenamiento de objetos o un servicio de almacenamiento en la nube . Nirvana cataloga la ubicación de los archivos y objetos en estos recursos de almacenamiento en su Catálogo de metadatos (MCAT) y etiqueta los archivos con metadatos del sistema de almacenamiento (propietario, nombre de archivo, tamaño y creación de archivo, cambio, modificación y marcas de tiempo de acceso ) y usuario adicional- definidos, metadatos específicos del dominio. Los metadatos definidos por el usuario y del sistema se pueden utilizar para buscar un archivo u objeto (o grupos de archivos y objetos) y también controlar el acceso y mover esos archivos y objetos de un recurso de almacenamiento a otro. El MCAT crea un único espacio de nombres global en todos los recursos de almacenamiento conectados a él para que los usuarios y administradores puedan buscar, acceder y mover datos a través de múltiples sistemas de almacenamiento heterogéneos de múltiples proveedores en centros de datos geográficamente dispersos. El MCAT está conectado e interactúa con un sistema de gestión de bases de datos relacionales para respaldar su funcionamiento. Se pueden implementar varios MCAT para el escalado horizontal y la conmutación por error . Varios clientes pueden interactuar con Nirvana, incluido el navegador web suministrado y los clientes GUI basados en Java , una interfaz de línea de comandos , una interfaz de unidad de red virtual nativa de Windows y aplicaciones desarrolladas por el usuario a través de las API suministradas .
![Nirvana Architecture](http://wikiimg.tojsiabtv.com/wikipedia/commons/thumb/5/5a/Nirvana_Architecture_1.png/700px-Nirvana_Architecture_1.png)
La operación de Nirvana está controlada por tres demonios ; Metadatos, Sync e ILM. El demonio de metadatos puede extraer metadatos automáticamente de un instrumento que crea datos, desde dentro de los datos reales del archivo utilizando plantillas predefinidas y personalizables y políticas de análisis de metadatos, o capturando la entrada del usuario a través de la GUI o la interfaz de línea de comandos. Sync Daemon, que se ejecuta en segundo plano, detecta cuándo se agregan o eliminan archivos de los sistemas de archivos de recursos de almacenamiento subyacentes. Cuando Sync Daemon observa cambios en el sistema de archivos, los cambios se registran y actualizan en MCAT. ILM Daemon consulta de forma rutinaria el MCAT y ejecuta acciones, incluida la migración , la replicación o la copia de seguridad en un horario específico. Por ejemplo, un administrador puede establecer una política para liberar espacio en un costoso sistema de almacenamiento primario al migrar esos datos a ubicaciones de retención distribuidas según criterios como: marcas de agua de consumo de almacenamiento (porcentaje lleno), todos los datos asociados con un proyecto específico, o datos a los que no se ha accedido en más de un año. Las políticas son extremadamente flexibles. Los atributos de metadatos definidos por el usuario (por ejemplo, proyecto, investigador principal , fuente de datos, ubicación, temperatura, etc.) también se pueden utilizar para mover datos. La ejecución de la política ILM de Nirvana ocurre detrás de escena, transparente para los usuarios finales o las aplicaciones.
Casos de uso
Pasarela de almacenamiento en la nube con reconocimiento de datos
La funcionalidad ILM de Nirvana se puede utilizar como una puerta de enlace de almacenamiento en la nube , donde los datos almacenados localmente, en las instalaciones, se pueden mover a servicios de almacenamiento en la nube populares según los diversos atributos y políticas de metadatos de Nirvana. En 2015, General Atomics y ArcaStream anunciaron un dispositivo de almacenamiento en la nube que utiliza Spectrum Scale de IBM para el almacenamiento local y se integra con los proveedores de almacenamiento en la nube Amazon S3 y Google Cloud Storage . [18]
Búsqueda Avanzada
Nirvana se puede utilizar para realizar consultas de búsqueda para encontrar datos de interés utilizando metadatos definidos por el usuario y por el sistema. Las consultas se ingresan en la interfaz de línea de comandos o mediante el cliente del navegador web que se muestra a continuación.
![Nirvana Web Browser Graphical User Interface](http://wikiimg.tojsiabtv.com/wikipedia/commons/thumb/9/92/Nirvana_GUI.png/900px-Nirvana_GUI.png)
Colecciones virtuales
Nirvana puede automatizar la agrupación y distribución de archivos de datos en una colección virtual, basándose en reglas lógicas fáciles de usar. Por ejemplo, los metadatos definidos por el usuario se pueden usar para identificar archivos de datos que necesitan ser transferidos entre colaboradores con atributos específicos de dominio (experimento, estudio, proyecto, etc.).
Procedencia de los datos
En muchos campos, es útil conocer la procedencia y el proceso de procesamiento utilizado para producir resultados derivados. Nirvana rastrea los datos dentro de los flujos de trabajo, a través de todas las transformaciones, análisis e interpretaciones. Con Nirvana, los datos se pueden compartir y utilizar con la procedencia verificada de las condiciones en las que se generaron, por lo que los resultados son reproducibles y analizables en busca de defectos.
Auditoría
Nirvana se puede utilizar para auditar cada transacción en un archivo de datos dentro de un flujo de trabajo. Se puede almacenar una pista de auditoría que contenga información como la fecha de la transacción, el código de éxito o error, la transacción realizada por el usuario, el tipo de transacción y notas, etc. Las pistas de auditoría, como todo lo demás con Nirvana, se pueden consultar y filtrar fácilmente.
Control de acceso y seguridad
Nirvana se puede utilizar para controlar el acceso a los datos configurando listas de control de acceso específicas por usuario, grupo, etc., utilizando atributos de metadatos definidos por el usuario (Proyecto, Estudio, etc.) y estableciendo niveles de privilegios de acceso donde los usuarios asignados a niveles superiores pueden ver más información que otros asignados niveles inferiores. Nirvana admite el inicio de sesión único y el acceso mediante la integración con el Protocolo ligero de acceso a directorios (LDAP) y Active Directory , utilizando autenticación de desafío-respuesta , Infraestructura de seguridad de red (GSI) y Kerberos . Los datos solo pueden ser vistos y modificados por usuarios autorizados para hacerlo.
Análisis del sistema de archivos
Nirvana se puede utilizar para analizar la composición de un sistema de archivos compartido para determinar qué tipo de datos se almacenan, cuánto espacio ocupa, cuándo se accedió por última vez y quién los almacenó. Con esta información, los administradores de almacenamiento pueden determinar el tipo de sistema de almacenamiento más apropiado para usar y cuándo mover los datos no utilizados a un almacenamiento de archivo de menor costo. En el siguiente ejemplo, el análisis de Nirvana de los datos almacenados en un costoso sistema de almacenamiento NAS empresarial mostró que no se había accedido a la mayoría de los datos en más de 2 años. El análisis mostró además que la mayoría de los archivos eran muy pequeños y más de la mitad del almacenamiento lo consumían solo dos usuarios. Con estos datos, la organización reemplazó su sistema de almacenamiento empresarial con almacenamiento de objetos menos costoso para administrar mejor los muchos archivos pequeños a los que rara vez se accede. [19]
![Nirvana File Analysis](http://wikiimg.tojsiabtv.com/wikipedia/commons/thumb/b/ba/Nirvana_File_Analysis.png/900px-Nirvana_File_Analysis.png)
Referencias
- ^ "Línea de tiempo SDSC" (PDF) . Consultado el 25 de enero de 2016 .
- ^ "MDAS - Sistema de análisis de datos masivo" . Consultado el 25 de enero de 2016 .
- ^ Baru, Chaitanya; Moore, Reagan; Rajasekar, Arcot; Wan, Michael (2010). "El intermediario de recursos de almacenamiento SDSC". Documentos de alto impacto de la primera década de CASCON : 189–200. CiteSeerX 10.1.1.203.4142 . doi : 10.1145 / 1925805.1925816 . (Reimpresión del 30 de noviembre al 3 de diciembre de 1998)
- ^ "General Atomics adquiere una licencia exclusiva de UCSD para la comercialización de un software de gestión de datos único" . Consultado el 25 de enero de 2016 .
- ^ "iRODS (sistema de datos integrado orientado a reglas)" . irods.org . Consultado el 17 de marzo de 2016 .
- ^ "iRODS (sistema de datos integrado orientado a reglas)" . irods.org/about . Consultado el 31 de julio de 2017 .
- ^ "General Atomics gana un contrato del Departamento de Defensa de $ 22,5 millones para la gestión del ciclo de vida del almacenamiento (SLM) en seis sitios de informática de alto rendimiento" . Consultado el 25 de enero de 2016 .
- ^ "InfoGROUP® Architects Innovative Global Namespace con Nirvana® SRB® 2008" . Consultado el 25 de enero de 2016 .
- ^ "Nirvana SRB 2012 R3® se ha mejorado con mejoras significativas en el rendimiento del almacenamiento en caché, la sincronización y la migración de la base de datos" . Consultado el 25 de enero de 2016 .
- ^ "ArcaStream y General Atomics presentan la primera puerta de enlace de almacenamiento en la nube con reconocimiento de datos del mundo" . Consultado el 25 de enero de 2016 .
- ^ "General Atomics lanza el sistema de datos de próxima generación que avanza los flujos de trabajo científicos y de medios intensivos de datos" . Atomics generales y empresas afiliadas . Consultado el 26 de mayo de 2018 .
- ^ "Almacenamiento Nirvana" . Atómica general. Archivado desde el original el 24 de julio de 2008 . Consultado el 26 de mayo de 2018 .
- ^ "Nirvana SRB" . Consultado el 26 de mayo de 2018 .
- ^ "Atención al cliente de Nirvana" . Atómica general . Consultado el 26 de mayo de 2018 .
- ^ "Nirvana EasyHSM" . Atómica general . Consultado el 26 de mayo de 2018 .
- ^ Sfiligoi, Igor (17 de enero de 2017). "EasyHSM Overview" : a través de www.slideshare.net, consultado el 26 de mayo de 2018. Cite journal requiere
|journal=
( ayuda ) - ^ "General Atomics y Compañías Afiliadas" . Atomics generales y empresas afiliadas . Consultado el 26 de mayo de 2018 .
- ^ "ArcaStream y General Atomics presentan la primera puerta de enlace de almacenamiento en la nube con reconocimiento de datos del mundo" . Consultado el 25 de enero de 2016 .
- ^ "Análisis de datos de almacenamiento con Nirvana SRB presentado para la conferencia IEEE MSST 2014 Santa Clara, CA 2-6 de junio de 2014" (PDF) .