Base de datos de gráficos


En informática , una base de datos de gráficos ( GDB ) es una base de datos que utiliza estructuras de gráficos para consultas semánticas con nodos , bordes y propiedades para representar y almacenar datos. [1] Un concepto clave del sistema es el gráfico (o arista o relación). El gráfico relaciona los elementos de datos en el almacén con una colección de nodos y bordes, los bordes representan las relaciones entre los nodos. Las relaciones permiten que los datos del almacén se vinculen directamente y, en muchos casos, se recuperen con una sola operación. Las bases de datos de gráficos mantienen las relaciones entre los datos como una prioridad. La consulta de relaciones es rápida porque se almacenan perpetuamente en la base de datos. Las relaciones se pueden visualizar de forma intuitiva utilizando bases de datos de gráficos, lo que las hace útiles para datos muy interconectados. [2]

Las bases de datos de gráficos se conocen comúnmente como NoSQL . Las bases de datos de gráficos son similares a las bases de datos de modelo de red de la década de 1970 en que ambas representan gráficos generales, pero las bases de datos de modelo de red operan a un nivel más bajo de abstracción [3] y no son fáciles de atravesar en una cadena de bordes. [4]

El mecanismo de almacenamiento subyacente de las bases de datos de gráficos puede variar. Las relaciones son un ciudadano de primera clase en una base de datos de gráficos y se pueden etiquetar, dirigir y dar propiedades. Algunos dependen de un motor relacional y "almacenan" los datos del gráfico en una tabla (aunque una tabla es un elemento lógico, por lo que este enfoque impone otro nivel de abstracción entre la base de datos del gráfico, el sistema de gestión de la base de datos del gráfico y los dispositivos físicos donde se almacenan los datos). está realmente almacenado). Otros utilizan un almacén de clave-valor o una base de datos orientada a documentos para el almacenamiento, lo que los convierte en estructuras inherentemente NoSQL.

A partir de 2021 , no se ha adoptado ningún lenguaje de consulta de gráficos universal de la misma manera que SQL para las bases de datos relacionales, y existe una amplia variedad de sistemas, la mayoría de las veces estrechamente vinculados a un producto. Algunos de los primeros esfuerzos de estandarización conducen a lenguajes de consulta de múltiples proveedores como Gremlin , SPARQL y Cypher . En septiembre de 2019, los miembros del Comité Técnico Conjunto 1 de ISO/IEC (ISO/IEC JTC 1) aprobaron una propuesta de proyecto para crear un nuevo lenguaje de consulta de gráficos estándar (ISO/IEC 39075 Tecnología de la información - Lenguajes de base de datos - GQL). GQL pretende ser un lenguaje de consulta de base de datos declarativo, como SQL. Además de tener interfaces de lenguaje de consulta, se accede a algunas bases de datos de gráficos a través deinterfaces de programación de aplicaciones (API).

Las bases de datos de gráficos difieren de los motores de cálculo de gráficos. Las bases de datos de gráficos son tecnologías que son traducciones de las bases de datos de procesamiento de transacciones en línea relacionales (OLTP). Por otro lado, los motores de cómputo gráfico se utilizan en el procesamiento analítico en línea (OLAP) para el análisis masivo. Las bases de datos de gráficos atrajeron una atención considerable en la década de 2000, debido al éxito de las principales corporaciones tecnológicas en el uso de bases de datos de gráficos patentadas, [5] junto con la introducción de bases de datos de gráficos de código abierto .

Un estudio concluyó que un RDBMS era "comparable" en rendimiento a los motores de análisis de gráficos existentes en la ejecución de consultas de gráficos. [6]


Las bases de datos de gráficos emplean nodos, propiedades y bordes
Un gráfico RDF de ejemplo