Un triplestore o RDF store es una base de datos especialmente diseñada para el almacenamiento y recuperación de triples [1] a través de consultas semánticas . Un triple es una entidad de datos compuesta de sujeto- predicado- objeto , como "Bob tiene 35" o "Bob conoce a Fred".
Al igual que una base de datos relacional , la información en un almacén triple se almacena y recupera a través de un lenguaje de consulta . A diferencia de una base de datos relacional, un almacén de triples está optimizado para el almacenamiento y recuperación de triples. Además de las consultas, los triples generalmente se pueden importar y exportar utilizando Resource Description Framework (RDF) y otros formatos.
Implementaciones
Algunos almacenes triples se han construido como motores de base de datos desde cero, mientras que otros se han construido sobre motores de bases de datos relacionales comerciales existentes (como los basados en SQL) [2] o motores de bases de datos orientados a documentos NoSQL . [3] Al igual que el desarrollo temprano de bases de datos de procesamiento analítico en línea (OLAP), este enfoque intermedio permitió que se construyeran motores de base de datos grandes y potentes con poco esfuerzo de programación en las fases iniciales del desarrollo del almacén triple. Parece probable que las tiendas triples nativas tengan la ventaja de rendimiento durante un período de tiempo más largo. Una dificultad con la implementación de almacenes triples sobre SQL es que, aunque los "triples" se pueden "almacenar", implementar consultas eficientes de un modelo RDF basado en gráficos (como el mapeo de SPARQL ) en consultas SQL es difícil. [4]
Tipos de bases de datos relacionados
Agregar un nombre al triple crea una "tienda cuádruple" o un gráfico con nombre .
Una base de datos de gráficos tiene una estructura más generalizada que un almacén triple, y utiliza estructuras de gráficos con nodos, bordes y propiedades para representar y almacenar datos. Las bases de datos de gráficos pueden proporcionar adyacencia sin índice, lo que significa que cada elemento contiene un puntero directo a sus elementos adyacentes y no es necesario realizar búsquedas de índices. Las bases de datos de gráficos generales que pueden almacenar cualquier gráfico son distintas de las bases de datos de gráficos especializadas, como los almacenes triples y las bases de datos de red.
Ver también
- Espacios de datos
- Modelo entidad-relación
- Metadatos § Sintaxis - Los dos primeros elementos del triple de clase-atributo-valor (clase, atributo) son partes de algunos metadatos estructurales que tienen una semántica definida. El tercer elemento es un valor, preferiblemente de algún vocabulario controlado.
- Esquema de bases de datos
- Modelo de datos semánticos
- Semántica MediaWiki : un ejemplo de soporte sujeto-predicado-objeto para wikis , soporte de consultas avanzadas e implementaciones de muchas organizaciones grandes
- SPARQL - Especificación W3C que involucra triples sujeto-predicado-objeto
- El modelo entidad-atributo-valor es un enfoque similar al modelado de datos.
Referencias
- ^ TripleStore , Jack Rusher, Sistema de organización de conocimiento simple § SWAD-Europa (2002-2004) , Taller sobre almacenamiento y recuperación de Web semántica - Documentos de posición.
- ^ US 2003145022 , "Almacenamiento y gestión de datos semiestructurados": uso de bases de datos relacionales SQL como un triple almacén RDF.
- ^ Cagle, Kurt. "Semántica + búsqueda: MarkLogic 7 obtiene RDF" . Consultado el 7 de agosto de 2015 .
- ^ Broekstra, Jeen (19 de septiembre de 2007). "No se puede sobrestimar la importancia de SPARQL" .
enlaces externos
- Una lista de grandes tiendas triples
- Benchmark de la Universidad de Lehigh (LUBM)
- En qué se diferencian las bases de datos RDF de otras soluciones NoSQL
- El grupo de trabajo W3C SPARQL fue el grupo de trabajo de acceso a datos RDF
- Lenguaje de consulta SPARQL
- Protocolo SPARQL
- SPARQL 1.1 Actualización de la recomendación W3C 21 de marzo de 2013