Voldemort es un almacén de datos distribuido que fue diseñado como un almacén de valor clave utilizado por LinkedIn para almacenamiento altamente escalable. [1] Lleva el nombre del villano ficticio de Harry Potter, Lord Voldemort .
Autor (es) original (es) | LinkedIn / Microsoft |
---|---|
Versión inicial | 2009 |
Lanzamiento estable | 1.10.25 / 25 de julio de 2017 |
Repositorio | |
Escrito en | Java |
Disponible en | inglés |
Tipo | Almacén de datos distribuidos |
Licencia | Licencia Apache 2.0 |
Sitio web | www |
Descripción general
Voldemort no intenta satisfacer relaciones arbitrarias y las propiedades ACID , sino que es una tabla hash grande, distribuida y persistente. [2] Un estudio de 2012 que comparó sistemas para almacenar datos de gestión de rendimiento de aplicaciones informó que Voldemort, Apache Cassandra y HBase ofrecían escalabilidad lineal en la mayoría de los casos, con Voldemort con la latencia más baja y Cassandra con el rendimiento más alto. [3]
En el lenguaje del teorema CAP de Eric Brewer , Voldemort es un sistema de tipo AP.
El creador y principal colaborador corporativo de Voldemort, LinkedIn, ha migrado todos sus sistemas fuera de Voldemort aproximadamente a partir de agosto de 2018 sin un patrocinador de reemplazo al momento de escribir este artículo (octubre de 2018). [4]
Propiedades
Voldemort usa el almacenamiento en caché en memoria para eliminar un nivel de almacenamiento en caché separado. Tiene una capa de almacenamiento que es posible emular. Voldemort lee y escribe escala horizontalmente . La API decide la replicación y la ubicación de los datos y se adapta a una amplia gama de estrategias específicas de la aplicación. [2] [5]
El almacén de datos distribuidos de Voldemort admite estrategias de ubicación conectables para la distribución en los centros de datos. Los datos se replican automáticamente en los servidores. Los datos están divididos, lo que significa que un solo servidor contiene solo una parte de los datos totales. Cada nodo de datos es independiente para evitar un punto central de falla . La serialización conectable permite claves y valores enriquecidos, incluidas listas y tuplas con campos con nombre, así como la integración con marcos de serialización comunes como Avro , Java Serialization, Protocol Buffers y Thrift . Los fallos del servidor se manejan de forma transparente. Los elementos de datos están versionados, lo que maximiza la integridad de los datos. [1]
Ver también
Referencias
- ^ a b "Voldemort es un sistema de almacenamiento distribuido de valores clave" . Proyecto Voldemort: una base de datos distribuida . Consultado el 20 de abril de 2015 .
- ^ a b "Comparación con bases de datos relacionales" . Proyecto Voldemort: una base de datos distribuida. Archivado desde el original el 23 de abril de 2011 . Consultado el 5 de abril de 2011 .
- ^ Rabl, Tilmann; Sadoghi, Mohammad; Jacobsen, Hans-Arno; Gómez-Villamor, Sergio; Muntés-Mulero, Víctor; Mankovskii, Serge (agosto de 2012). "Resolver los desafíos de Big Data para la gestión del rendimiento de las aplicaciones empresariales" (PDF) . Actas de la Dotación VLDB . 5 (12): 1724-1735. arXiv : 1208.4167 . doi : 10.14778 / 2367502.2367512 . S2CID 15591565 .
- ^ Publicación de la lista de distribución de project-voldemort . 2018-08-16. Consultado el 6 de octubre de 2018.
- ^ Servicio de datos computados por lotes a gran escala con el proyecto Voldemort
enlaces externos
- Proyecto Voldemort: una base de datos distribuida
- Debates en tiempo real del Proyecto Voldemort