Greenplum es una tecnología de big data basada en la arquitectura MPP y la tecnología de base de datos de código abierto de Postgres . La tecnología fue creada por una empresa del mismo nombre con sede en San Mateo , California alrededor de 2005. Greenplum fue adquirida por EMC Corporation en julio de 2010. [1]
Tipo | Producto de VMware |
---|---|
Industria | Tecnologías de big data |
Sede | Palo Alto , California |
Productos | Software del sistema de gestión de bases de datos |
Desarrollador (es) | VMware |
---|---|
Lanzamiento estable | 6.7.1 / abril de 2020 |
Repositorio | github |
Sistema operativo | Linux |
Tipo | Sistema de administración de base de datos |
Licencia | Licencia Apache 2 |
Sitio web | greenplum |
A partir de 2012, su software de sistema de gestión de bases de datos se conoció como la base de datos Pivotal Greenplum que se vende a través de Pivotal Software . Pivotal abrió el motor central de código abierto y continuó su desarrollo por parte de la comunidad de código abierto Greenplum Database y Pivotal.
A partir de 2020, VMware adquirió Pivotal y VMware continuó patrocinando la comunidad de código abierto Greenplum Database y comercializando la tecnología bajo la marca VMware Tanzu Greenplum .
Empresa
Greenplum, la empresa, fue fundada en septiembre de 2003 por Scott Yara y Luke Lonergan. Fue una fusión de dos empresas más pequeñas: Metapa (fundada en agosto de 2000 cerca de Los Ángeles ) [2] y Didera en Fairfax, Virginia . [3]
Los inversores incluyeron SoundView Ventures, Hudson Ventures y Royal Wulff Ventures. Un total de US $ 20 millones de en la financiación fue anunciado en la fusión. [4] Greenplum, con sede en San Mateo, California , lanzó su software de sistema de gestión de bases de datos basado en PostgreSQL en abril de 2005 y lo llamó Bizgres. [5] En marzo de 2006 y febrero de 2007 se invirtieron rondas de capital riesgo de unos 15 millones de dólares EE.UU. cada una. [6]
En julio de 2006 se anunció una asociación con Sun Microsystems . [7] Sun, que también había adquirido MySQL AB , participó en una ronda de inversión de 27 millones de dólares estadounidenses en enero de 2009, liderada por Meritech Capital Partners . [6] El proyecto Bizgres incluyó a algunos otros miembros y fue apoyado hasta aproximadamente 2008, cuando el producto también se llamó "Greenplum". [8] [9] El Sun Fire X4500 era una arquitectura de referencia y era utilizado por la mayoría de los clientes hasta que se realizó una transición a Linux en esa época. Greenplum fue adquirida por EMC Corporation en julio de 2010, convirtiéndose en la base de la división de software de big data de EMC . [1] Aunque EMC no reveló el valor, se estimó en 300 millones de dólares estadounidenses . [10] [11] Los productos de Greenplum en el momento de la adquisición eran Greenplum Database, Chorus (una herramienta de gestión) y Data Science Labs. Greenplum tenía clientes en mercados verticales, incluido eBay . [12] Se convirtió en parte de Pivotal Software en 2012. [13]
En 2013 se anunció una variante que usa Apache Hadoop para almacenar datos en el sistema de archivos Hadoop llamada Hawq. [14] [15] En 2015 se anunciaron los proyectos de software de código abierto GreenplumDB y Hawq . [dieciséis]
Tecnología
El producto de base de datos Greenplum de Pivotal utiliza técnicas de procesamiento masivo paralelo (MPP). Cada grupo de computadoras consta de un nodo maestro, un nodo maestro en espera y nodos de segmento. [17] Todos los datos residen en los nodos de segmento y la información del catálogo se almacena en los nodos maestros. Los nodos de segmento ejecutan uno o más segmentos, que son instancias de base de datos de PostgreSQL modificadas y se les asigna un identificador de contenido. Para cada tabla, los datos se dividen entre los nodos de segmento según las claves de columna de distribución especificadas por el usuario en el lenguaje de definición de datos . Para cada identificador de contenido de segmento hay un segmento primario y un segmento espejo que no se ejecutan en el mismo host físico. Cuando una consulta ingresa al nodo principal, se analiza, planifica y envía a todos los segmentos para ejecutar el plan de consulta y devolver los datos solicitados o insertar el resultado de la consulta en una tabla de la base de datos. El lenguaje de consulta estructurado , versión SQL: 2003 , se utiliza para presentar consultas al sistema. La semántica de transacciones cumple con las restricciones conocidas como ACID . [18]
Entre los competidores se incluyen otros sistemas de gestión de bases de datos MPP proporcionados por los principales proveedores como Teradata , Amazon Redshift , Microsoft Azure , Alibaba AnalyticDB y, en el pasado, IBM Netezza . [17] [19] La competencia adicional proviene de otros competidores más pequeños, bases de datos orientadas a columnas como HP Vertica , Exasol y proveedores de almacenamiento de datos con arquitectura no MPP, como Oracle Exadata , IBM DB2 y SAP HANA .
Greenplum versión 5
En septiembre de 2017, se lanzó la versión 5 de la base de datos Greenplum. La versión 5 incluye la primera iteración de la estrategia del proyecto Greenplum de fusionar las versiones posteriores de PostgreSQL de nuevo en Greenplum y se basa en la versión 8.3 de PostgreSQL desde la versión 8.2 anterior. [20] La versión 5 también presenta la disponibilidad general del optimizador GPORCA [21] para la optimización basada en costos de SQL diseñado para big data.
Greenplum versión 6
En septiembre de 2019, se lanzó la versión 6 de la base de datos Greenplum. La versión 6 se basa en la versión 9.4 de PostgreSQL y presenta enormes ganancias en el rendimiento de [22] OLTP. Greenplum 6 fue revisado en los medios por varias fuentes y mencionado por su alineación de código abierto Postgres [23] y por su rendimiento OLTP [24].
Referencias
- ^ a b "EMC para adquirir Greenplum" . Comunicado de prensa . EMC Corporation. 6 de julio de 2010 . Consultado el 15 de marzo de 2017 .
- ^ "Formulario D: Aviso de venta de valores" (PDF) . SEC de EE. UU. 30 de julio de 2003 . Consultado el 15 de marzo de 2017 .
- ^ Maureen O'Gara (26 de septiembre de 2003). "Metapa compra Didera" . Noticias de negocios de Linux . Consultado el 15 de marzo de 2017 .
- ^ "Metapa adquiere Didera y cierra financiación adicional; los pioneros de la industria en informática de alto rendimiento se combinan para crear una solución innovadora de agrupación en clústeres de bases de datos Linux para el apoyo a la toma de decisiones" . Comunicado de prensa . 23 de septiembre de 2003.
- ^ "Proyecto Bizgres lanzado" . Sitio web del desarrollador de PostgreSQL . 17 de abril de 2005 . Consultado el 15 de marzo de 2017 .
- ^ a b Duncan Riley (21 de enero de 2008). "Greenplum toma $ 27 millones Serie C" . Tech Crunch . Consultado el 15 de marzo de 2017 .
- ^ Colin White, Richard Hackathorn (26 de junio de 2007). "Sol / Greenplum" . Mejores prácticas de inteligencia empresarial . Consultado el 15 de marzo de 2017 .Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
- ^ "Historia" . Sitio web antiguo de Bizgres.org . Archivado desde el original el 22 de diciembre de 2008 . Consultado el 15 de marzo de 2017 .
- ^ "Greenplum actualiza la base de datos basada en código abierto" . Semana de la información . 22 de febrero de 2008 . Consultado el 15 de marzo de 2017 .
- ^ Om Malik (6 de julio de 2010). "Big Data = Big Money: EMC compra Greenplum" . GigaOm . Consultado el 15 de marzo de 2017 .
- ^ Alexander Haislip (7 de julio de 2010). "Microsoft, Sun y SAP sorprendentes ganadores en la venta de Greenplum" . Forbes . Consultado el 15 de marzo de 2017 .
- ^ "Dos enormes almacenes de datos de eBay" . Blog DBMS2 . Investigación de Monash. 30 de abril de 2009 . Consultado el 15 de marzo de 2017 .
- ^ Timothy Prickett Morgan (20 de marzo de 2012). "EMC quiere ser el Linux de big data: abre la herramienta Chorus, borgs codificadores ágiles Pivotal Labs" . El registro . Consultado el 15 de marzo de 2017 .
- ^ "¿Cuándo debería utilizar Greenplum Database frente a HAWQ?" . Sitio web de Pivotal Guru . 31 de enero de 2014 . Consultado el 15 de marzo de 2017 .
- ^ Timothy Prickett Morgan (25 de febrero de 2013). "EMC transforma el elefante de Hadoop en la base de datos SQL Hawq" . El registro . Consultado el 15 de marzo de 2017 .
- ^ Cade Metz (17 de febrero de 2015). "Pivotal duplica el código abierto en un signo de cambio en el mundo del software" . Cableado . Consultado el 15 de marzo de 2017 .
- ^ a b Timothy Prickett Morgan (6 de abril de 2011). "EMC engorda y llama la atención con los dispositivos Greenplum: Toma eso, Teradata, Exadata, Netezza" . El registro . Consultado el 18 de marzo de 2017 .
- ^ Sunila Gollapudi (2013). Introducción a Greenplum para Big Data Analytics . Packt Publishing. ISBN 9781782177050.
- ^ "Comparación de propiedades del sistema Amazon Redshift vs Greenplum vs Microsoft Azure SQL Database vs Teradata Aster" . Motores DB . Consultado el 18 de marzo de 2017 .}
- ^ "Pivotal Greenplum está vivo y coleando" . ZDNet . Consultado el 14 de septiembre de 2017 .}
- ^ "Orca: una arquitectura modular de optimización de consultas para Big Data" (PDF) . ZDNet . Consultado el 14 de abril de 2016 .}
- ^ "Puntos de referencia de OLTP Greenplum 6" .
- ^ "La base de datos Greenplum de Pivotal está a punto de alinearse finalmente con el proyecto de código abierto. ¿Qué significará eso para la plataforma?" .
- ^ "Revolución sustancial del código abierto, el almacén de datos MPP ofrece alta concurrencia, análisis integrado y capacidades de ciencia de datos" .