Clustrix, Inc. es una empresa privada con sede en San Francisco fundada en 2006 que desarrolla un sistema de gestión de bases de datos comercializado como NewSQL . [1] [2]
Tipo | Privado |
---|---|
Industria | Base de datos informática |
Fundado | 15 de diciembre de 2006 en San Francisco , California, EE. UU. |
Fundador | Paul Mikesell, Sergei Tsarev y Eric Hoffman |
Sede | San Francisco , CA , Estados Unidos |
Productos | Servidor de base de datos Clustrix |
Número de empleados | 40–50 |
Padre | MariaDB Corporation AB |
Sitio web | clustrix |
Historia
Clustrix se fundó en noviembre de 2006 y, a veces, se llama Sprout-Clustrix, ya que se formó con la ayuda de Y Combinator . [3] Los fundadores incluyen a Paul Mikesell (antes de EMC Isilon ) y Sergei Tsarev. Parte de su tecnología probada en clientes desde 2008. [4]
Inicialmente llamado Sierra durante la fase de desarrollo, en su anuncio oficial en 2010, el producto se lanzó con el nombre de producto Clustered Database System (CDS) . [5] [6] La empresa recibió $ 10 millones en fondos de Sequoia Capital , US Venture Partners (USVP) y ATA Ventures en diciembre de 2010. [7] Robin Purohit se convirtió en director ejecutivo en octubre de 2011, y otra ronda de $ 6,75 millones fue recaudado en julio de 2012. [8] [9] Otra ronda de financiación de los patrocinadores originales de $ 16,5 millones se anunció en mayo de 2013, [10] y una ronda de $ 10 millones en nueva financiación en agosto de 2013 fue dirigida por HighBAR Ventures. [11] Purohit fue reemplazado por Mike Azevedo en 2014. [12] En febrero de 2016 se reveló una ronda de financiamiento de deuda de más de $ 23 millones. [13] El 20 de septiembre de 2018 se anunció que Clustrix fue adquirida por MariaDB Corporation. [14]
Tecnología
Clustrix admite cargas de trabajo que implican escalar transacciones y análisis en tiempo real. El sistema es un reemplazo directo de MySQL y está diseñado para superar los problemas de escalabilidad de MySQL con un mínimo de interrupciones. [15] También ha incorporado funciones de tolerancia a fallos para una alta disponibilidad dentro de un clúster. Tiene copia de seguridad paralela y replicación paralela entre clústeres para recuperación ante desastres. Clustrix es un sistema de gestión de bases de datos SQL escalables y parte de lo que a menudo se denominan sistemas de bases de datos NewSQL (sistemas modernos de gestión de bases de datos relacionales ), siguiendo de cerca el movimiento NoSQL . [dieciséis]
El producto se comercializó como un "dispositivo" de hardware utilizando InfiniBand hasta alrededor de 2014. [17] [6] [18] La base de datos de Clustrix estuvo disponible como software descargable y en el Amazon Web Services Marketplace en 2013. [19] [20]
Los competidores principales, como Microsoft SQL Server y MySQL, admitían el procesamiento de transacciones en línea y el procesamiento analítico en línea, pero no se distribuyeron. Clustrix proporciona una base de datos ACID relacional distribuida que escala las transacciones [21] y admite análisis en tiempo real. Otras bases de datos relacionales distribuidas son en columnas (no admiten la carga de trabajo de transacciones primarias) y se centran en el análisis fuera de línea y esto incluye EMC Greenplum , HP Vertica , Infobright y Amazon Redshift . Los jugadores notables en el espacio de la base de datos SQL primaria están en memoria . Esto incluye VoltDB y MemSQL , que se destacan en transacciones de baja latencia, pero no apuntan a análisis en tiempo real. [ cita requerida ] Los competidores de NoSQL, como MongoDB, son buenos para manejar datos no estructurados y leer cargas de trabajo pesadas, pero no compiten en el espacio para escribir cargas de trabajo pesadas (sin transacciones, bloqueo de grano grueso (nivel de base de datos) y sin funciones de SQL (como une ), por lo que las bases de datos NewSQL y NoSQL son complementarias. [ cita requerida ]
Evaluación de consultas
La base de datos de Clustrix opera en un clúster distribuido de nodos de nada compartido utilizando un enfoque de consulta a datos . [22] Aquí los nodos suelen poseer un subconjunto de los datos. Las consultas SQL se dividen en fragmentos de consultas y se envían a los nodos que poseen los datos. Esto permite Clustrix a escala horizontalmente ( escalar ) medida que se añaden nodos adicionales. [19]
Distribución de datos
La base de datos de Clustrix divide y distribuye automáticamente los datos de manera uniforme entre los nodos y cada segmento tiene copias en otros nodos. [23] La distribución de datos uniforme se mantiene a medida que se agregan, eliminan nodos o si los datos se insertan de manera desigual. Este enfoque de distribución automática de datos elimina la necesidad de fragmentar y permite a Clustrix mantener la disponibilidad de la base de datos ante la pérdida de nodos. [24]
Actuación
En una prueba de rendimiento completada por Percona en 2011, un clúster de tres nodos experimentó un aumento del 73% en la velocidad en comparación con un único servidor MySQL equipado de manera similar que ejecutaba pruebas con 1024 subprocesos simultáneos. [25] [26] Los nodos adicionales agregados al clúster de Clustrix proporcionaron aumentos de velocidad aproximadamente lineales. [27]
Referencias
- ^ De qué hablamos cuando hablamos de NewSQL
- ^ "El movimiento NewSQL" . Archivado desde el original el 1 de febrero de 2012 . Consultado el 16 de diciembre de 2011 .
- ^ "Formulario D: Aviso de Venta de Valores" . Comisión de Bolsa y Valores de Estados Unidos. 5 de julio de 2007. Archivado desde el original el 8 de abril de 2016 . Consultado el 5 de septiembre de 2016 .
- ^ "La historia de Clustrix" . Blog DBMS2 . 12 de mayo de 2010 . Consultado el 5 de septiembre de 2016 .
- ^ Camille Riketts (3 de mayo de 2010). "Clustrix de Y Combinator lanza bases de datos que escalan" . Venture Beat . Consultado el 5 de septiembre de 2016 .
- ^ a b Stacey Higginbotham (3 de mayo de 2010). "Clustrix construye el Santo Grial de escala web: una base de datos que escala" . Gigaom . Consultado el 5 de septiembre de 2016 .
- ^ Barb Darrow (19 de agosto de 2013). "Clustrix obtiene $ 10 millones más en fondos para seguir ampliando su base de datos SQL" . Gigaom . Consultado el 5 de septiembre de 2016 .
- ^ Robin Wauters (18 de octubre de 2011). "Clustrix tierras ex vicepresidente de Hewlett-Packard Robin Purohit como su nuevo CEO" . Tech Crunch . Consultado el 5 de septiembre de 2016 .
- ^ Ryan Lawler (5 de julio de 2012). "Big Data Startup Clustrix recauda $ 6,75 millones de Sequoia y otros para construir bases de datos escalables" . Tech Crunch . Consultado el 5 de septiembre de 2016 .
- ^ Barb Darrow (6 de mayo de 2013). "Clustrix obtiene 16,5 millones de dólares para impulsar su base de datos fuera de la caja" . Gigaom . Consultado el 5 de septiembre de 2016 .
- ^ Barb Darrow (19 de agosto de 2013). "Clustrix obtiene $ 10 millones más en fondos para seguir ampliando su base de datos SQL" . Gigaom . Consultado el 5 de septiembre de 2016 .
- ^ "Clustrix nombra nuevo CEO Mike Azevedo y presidente ejecutivo Bruce Armstrong" . Wall Street Journal . 9 de septiembre de 2014 . Consultado el 5 de septiembre de 2016 .
- ^ "Formulario D: Notificación de Oferta Exenta de Valores" . Comisión de Bolsa y Valores de Estados Unidos. 12 de febrero de 2016 . Consultado el 5 de septiembre de 2016 .
- ^ "MariaDB adquiere Clustrix agregando tecnología de base de datos distribuida" . 20 de febrero de 2018 . Consultado el 20 de septiembre de 2018 .
- ^ Derrick Harris (17 de enero de 2011). "Clustrix levanta el telón de los primeros clientes de bases de datos" . Gigaom a través de The New York Times . Consultado el 5 de septiembre de 2016 .
- ^ / La revelación más sorprendente de Google Spanner NoSQL está fuera y NewSQL está en
- ^ James Hamilton (5 de mayo de 2010). "Dispositivo de base de datos de Clustrix" . Consultado el 5 de septiembre de 2016 .
- ^ "Dispositivo de base de datos de Clustrix" . Documentación de la empresa . Archivado desde el original el 2 de febrero de 2014 . Consultado el 5 de septiembre de 2016 .
- ^ a b Jon Evans (19 de enero de 2013). "Su base de datos es probablemente terrible" . Tech Crunch . Consultado el 5 de septiembre de 2016 .
- ^ "Clustrix anuncia la disponibilidad general de ClustrixDB como versión de software" . Tendencias y aplicaciones de bases de datos . 31 de octubre de 2013 . Consultado el 5 de septiembre de 2016 .
- ^ "Copia archivada" . Archivado desde el original el 10 de marzo de 2013 . Consultado el 21 de febrero de 2013 .CS1 maint: copia archivada como título ( enlace )
- ^ "Copia archivada" (PDF) . Archivado desde el original (PDF) el 29 de septiembre de 2013 . Consultado el 21 de febrero de 2013 .CS1 maint: copia archivada como título ( enlace )
- ^ http://cs.brown.edu/courses/cs227/slides/checkpointing/clustrix.pdf [ enlace muerto permanente ]
- ^ http://cattell.net/datastores/Datastores.pdf
- ^ Vadim Tkachenko y Rodrigo Gadea (20 de octubre de 2011). "Clustrix tpcc-mysql Benchmark" (PDF) . Percona. Archivado desde el original (PDF) el 12 de febrero de 2012 . Consultado el 5 de septiembre de 2016 .
- ^ Paul Mikesell y Aaron Passey (25 de octubre de 2011). "Keynote de apertura: Caracterización del desempeño" . Percona Live Londres . Consultado el 5 de septiembre de 2016 .
- ^ Clustrix ofrece un kit solo de software para hacer una demostración del escalado de MySQL sin fragmentos
enlaces externos
- Página web oficial
- Sergei Tsarev. "Blog de Sergei Tsarev" .