Presto (motor de consultas SQL)


Presto (que incluye PrestoDB y PresoSQL más tarde renombrado como Trino ) es un motor de consulta distribuido para big data que utiliza el lenguaje de consulta SQL . Su arquitectura permite a los usuarios consultar fuentes de datos como Hadoop , Cassandra , Kafka , AWS S3 , Alluxio , MySQL , MongoDB y Teradata . [1] Incluso se pueden consultar datos de múltiples fuentes de datos dentro de una sola consulta. Presto es un software de código abierto impulsado por la comunidad publicado bajo la Licencia Apache .

Presto se diseñó y desarrolló originalmente en Facebook, Inc. (luego rebautizado como Meta) para que sus analistas de datos ejecuten consultas interactivas en su gran almacén de datos en Apache Hadoop . Los primeros cuatro desarrolladores fueron Martin Traverso, Dain Sundstrom, David Phillips y Eric Hwang. Antes de Presto, los analistas de datos de Facebook confiaban en Apache Hive para ejecutar análisis de SQL en su almacén de datos de varios petabytes. [2] Se consideró que Hive era demasiado lento para la escala de Facebook y se inventó Presto para llenar el vacío y ejecutar consultas rápidas. [3] El desarrollo original comenzó en 2012 y se implementó en Facebook ese mismo año. En noviembre de 2013, Facebook anunció su lanzamiento de código abierto. [3][4]

En 2014, Netflix reveló que usaba Presto en 10 petabytes de datos almacenados en Amazon Simple Storage Service (S3). [5] En noviembre de 2016, Amazon anunció un servicio llamado Athena que estaba basado en Presto. [6] En 2017, Teradata creó una empresa llamada Starburst Data para apoyar comercialmente a Presto, que incluía personal adquirido de Hadapt en 2014. [7] El software QueryGrid de Teradata permitió a Presto acceder a una base de datos relacional de Teradata. [8]

En enero de 2019, se anunció la Presto Software Foundation. La fundación es una organización sin fines de lucro para el avance del motor de consultas SQL distribuidas de código abierto de Presto. [9] [10] Al mismo tiempo, el desarrollo de Presto se bifurcó: PrestoDB mantenido por Facebook y PrestoSQL mantenido por Presto Software Foundation con alguna polinización cruzada de código.

En septiembre de 2019, Facebook donó PrestoDB a la Fundación Linux , estableciendo la Fundación Presto. [11] No se invitó a unirse a esta fundación a los creadores de Presto ni a los principales contribuyentes y autores. [12]

Para 2020, los cuatro desarrolladores originales de Presto se habían unido a Starburst. [13] En diciembre de 2020, PrestoSQL fue rebautizado como Trino, ya que Facebook tenía una marca comercial con el nombre "Presto" (también donada a la Fundación Linux). [14]


Descripción general de la arquitectura con el coordinador y los trabajadores