Extraer, cargar, transformar ( ELT ) es una alternativa para extraer, transformar, cargar (ETL) que se utiliza con implementaciones de lago de datos . A diferencia de ETL, en los modelos ELT los datos no se transforman al ingresar al lago de datos, sino que se almacenan en su formato original sin procesar. Esto permite tiempos de carga más rápidos. Sin embargo, ELT requiere suficiente potencia de procesamiento dentro del procesamiento de datos.motor para realizar la transformación bajo demanda, para devolver los resultados en tiempo y forma. Dado que los datos no se procesan al ingresar al lago de datos, la consulta y el esquema no necesitan definirse a priori (aunque a menudo el esquema estará disponible durante la carga, ya que muchas fuentes de datos son extractos de bases de datos o sistemas de datos estructurados similares y, por lo tanto, tener un esquema asociado). ELT es un modelo de canalización de datos . [1]
Componentes del lago de datos en la nube
Opciones de almacenamiento comunes
- AWS
- Azur
- GCP
- Google Storage (GCS)
Consultando
Referencias
- ^ Uso de Redshift Spectrum para cargar canalizaciones de datos Publicado por deductive.com el 17 de enero de 2018, recuperado el 3 de abril de 2019
enlaces externos
- Dull, Tamara, "The Data Lake Debate: Pro is Up First" , smartdatacollective.com , 20 de marzo de 2015.