Extrair, carregar, transformar - Extract, load, transform

Extrair, carregar, transformar ( ELT ) é uma alternativa para extrair, transformar, carregar (ETL) usado com implementações de data lake . Em contraste com o ETL, nos modelos ELT os dados não são transformados na entrada no data lake, mas armazenados em seu formato bruto original. Isso permite tempos de carregamento mais rápidos. No entanto, o ELT requer potência de processamento suficiente dentro do mecanismo de processamento de dados para realizar a transformação sob demanda, para retornar os resultados em tempo hábil. Uma vez que os dados não são processados ​​na entrada do data lake, a consulta e o esquema não precisam ser definidos a priori (embora muitas vezes o esquema esteja disponível durante o carregamento, uma vez que muitas fontes de dados são extratos de bancos de dados ou sistemas de dados estruturados semelhantes e, portanto, tem um esquema associado). ELT é um modelo de pipeline de dados .

Componentes do data lake em nuvem

Opções comuns de armazenamento

Consultando

Referências

  1. ^ Usando o Redshift Spectrum para carregar pipelines de dados Publicado por deductive.com em 17 de janeiro de 2018, recuperado em 3 de abril de 2019

links externos