Skip to content

Atividades do curso "Fundamentos de Engenharia de Dados" da DataScienceAcademy.

Notifications You must be signed in to change notification settings

leosimoes/DataScienceAcademy-EngenhariaDeDados-Fundamentos

Repository files navigation

DataScienceAcademy - Fundamentos de Engenharia de Dados

Atividades do curso "Fundamentos de Engenharia de Dados" da DataScienceAcademy.

Atividades

  • Demonstração Prática 1 - Funcionamento de um Sistema Distribuído
    • Definindo o Ambiente: Hadoop HDFS, cluster com 4 máquinas (1 master e 3 slaves);
    • Carga de Dados: a replicação do bloco vai depender do fator de replicação;
    • Comportamento do Sistema Distribuído quando um servidor fica indisponível: tolerância a falhas já que pode usar outra máquina, se uma não estiver disponivel;
    • Acceso aos Dados.
  • Demonstração Prática 2 - Implementando Um Data Lakehouse
    • Usamos o Data LakeHouse para armazenar um JSON e carregar dados semi-estruturados e analisá-los no formato tabular;
    • Airbyte (Ferramenta ELT) -> Amazon S3 (Data Lake) -> Dremio;
    • Airbyte pega o arquivo JSON da origin e carrega no Amazon S3, onde o Dremio busca e prepara os dados e retorna-os em formato tabular.
  • Demonstração Prática 3 - Linhagem de Dados de Data Warehouse com SQLFlow.
  • Demonstração Prática 4 - Criação de Pipeline de Extração, Limpeza, Transformação e Enriquecimento de Dados.

Certificado

Certificado

Referências

DataScienceAcademy - Fundamentos de Engenharia de Dados: https://www.datascienceacademy.com.br/path-player?courseid=fundamentos-de-engenharia-de-dados , Acessado em 18/09/2023.

About

Atividades do curso "Fundamentos de Engenharia de Dados" da DataScienceAcademy.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages