Data Factory, AWS Glue, Databricks e Databricks Delta Lake

Domine o poder dos dados com Azure Data Factory, AWS Glue, Databricks e Databricks Delta Lake e impulsione sua carreira
4.68 (158 reviews)
Udemy
platform
Português
language
Other
category
Data Factory, AWS Glue, Databricks e Databricks Delta Lake
921
students
13 hours
content
Dec 2024
last update
$19.99
regular price

What you will learn

Visualização para explorar resultados de consultas de diferentes perspectivas

Construção de gráficos e Dashboards

Unificação de dados em diversos formatos: texto, JSON, PARQUET, dentre outros

Trabalhada por administrador da plataforma, analista de dados, cientista de dados e engenheiro de dados com diversas funcionalidades

Aprendizado processamento distribuído em SPARK

Entendo o que é Databricks File System (DBFS) seu sistema de arquivos

Entendo sobre Cluster

Aprendendo a gerenciar e criar Notebooks em R, SCALA, Python e SQL

Executando scripts multilinguagens

Gerenciando a ingestão de dados e análise de dados, gerando gráficos e dashboards

Construindo na versão community

Trabalhando com a biblioteca dbutils Python

Integrando o Databricks ao Power BI

Entendendo a arquitetura chamada Lakehouse sobre o Data Lake no Databricks

Construindo Delta Lake com processamento em batch, streaming em lote

Controle de transações sobre os dados, como um banco de dados

Trabalhando com características ACID (Atomicidade, Consistência, Isolamento, Durabilidade) ao Delta Lake

Entendendo versionamento dos dados, permite que os dados sejam acessados e revertam para versões anteriores de dados, controle de históricos

Uso das fases de ingestão, refinamento e enriquecimento dos dados

Diferenças das arquiteturas Data Lake x Delta Lake

Aprendendo como otimização dos processos de coleta e tratamento dos dados, reduzindo o tempo de processamento e descartando o que não for útil

Trabalhando a criação de tabelas Delta e como gerar históricos de dados

Trabalhando com cluster, DBFS, Notebook em R, Scala, Pyhton e SQL

Delta Time Travel como retornar versões de dados e comandos de controle

Controle de auditoria, agindo na conformidade de dados quanto de depuração simples para entender como os dados mudaram ao longo do tempo

Executando reversões nos dados, evitando duplicação e realizando refinamento, ajustes, atualizações e exclusões dos dados

Executando scripts batch e streaming

Entendo o que significa checkpoint e controle de gravações dos dados

Trabalhando com Schema Evolution na inclusão de atributos as tabelas delta

Funcionalidades do Azure Data Factory

Casos de Uso do Azure Data Factory

Entender na prática o uso de Pipeline de Dados

Construir pipelines com fluxos e transformações de dados na nuvem

Utilizar das atividades e componentes principais do Azure Data Factory na construção de integrações e ETL de dados

Programar a execução automática de pipelines

Monitorar a execução com Sucesso/Erro de pipelines

AWS GLUE: Criação de Jobs via Glue Studio

AWS GLUE: Criação de Jobs via Script Python no Glue

AWS GLUE: Entendimento de Workflows

AWS GLUE Script, Crawler, Data Catalog, Triggers muito mais na prática.

5371244
udemy ID
6/7/2023
course created date
7/21/2023
course indexed date
Bot
course submited by