Data Factory, AWS Glue, Databricks e Databricks Delta Lake
Domine o poder dos dados com Azure Data Factory, AWS Glue, Databricks e Databricks Delta Lake e impulsione sua carreira
4.68 (158 reviews)

921
students
13 hours
content
Dec 2024
last update
$19.99
regular price
What you will learn
Visualização para explorar resultados de consultas de diferentes perspectivas
Construção de gráficos e Dashboards
Unificação de dados em diversos formatos: texto, JSON, PARQUET, dentre outros
Trabalhada por administrador da plataforma, analista de dados, cientista de dados e engenheiro de dados com diversas funcionalidades
Aprendizado processamento distribuído em SPARK
Entendo o que é Databricks File System (DBFS) seu sistema de arquivos
Entendo sobre Cluster
Aprendendo a gerenciar e criar Notebooks em R, SCALA, Python e SQL
Executando scripts multilinguagens
Gerenciando a ingestão de dados e análise de dados, gerando gráficos e dashboards
Construindo na versão community
Trabalhando com a biblioteca dbutils Python
Integrando o Databricks ao Power BI
Entendendo a arquitetura chamada Lakehouse sobre o Data Lake no Databricks
Construindo Delta Lake com processamento em batch, streaming em lote
Controle de transações sobre os dados, como um banco de dados
Trabalhando com características ACID (Atomicidade, Consistência, Isolamento, Durabilidade) ao Delta Lake
Entendendo versionamento dos dados, permite que os dados sejam acessados e revertam para versões anteriores de dados, controle de históricos
Uso das fases de ingestão, refinamento e enriquecimento dos dados
Diferenças das arquiteturas Data Lake x Delta Lake
Aprendendo como otimização dos processos de coleta e tratamento dos dados, reduzindo o tempo de processamento e descartando o que não for útil
Trabalhando a criação de tabelas Delta e como gerar históricos de dados
Trabalhando com cluster, DBFS, Notebook em R, Scala, Pyhton e SQL
Delta Time Travel como retornar versões de dados e comandos de controle
Controle de auditoria, agindo na conformidade de dados quanto de depuração simples para entender como os dados mudaram ao longo do tempo
Executando reversões nos dados, evitando duplicação e realizando refinamento, ajustes, atualizações e exclusões dos dados
Executando scripts batch e streaming
Entendo o que significa checkpoint e controle de gravações dos dados
Trabalhando com Schema Evolution na inclusão de atributos as tabelas delta
Funcionalidades do Azure Data Factory
Casos de Uso do Azure Data Factory
Entender na prática o uso de Pipeline de Dados
Construir pipelines com fluxos e transformações de dados na nuvem
Utilizar das atividades e componentes principais do Azure Data Factory na construção de integrações e ETL de dados
Programar a execução automática de pipelines
Monitorar a execução com Sucesso/Erro de pipelines
AWS GLUE: Criação de Jobs via Glue Studio
AWS GLUE: Criação de Jobs via Script Python no Glue
AWS GLUE: Entendimento de Workflows
AWS GLUE Script, Crawler, Data Catalog, Triggers muito mais na prática.
5371244
udemy ID
6/7/2023
course created date
7/21/2023
course indexed date
Bot
course submited by