Databricks Delta Lake + NIFI: streaming e dados

Trabalhando com dados em alta escala NIFI e Databricks Delta Lake
4.50 (3 reviews)
Udemy
platform
Português
language
Databases
category
Databricks Delta Lake + NIFI: streaming e dados
49
students
4.5 hours
content
Oct 2024
last update
$19.99
regular price

What you will learn

Entendendo a arquitetura chamada Lakehouse sobre o Data Lake no Databricks

Construindo Delta Lake com processamento em batch, streaming em lote

Controle de transações sobre os dados, como um banco de dados

Trabalhando com características ACID (Atomicidade, Consistência, Isolamento, Durabilidade) ao Delta Lake

Entendendo versionamento dos dados, permite que os dados sejam acessados e revertam para versões anteriores de dados, controle de históricos

Uso das fases de ingestão, refinamento e enriquecimento dos dados

Diferenças das arquiteturas Data Lake x Delta Lake

Aprendendo como otimização dos processos de coleta e tratamento dos dados, reduzindo o tempo de processamento e descartando o que não for útil

Trabalhando a criação de tabelas Delta e como gerar históricos de dados

Trabalhando com cluster, DBFS, Notebook em R, Scala, Pyhton e SQL

Delta Time Travel como retornar versões de dados e comandos de controle

Controle de auditoria, agindo na conformidade de dados quanto de depuração simples para entender como os dados mu

Executando reversões nos dados, evitando duplicação e realizando refinamento, ajustes, atualizações e exclusões dos dados

Executando scripts batch e streaming

Entendo o que significa checkpoint e controle de gravações dos dados

Trabalhando com Schema Evolution na inclusão de atributos as tabelas delta

Entendo sobre Apache Nifi, uma plataforma de ingestão de dados

Entendo sobre o gerenciamento e a automatização do fluxo de dados

Entendendo sobre coleta de dados, transmissão de dados, armazenamento de dados

Ecossistema NiFi: Repositórios, controle de fluxo, máquina JVM, extensões

O que é Flow File

O que é um Processor

O que é um Fluxo de Dados

O que é uma conexão

O que é um grupo de processor

Aprendendo sobre a barra de componentes

Aprendendo sobre a barra de controle navegação

Aprendendo sobre a barra de operação

Desenvolvimento de diversos fluxos de dados

Extensões: Putfile, Getfile, ExtractText, SplitText

Extensões: EvaluateXpath, UpdateAttribute, GenerateFlowFile

Extensões: RouteOnAttribute, SplitXML, LogMessage, LogAttibute

Extensões: MergeContent, ReplaceText, CompressContent

Uso de Input Port, Funil e Process Group

Related Topics
4926852
udemy ID
10/13/2022
course created date
11/4/2022
course indexed date
Bot
course submited by
Databricks Delta Lake + NIFI: streaming e dados - | Comidoc