Alteryx TRIFACTA e Apache HOP: cargas e tratamento de dados

Construa pipelines de dados e faça tratamento, governança e ajustes nos dados
4.50 (9 reviews)
Udemy
platform
Português
language
Data Science
category
Alteryx TRIFACTA e Apache HOP: cargas e tratamento de dados
467
students
6.5 hours
content
Oct 2024
last update
$19.99
regular price

What you will learn

Preparação de dados aberta que pode se conectar a diversas fontes de dados

Integração em todas as principais plataformas de dados em nuvem

Decida entre ETL ou ELT, ou uma combinação ideal dos dois com base no desempenho

Suporte para todas as principais nuvens, Google, AWS, Azure e on-premise

Interface intuitiva e simples utilização de objetos de dados

Perfilização de dados, ajudando na identificação de outliers

Tratamento de dados, criação de novos campos, dentre outras tarefas

Eliminação de dados nulos, inconsistências, criação de novos campos

Exploração e avaliação de conteúdo e de qualidade de qualquer conjunto de dados

Engenharia de dados com low-code, visual, direto na nuvem

Construção, implantação e automatização de pipelines de dados

Criação de flow de dados, que permite ao analista encadear suas ações de tratamento

Action com os dados: Columns, Rename, Sort, Calculate, Group By, Filter Rows, Replace

Action com os dados: Split, Create formula, dentre outros

Exportação dos resultados automatizados

O que é  Hop Orchestration Platform

Entendendo sobre fluxos de trabalho e pipelines

Entendendo sobre projetos e ambientes

Instalação do APACHE HOP

Criando pipelines com arquivos texto

Realizando tratamento de dados para entendimento do processo de engenharia de dados

O que são transformações, links e ações dentro de um pipeline

Construindo um workflow, orquestrador da sequência das operações

Entendendo o HOP GUI e seus componentes

Entendendo menu barras, principal e perspectivas

Criando sua área de projetos

Componentes pipelines: Sort, Select value, CSV file input, Value mapper, Filter rows, Dummy, Unique rows, Merge Join, Text File Output

Entendendo o que é : View output, Preview output , Debug output

Componentes pipelines: Number Range, Concat Field, String Operations, Replace in String, IF Field Value is Null, Split Fields, CSV File Input, Mail, File Exist

Leitura de dados em uma API: Rest Client, JSON Input, JSON Output

Construindo Workflow com execução de pipelines

Entendo o uso de variáveis globais no APACHE HOP

Automatização de pipeline ou workflow pelo HOP-RUN

Construindo pipelines em banco de dados Postgresql: Table Input, Table Output, Configurando conexão

Instalação de banco de dados Postgresql, usando PGAdmin

Related Topics
5048770
udemy ID
12/29/2022
course created date
1/8/2023
course indexed date
Bot
course submited by