Master Querys SQL + Pipelines em Pyspark

Aprendendo a construir projetos em SQL e com pipelines python dentro do SPARK
4.30 (5 reviews)
Udemy
platform
Português
language
Databases
category
Master Querys SQL + Pipelines em Pyspark
113
students
9 hours
content
Oct 2024
last update
$19.99
regular price

What you will learn

O que é PYSPARK

O que é SPARK

Instalando o SPARK em um ambiente Windows, configurando

Instalando o ANACONDA

Instalando a JDK

Entendendo o ecossistema : Apache Spark + Anaconda + JAVA

Entendendo o conceito de NÓ, CLUSTER

Conhecendo os módulos e pacotes do PYSPARK

O que é SparkContext

Entendo o que é RDD (Resilient Distributed Dataset)

Trabalhando com Spark Dataframe

Compreendendo as diferenças entre transformações e ações, operações com PYSPARK

Operações: collect, count, parallelize, getNumPartitions, textFile, first, filter, cache, Show, take

Aprendendo o que é uma função Lambda

Operações: flatMap, map, reduceByKey, sortBY, join, leftOuterjoin, rightOuterjoin, select, groupBy, orderBy

Monitoramento de jobs com SPARK UI

O que é SparkSession

Leitura de arquivos externos

SPARK SQL

Leitura de dados em JSON

Consultar dados com SQL em Banco de Dados

Restringir e Classificar Dados utilizando a linguagem SQL

Inserir Dados com SQL no Banco de Dados

Editar Dados com SQL no Banco de Dados

Excluir Dados com SQL no Banco de Dados

Utilizar a Linguagem SQL no Oracle

Aprender o SQL para uso nos bancos de dados padrão ANSI

Exploração de Dados

Related Topics
4946346
udemy ID
10/26/2022
course created date
11/13/2022
course indexed date
Bot
course submited by
Master Querys SQL + Pipelines em Pyspark - | Comidoc