Master Querys SQL + Pipelines em Pyspark
Aprendendo a construir projetos em SQL e com pipelines python dentro do SPARK
4.30 (5 reviews)

113
students
9 hours
content
Oct 2024
last update
$19.99
regular price
What you will learn
O que é PYSPARK
O que é SPARK
Instalando o SPARK em um ambiente Windows, configurando
Instalando o ANACONDA
Instalando a JDK
Entendendo o ecossistema : Apache Spark + Anaconda + JAVA
Entendendo o conceito de NÓ, CLUSTER
Conhecendo os módulos e pacotes do PYSPARK
O que é SparkContext
Entendo o que é RDD (Resilient Distributed Dataset)
Trabalhando com Spark Dataframe
Compreendendo as diferenças entre transformações e ações, operações com PYSPARK
Operações: collect, count, parallelize, getNumPartitions, textFile, first, filter, cache, Show, take
Aprendendo o que é uma função Lambda
Operações: flatMap, map, reduceByKey, sortBY, join, leftOuterjoin, rightOuterjoin, select, groupBy, orderBy
Monitoramento de jobs com SPARK UI
O que é SparkSession
Leitura de arquivos externos
SPARK SQL
Leitura de dados em JSON
Consultar dados com SQL em Banco de Dados
Restringir e Classificar Dados utilizando a linguagem SQL
Inserir Dados com SQL no Banco de Dados
Editar Dados com SQL no Banco de Dados
Excluir Dados com SQL no Banco de Dados
Utilizar a Linguagem SQL no Oracle
Aprender o SQL para uso nos bancos de dados padrão ANSI
Exploração de Dados
4946346
udemy ID
10/26/2022
course created date
11/13/2022
course indexed date
Bot
course submited by