PYSPARK: Utilizando SPARK e Python para analisar dados

Trabalhando com SPARK e Python para resolver todos os seus problemas com dados
4.56 (155 reviews)
Udemy
platform
Português
language
Other
category
PYSPARK: Utilizando SPARK e Python para analisar dados
589
students
3 hours
content
Oct 2024
last update
$19.99
regular price

What you will learn

O que é PYSPARK

O que é SPARK

Instalando o SPARK em um ambiente Windows, configurando

Instalando o ANACONDA

Instalando a JDK

Entendendo o ecossistema : Apache Spark + Anaconda + JAVA

Entendendo o conceito de NÓ, CLUSTER

Conhecendo os módulos e pacotes do PYSPARK

O que é SparkContext

Entendo o que é RDD (Resilient Distributed Dataset)

Trabalhando com Spark Dataframe

Compreendendo as diferenças entre transformações e ações, operações com PYSPARK

Operações: collect, count, parallelize, getNumPartitions, textFile, first, filter, cache, Show, take

Aprendendo o que é uma função Lambda

Operações: flatMap, map, reduceByKey, sortBY, join, leftOuterjoin, rightOuterjoin, select, groupBy, orderBy

Monitoramento de jobs com SPARK UI

O que é SparkSession

Leitura de arquivos externos

SPARK SQL

Leitura de dados em JSON

4213170
udemy ID
7/30/2021
course created date
8/7/2021
course indexed date
Bot
course submited by
PYSPARK: Utilizando SPARK e Python para analisar dados - | Comidoc