Databricks e PySpark: analisando dados

Saiba trabalhar em alto nível na área de dados
4.39 (484 reviews)
Udemy
platform
Português
language
Other
category
Databricks e PySpark: analisando dados
2,153
students
6 hours
content
Jan 2025
last update
$54.99
regular price

What you will learn

Visualização para explorar resultados de consultas de diferentes perspectivas

Construção de gráficos e Dashboards

Unificação de dados em diversos formatos: texto, JSON, PARQUET, dentre outros

Trabalhada por administrador da plataforma, analista de dados, cientista de dados e engenheiro de dados com diversas funcionalidades

Aprendizado processamento distribuído em SPARK

Entendo o que é Databricks File System (DBFS) seu sistema de arquivos

Entendo sobre Cluster

Aprendendo a gerenciar e criar Notebooks em R, SCALA, Python e SQL

Executando scripts multilinguagens

Gerenciando a ingestão de dados e análise de dados, gerando gráficos e dashboards

Construindo na versão community

Trabalhando com a biblioteca dbutils Python

Integrando o Databricks ao Power BI

O que é PYSPARK

O que é SPARK

Instalando o SPARK em um ambiente Windows, configurando

Instalando o ANACONDA

Instalando a JDK

Entendendo o ecossistema : Apache Spark + Anaconda + JAVA

Entendendo o conceito de NÓ, CLUSTER

Conhecendo os módulos e pacotes do PYSPARK

O que é SparkContext

Entendo o que é RDD (Resilient Distributed Dataset)

Trabalhando com Spark Dataframe

Compreendendo as diferenças entre transformações e ações, operações com PYSPARK

Operações: collect, count, parallelize, getNumPartitions, textFile, first, filter, cache, Show, take

Aprendendo o que é uma função Lambda

Operações: flatMap, map, reduceByKey, sortBY, join, leftOuterjoin, rightOuterjoin, select, groupBy, orderBy

Monitoramento de jobs com SPARK UI

O que é SparkSession

Leitura de arquivos externos

SPARK SQL

Leitura de dados em JSON

Screenshots

Databricks e PySpark: analisando dados - Screenshot_01Databricks e PySpark: analisando dados - Screenshot_02Databricks e PySpark: analisando dados - Screenshot_03Databricks e PySpark: analisando dados - Screenshot_04
4232528
udemy ID
8/9/2021
course created date
8/18/2021
course indexed date
Bot
course submited by
Databricks e PySpark: analisando dados - | Comidoc