Aparche Spark streaming con Python y PySpark
Agrega Spark Streaming a tu proyectos de Machine Learning y Data Science
4.26 (121 reviews)

1,722
students
3.5 hours
content
Feb 2019
last update
$19.99
regular price
What you will learn
Resumen general de la arquitectura de Apache Spark.
Se capaz de trabajar con la abstracción principal de Apache Spark, RDDs o conjuntos de datos distribuidos y resilientes, para procesar y analizar grandes conjuntos de datos.
Desarrollar aplicaciones Apache Spark 2.0, utilizando transformaciones y acciones en RDD y Spark SQL.
Escalar aplicaciones Spark a un clúster Hadoop YARN a través del servicio Elastic MapReduce de Amazon.
Analizar datos estructurados y semiestructurados utilizando conjuntos de datos (Datasets) y Dataframes, y entender a detalle el funcionamiento de Spark SQL.
Compartir información a través de diferentes nodos en un clúster de Apache Spark, mediante variables de difusión y acumuladores.
Técnicas avanzadas para optimizar y mejorar, trabajos de Apache Spark mediante el particionado, almacenamiento en caché y la persistencia de RDDs.
Buenas prácticas de trabajo con Apache Spark
Screenshots




Related Topics
2160360
udemy ID
1/18/2019
course created date
11/20/2019
course indexed date
Bot
course submited by