Formação Spark com Pyspark : o Curso Completo

Domine a mais importante ferramenta para Cientistas de Dados e Engenheiros de Dados para processamento de dados massivos
4.64 (1749 reviews)
Udemy
platform
Português
language
Other
category
instructor
Formação Spark com Pyspark : o Curso Completo
8 453
students
11 hours
content
Jan 2025
last update
$29.99
regular price

Why take this course?

🎉 Formação Spark com Pyspark: o Curso Completo 🌟

Domine a Mais Importante Ferramenta para Cientistas de Dados e Engenheiros de Dados para Processamento de Dados Massivos!

O que Aprenderá no Curso

Introdução ao Spark e Instalação:

  • Descubra como instalar e configurar o Apache Spark, a ferramenta de processamento de dados distribuído.

Princípios Básicos do Spark:

  • Dive no mundo dos DataFrames do Spark, uma das estruturas de dados centrais para trabalhar com grandes conjuntos de dados.

Processamento de Dados com Spark:

  • Aprenda a realizar transformações e ações em DataFrames para processar dados de forma eficiente.

Consultas e Análise de Dados:

  • Utilize a Sintaxe SQL no Spark para consultar e analisar dados de maneira rápida e intuitiva.

Trabalhando com Tabelas e Joins:

  • Crie Views e faça Joins para enriqucer seu análise de dados.

Persistência e Armazenamento de Dados:

  • Descubra como persistir dados em disco, criando tabelas em formatos como Parquet e ORC.

Importação de Dados:

  • Importe dados de diversas fontes como Mongodb, PostgreSQL e arquivos em Json e Parquet.

Desenvolvimento de Aplicações:

  • Construa aplicações que você pode rodar na linha de comando para processar dados em tempo real.

Machine Learning no Spark:

  • Explore o potencial de Machine Learning com o Spark, criando modelos e realizando previsões.

Construção de Pipelines de ML:

  • Conheça como construir pipelines de aprendizado de máquina para otimizar e automatizar seus processos.

Streaming em Tempo Real:

  • Use o Spark Structured Streaming para processar dados em tempo real, garantindo análises apertadas.

Otimização do Spark:

  • Aprenda a otimizar seu cluster usando Cache, Persistência, Particionamento e Bucketing.

Integração com Jupyter Notebooks:

  • Trabalhe com o Spark em conjunto com Jupyter Notebooks para uma experiência de análise interativa.

Extensões do Python:

  • Use Spark com bibliotecas como Pandas, expandindo as possibilidades de análise de dados.

Criação e Gerenciamento de Clusters:

  • Aprenda a construir seu próprio cluster Spark para escalar seus processos de dados.

Conteúdo Completo ao Seu Dispor

  • Material de Curso: Scripts, slides e conjuntos de dados de exemplo para que você possa replicar os exercícios e práticas.

Este curso é a ponte entre você e a domínio completo do processamento de dados com o Spark. Com as habilidades adquiridas, estará preparado para enfrentar os desafios do mundo das Big Data, Machine Learning e análise de dados em tempo real. 🚀

Não demore, inscreva-se e comece a transformar seu potencial em resultados concretos com Spark e Pyspark! 💡

Loading charts...

4234864
udemy ID
10/08/2021
course created date
27/08/2021
course indexed date
Bot
course submited by