Engenharia de Dados com Google Dataflow e Apache Beam na GCP

Why take this course?
🌟 Engenharia de Dados com Google Dataflow e Apache Beam na GCP 🌟
Sua jornada começa aqui! Aprenda a transformar e gerenciar dados em tempo real com o Google Cloud Platform (GCP) utilizando o poder do Apache Beam e o serviço Google Dataflow. Este curso é perfeito para quem deseja iniciar ou ampliar suas habilidades em ETL (Extract, Transform, Load) tanto em batch quanto em streaming.
🚀 O que você vai aprender:
-
Entendendo o Apache Beam: Desvollupamos o funcionamento interno do Apache Beam, a ferramenta que torna o processamento de dados mais eficiente e escalável.
-
Benefícios do Apache Beam: Descubra por que esse framework é a solução ideal para processamento em massa de dados e como ele se integra perfeitamente com o GCP.
-
Desenvolvimento local: Aprenda a trabalhar com o Apache Beam SDK do Python no seu próprio computador sem a necessidade de instalações complexas, utilizando o Google Colab para desenvolvimentos.
-
Principais Funções do Beam: Explore as funções principais e como elas são usadas para construir suas pipelines de dados.
-
Deploy em Google Dataflow: Saiba como transformar seus projetos locais em pipelines robustas no Google Dataflow, tanto para batch quanto para streaming real-time.
-
Integração com Pub/Sub: Entenda o uso do serviço de mensageria Pub/Sub e como ele se integra ao Apache Beam para processamento de dados em tempo real.
🔹 Destaque do Curso:
-
Atualizações Contínuas: Este curso é dinâmico e estará sempre a par das últimas atualizações tecnológicas.
-
Nível Introdutório: Esteja seguro sabendo que o curso assume conhecimento básico de Python, mas não ensina o idioma em si.
💻 Requisitos e Preparativos:
-
Conhecimento Básico de Python: Antes de começar, certifique-se de ter compreensão básica de Python, incluindo a definição de funções, criação de objetos e manipulação de tipos de dados.
-
Instalação do Python 3.7 ou superior: Prepare seu ambiente local com o Python 3.7 ou uma versão mais recente.
-
Conta Gratuita no GCP: Para as seções envolvendo o deploy na Google Dataflow, você precisará ter uma conta gratuita na GCP. Esteja pronto com seu cartão de crédito para a configuração!
📅 Agenda do Curso:
-
Seção 2 – Conceitos: Fundamentos do Apache Beam e compreensão dos conceitos básicos de ETL.
-
Seção 3 – Principais Funções: Aprenda a definir e conectar as principais funções no Apache Beam.
-
Seção 4 – Apache Beam no Google Dataflow: Explore como deployar suas pipelines para o Google Dataflow em batch.
-
Seção 5 – Streaming no Google Dataflow com Pub/Sub: Desvollupamento de pipelines em streaming utilizando Pub/Sub e Google Dataflow.
📆 Aproveite as oportunidades para transformar seus dados em insights valiosos! Inscreva-se agora e dê os primeiros passos rumo à Engenharia de Dados com confiança e habilidade. 🚀
Loading charts...