Las canalizaciones de datos suelen realizarse según uno de los paradigmas extracción y carga (EL); extracción, carga y transformación (ELT), o extracción, transformación y carga (ETL). En este curso, abordaremos qué paradigma se debe utilizar para los datos por lotes y cuándo corresponde usarlo. Además, veremos varias tecnologías de Google Cloud para la transformación de datos, incluidos BigQuery, la ejecución de Spark en Dataproc, grafos de canalización en Cloud Data Fusion y procesamiento de datos sin servidores en Dataflow. Los estudiantes obtienen experiencia práctica en la compilación de componentes de canalizaciones de datos en Google Cloud con Qwiklabs.


Building Batch Data Pipelines on GCP en Español
Dieser Kurs ist Teil mehrerer Programme.

Dozent: Google Cloud Training
Bei enthalten
(45 Bewertungen)
Was Sie lernen werden
Revisar los diferentes métodos de carga de datos: EL, ELT y ETL, y cuándo corresponde usarlos.
Ejecutar Hadoop en Dataproc, usar Cloud Storage y optimizar trabajos de Dataproc.
Compilar tus canalizaciones para el procesamiento de datos con Dataflow.
Administrar canalizaciones de datos con Data Fusion y Cloud Composer.
Kompetenzen, die Sie erwerben
- Kategorie: Data Integration
- Kategorie: Extract, Transform, Load
- Kategorie: Apache Spark
- Kategorie: Data Migration
- Kategorie: Performance Tuning
- Kategorie: Dataflow
- Kategorie: Serverless Computing
- Kategorie: Data Transformation
- Kategorie: PySpark
- Kategorie: Apache Hadoop
- Kategorie: Google Cloud Platform
- Kategorie: Data Pipelines
- Kategorie: Big Data
- Kategorie: Data Processing
- Kategorie: Apache Hive
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
5 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 4 Module
Aprenderás la función esencial de un ingeniero de datos en el desarrollo y mantenimiento de canalizaciones de datos por lotes, comprenderás sus componentes principales y su ciclo de vida, y analizarás los desafíos comunes en el procesamiento de datos por lotes. También identificarás los servicios clave de Google Cloud que abordan estos desafíos.
Das ist alles enthalten
1 Aufgabe2 Plug-ins
Diseñarás canalizaciones de datos por lotes escalables para la transferencia y transformación de datos de gran volumen. También optimizarás trabajos por lotes para lograr una alta capacidad de procesamiento y rentabilidad con diversas técnicas de administración de recursos y ajuste de rendimiento.
Das ist alles enthalten
1 Aufgabe2 App-Elemente6 Plug-ins
Desarrollarás reglas de validación de datos y lógica de limpieza para garantizar la calidad de los datos en las canalizaciones por lotes. También implementarás estrategias para administrar la evolución de esquemas y realizar la anulación de duplicación de datos en grandes conjuntos de datos.
Das ist alles enthalten
1 Aufgabe1 App-Element6 Plug-ins
Organizarás flujos de trabajo complejos de canalizaciones de datos por lotes para una programación eficiente y un seguimiento de linaje. También implementarás un manejo de errores, una supervisión y una observabilidad sólidos para las canalizaciones de datos por lotes.
Das ist alles enthalten
2 Aufgaben1 App-Element6 Plug-ins
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Dozent

von
Mehr von Cloud Computing entdecken
Status: Kostenloser TestzeitraumGoogle Cloud

Google Cloud

Google Cloud
Status: Kostenloser Testzeitraum
Warum entscheiden sich Menschen für Coursera für ihre Karriere?




Bewertungen von Lernenden
45 Bewertungen
- 5 stars
71,11 %
- 4 stars
24,44 %
- 3 stars
2,22 %
- 2 stars
0 %
- 1 star
2,22 %
Zeigt 3 von 45 an
Geprüft am 29. Juni 2020
excelente material, buena explicación de conceptos claves para la creación de pipelines, y porque elegir dataflow en vez de datafusion
Geprüft am 13. Dez. 2023
se me presentaron varios problemas con los laboratorios
Geprüft am 23. Aug. 2021
Excelente curso, muy bien explicado, las parcticas son muy utiles

Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Yes, you can preview the first video and view the syllabus before you enroll. You must purchase the course to access content not included in the preview.
If you decide to enroll in the course before the session start date, you will have access to all of the lecture videos and readings for the course. You’ll be able to submit assignments once the session starts.
Once you enroll and your session begins, you will have access to all videos and other resources, including reading items and the course discussion forum. You’ll be able to view and submit practice assessments, and complete required graded assignments to earn a grade and a Course Certificate.
Weitere Fragen
Finanzielle Unterstützung verfügbar,

