Dieser praxisorientierte Kurs vermittelt den Teilnehmern die Fähigkeit, durchgängige ETL-Workflows (Extrahieren, Transformieren, Laden) mit Apache Spark in einem realen Data Engineer-Kontext zu entwerfen, zu erstellen und zu verwalten. Der Kurs ist in zwei umfassende Module gegliedert und beginnt mit der grundlegenden Einrichtung, wobei die Teilnehmer durch die Installation der wesentlichen Komponenten wie PySpark, Hadoop und MySQL geführt werden. Die Teilnehmer lernen, ihre Umgebung zu konfigurieren, Projektstrukturen zu organisieren und Quelldatensätze effektiv zu erforschen. Im weiteren Verlauf des Kurses entwickeln die Teilnehmer Spark-Anwendungen, um vollständige und inkrementelle Datenladungen mithilfe der JDBC-Integration mit MySQL durchzuführen. Anhand praktischer Beispiele wenden sie Transformationslogik mit Spark SQL an, filtern Daten auf der Grundlage von Geschäftsregeln und behandeln häufige Probleme wie Typabweichungen und Probleme mit der Ordnerstruktur während der Spark-Bereitstellung. Am Ende des Kurses sind die Teilnehmer in der Lage, Spark-basierte ETL-Pipelines zu konstruieren, auszuführen und zu optimieren, die skalierbar und produktionsbereit sind, so dass sie in der Lage sind, einen effektiven Beitrag in realen Data-Engineering-Rollen zu leisten.

Apache Spark: Entwurf und Ausführung von ETL-Pipelines Hands-On
Sparen Sie mit 40% Rabatt auf 3 Monate Coursera Plus bei den Fähigkeiten, die Sie zum Strahlen bringen. Jetzt sparen

Apache Spark: Entwurf und Ausführung von ETL-Pipelines Hands-On
Dieser Kurs ist Teil von Spezialisierung „Spark und Python für Big Data mit PySpark“

Dozent: EDUCBA
Bei enthalten
23 Bewertungen
Was Sie lernen werden
Installation und Konfiguration von PySpark, Hadoop und MySQL für ETL-Workflows.
Erstellen Sie Spark-Anwendungen für vollständiges und inkrementelles Laden von Daten über JDBC.
Anwendung von Transformationen, Behandlung von Problemen bei der Bereitstellung und Optimierung von ETL-Pipelines.
Kompetenzen, die Sie erwerben
- Kategorie: Daten-Pipelines
- Kategorie: Entwicklungsumgebung
- Kategorie: Datenmanipulation
- Kategorie: Datenspeicher
- Kategorie: Installation der Software
- Kategorie: Datenumwandlung
- Kategorie: Extrahieren, Transformieren, Laden
- Kategorie: Daten importieren/exportieren
Werkzeuge, die Sie lernen werden
- Kategorie: Apache Spark
- Kategorie: PySpark
- Kategorie: MySQL
- Kategorie: Apache Hadoop
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
6 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

Mehr von Datenanalyse entdecken
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Bewertungen von Lernenden
- 5 stars
52,17 %
- 4 stars
34,78 %
- 3 stars
8,69 %
- 2 stars
0 %
- 1 star
4,34 %
Zeigt 3 von 23 an
Geprüft am 9. Apr. 2026
Comprehensive Spark ETL course with practical MySQL integration. Covers transformations, incremental loads, and real deployment challenges effectively for beginners.
Geprüft am 19. Jan. 2026
Learners feel they actually build powerful pipelines — from raw ingestion to analytics-ready outputs, not just toy examples.
Geprüft am 5. Jan. 2026
I liked how this course didn’t just talk about Spark, but actually showed me how to build and run ETL pipelines — that’s rare in short courses.
Häufig gestellte Fragen
Weitere Fragen
Finanzielle Unterstützung verfügbar,





