Apache Spark: Entwurf und Ausführung von ETL-Pipelines Hands-On

Sparen Sie mit 40% Rabatt auf 3 Monate Coursera Plus bei den Fähigkeiten, die Sie zum Strahlen bringen. Jetzt sparen

Apache Spark: Entwurf und Ausführung von ETL-Pipelines Hands-On

Dieser Kurs ist Teil von Spezialisierung „Spark und Python für Big Data mit PySpark“

Dozent: EDUCBA

Bei enthalten

Mehr erfahren

2 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

23 Bewertungen

4 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

2 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

23 Bewertungen

4 Stunden zu vervollständigen

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

Installation und Konfiguration von PySpark, Hadoop und MySQL für ETL-Workflows.
Erstellen Sie Spark-Anwendungen für vollständiges und inkrementelles Laden von Daten über JDBC.
Anwendung von Transformationen, Behandlung von Problemen bei der Bereitstellung und Optimierung von ETL-Pipelines.

Kompetenzen, die Sie erwerben

Kategorie: Entwicklungsumgebung
Kategorie: Installation der Software
Kategorie: Datenmanipulation
Kategorie: Daten importieren/exportieren
Kategorie: Datenumwandlung
Kategorie: Extrahieren, Transformieren, Laden
Kategorie: Datenspeicher
Kategorie: Daten-Pipelines

Werkzeuge, die Sie lernen werden

Kategorie: PySpark
Kategorie: Apache Spark
Kategorie: MySQL
Kategorie: Apache Hadoop

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

6 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung „Spark und Python für Big Data mit PySpark“

Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.

Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 2 Module

Dieser praxisorientierte Kurs vermittelt den Teilnehmern die Fähigkeit, durchgängige ETL-Workflows (Extrahieren, Transformieren, Laden) mit Apache Spark in einem realen Data Engineer-Kontext zu entwerfen, zu erstellen und zu verwalten. Der Kurs ist in zwei umfassende Module gegliedert und beginnt mit der grundlegenden Einrichtung, wobei die Teilnehmer durch die Installation der wesentlichen Komponenten wie PySpark, Hadoop und MySQL geführt werden. Die Teilnehmer lernen, ihre Umgebung zu konfigurieren, Projektstrukturen zu organisieren und Quelldatensätze effektiv zu erforschen. Im weiteren Verlauf des Kurses entwickeln die Teilnehmer Spark-Anwendungen, um vollständige und inkrementelle Datenladungen mithilfe der JDBC-Integration mit MySQL durchzuführen. Anhand praktischer Beispiele wenden sie Transformationslogik mit Spark SQL an, filtern Daten auf der Grundlage von Geschäftsregeln und behandeln häufige Probleme wie Typabweichungen und Probleme mit der Ordnerstruktur während der Spark-Bereitstellung. Am Ende des Kurses sind die Teilnehmer in der Lage, Spark-basierte ETL-Pipelines zu konstruieren, auszuführen und zu optimieren, die skalierbar und produktionsbereit sind, so dass sie in der Lage sind, einen effektiven Beitrag in realen Data-Engineering-Rollen zu leisten.

Dieses Modul führt die Lernenden in die Grundlagen des Aufbaus eines ETL-Frameworks mit Apache Spark ein. Es beginnt mit einem Überblick über das Spark-Ökosystem und seine Vorteile bei der Big Data-Verarbeitung. Die Lernenden werden durch die Installation und Konfiguration der wesentlichen Softwarepakete, die Einrichtung der Entwicklungsumgebung und das Verständnis der Struktur eines Spark-basierten ETL-Projekts geführt. Das Modul behandelt auch die Arbeit mit realen Datensätzen und die Vorbereitung von Konfigurationsdateien für die Interaktion mit Datenbanken - eine solide Grundlage für skalierbare Workflows zur Datenverarbeitung.

Das ist alles enthalten

5 Videos3 Aufgaben

5 VideosInsgesamt 52 Minuten

Einführung in das Projekt14 Minuten
Installation von Paketen7 Minuten
Installation der Pakete fortsetzen8 Minuten
Aufbau der Projektstruktur10 Minuten
Datensatz erforschen12 Minuten

3 AufgabenInsgesamt 60 Minuten

Einstieg in das ETL-Projekt (Extrahieren, Transformieren, Laden)15 Minuten
Aufbau der Projektstruktur und Verständnis der Daten15 Minuten
Benotetes Quiz - Aufbau des Fundaments30 Minuten

Dieses Modul führt die Lernenden durch die praktische Implementierung von Prozessen zum Extrahieren, Transformieren, Laden (ETL) mit Apache Spark. Die Lernenden erforschen das vollständige Laden von Daten in MySQL, wenden Transformationslogik mit Spark SQL an und behandeln inkrementelle Ladeszenarien, indem sie neue Einträge verfolgen und verwalten. Die Lektionen umfassen Fehlerbehandlung, Filterstrategien, Datentypkompatibilität und Datenbankintegration mit JDBC - alles in einer praktischen PySpark-Umgebung. Dieses Modul stärkt das angewandte Wissen über Spark für reale Data-Engineering-Aufgaben.

Das ist alles enthalten

6 Videos3 Aufgaben

6 VideosInsgesamt 47 Minuten

Gesamte Last und Transformationen Teil 17 Minuten
Gesamte Last und Transformationen Teil 27 Minuten
Gesamte Last und Transformationen Teil 37 Minuten
Gesamte Last und Transformationen Teil 49 Minuten
Inkrementelle Last7 Minuten
Inkrementelle Last Fortsetzen10 Minuten

3 AufgabenInsgesamt 60 Minuten

Vollständige Last und Transformationen15 Minuten
Handhabung inkrementeller Lasten15 Minuten
Benotetes Quiz - Erstellen von ETL Workflows in Apache Spark30 Minuten

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

Lehrkraftbewertungen

(7 Bewertungen)

EDUCBA

1.290 Kurse293.287 Lernende

von

EDUCBA

Mehr von Datenanalyse entdecken

Status: Kostenloser Testzeitraum
Coursera
Engineering Data Ecosystems: Pipelines, ETL, Spark
Kurs
Status: Kostenloser Testzeitraum
Packt
Apache Spark with Scala – Hands-On with Big Data!
Kurs
Packt
Data Engineering with Scala and Spark
Kurs
Status: Kostenloser Testzeitraum
EDUCBA
Apache Spark: Apply & Evaluate Big Data Workflows
Kurs

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018

„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020

„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021

„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Bewertungen von Lernenden

5 stars
52,17 %
4 stars
34,78 %
3 stars
8,69 %
2 stars
0 %
1 star
4,34 %

Zeigt 3 von 23 an

Geprüft am 9. Apr. 2026

Comprehensive Spark ETL course with practical MySQL integration. Covers transformations, incremental loads, and real deployment challenges effectively for beginners.

Geprüft am 19. Jan. 2026

Learners feel they actually build powerful pipelines — from raw ingestion to analytics-ready outputs, not just toy examples.

Geprüft am 5. Jan. 2026

I liked how this course didn’t just talk about Spark, but actually showed me how to build and run ETL pipelines — that’s rare in short courses.

Weitere Bewertungen anzeigen

Häufig gestellte Fragen

Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.

Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.

Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.

Weitere Fragen

Besuchen Sie die das Hilfe-Center für Kursteilnehmer.

Finanzielle Unterstützung verfügbar,