Dieser Kurs für Fortgeschrittene befähigt die Teilnehmer, Modelle des Maschinellen Lernens mit Hilfe des verteilten Computing-Frameworks von Apache PySpark anzuwenden, zu analysieren und zu bewerten. Der Kurs richtet sich an Datenexperten, die mit Python und grundlegenden ML-Konzepten vertraut sind, und befasst sich mit der praktischen Umsetzung von Regressions- und Klassifizierungsverfahren sowie mit unüberwachtem Clustering. In Modul 1 werden die Teilnehmer lineare und verallgemeinerte Regressionsmodelle erstellen, Ensemble-Regressoren wie Random Forests anwenden und die Vorhersageleistung anhand von Metriken wie RMSE und R-Quadrat bewerten. Das Modul schließt mit einer eingehenden Betrachtung der logistischen Regression für binäre Klassifizierungsaufgaben ab. Modul 2 baut auf diesen Grundlagen auf und behandelt die Klassifizierung mehrerer Klassen unter Verwendung der multinomialen logistischen Regression und von Entscheidungsbäumen. Die Lernenden werden auch Ensemble-Modelle wie Random Forests für eine robuste Klassifizierung bewerten und K-Means Clustering für Probleme des Unüberwachten Lernens erkunden. Jedes Konzept wird durch angeleitete PySpark Code-Demonstrationen, prädiktive Workflows und praktische Auswertungen mit großen Datensätzen untermauert. Am Ende des Kurses werden die Lernenden in der Lage sein, Modelle des Maschinellen Lernens in PySpark für skalierbare Lösungen für die Analytik zu entwerfen, auszuführen und kritisch zu bewerten.

Schalten Sie mit Coursera Plus den Zugang zu mehr als 10.000 Kursen frei. Starten Sie die 7-tägige kostenlose Testversion.

PySpark: Anwenden & Auswerten von prädiktiven ML-Modellen
Dieser Kurs ist Teil von Spezialisierung für Spark und Python für Big Data mit PySpark

Dozent: EDUCBA
Bei enthalten
Was Sie lernen werden
Erstellung und Auswertung von Regressionsmodellen in PySpark unter Verwendung von linearen, GLM- und Ensemble-Methoden.
Wenden Sie logistische Regression, Entscheidungsbäume und Random Forests zur Klassifizierung an.
Implementierung von K-Means Clustering und Bewertung skalierbarer ML-Workflows mit PySpark.
Kompetenzen, die Sie erwerben
- Kategorie: Regressionsanalyse
- Kategorie: Algorithmen für maschinelles Lernen
- Kategorie: Angewandtes maschinelles Lernen
- Kategorie: Statistisches maschinelles Lernen
- Kategorie: PySpark
- Kategorie: Random Forest Algorithmus
- Kategorie: Überwachtes Lernen
- Kategorie: Unüberwachtes Lernen
- Kategorie: Prädiktive Analytik
- Kategorie: Prädiktive Modellierung
- Kategorie: Daten-Pipelines
- Kategorie: Apache Spark
- Kategorie: Klassifizierungs- und Regressionsbaum (CART)
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
August 2025
7 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 2 Module
Dieses Modul führt die Lernenden in grundlegende und fortgeschrittene Techniken der Regressionsmodellierung unter Verwendung der MLlib von PySpark ein. Die Lernenden beginnen mit grundlegenden Workflows der Linearen Regression, einschließlich Datenvorbereitung, Zusammenstellung von Merkmalen und Vorhersage. Anschließend werden komplexere Modelle wie die verallgemeinerte lineare Regression und Ensemble-Techniken wie die Random Forest Regression behandelt. Das Modul endet mit logistischen Regressionsmodellen, die für die Binäre Klassifizierung entwickelt wurden und die Lernenden in die Lage versetzen, skalierbare Machine Learning-Pipelines für die prädiktive Analytik in verteilten Umgebungen zu konstruieren und zu bewerten.
Das ist alles enthalten
11 Videos4 Aufgaben
Dieses Modul vermittelt den Lernenden die Fähigkeit, Klassifizierungs- und Clustering-Modelle mit Hilfe der Bibliothek für Maschinelles Lernen von PySpark zu erstellen, zu trainieren und zu evaluieren. Es behandelt praktische Anwendungen der multinomialen logistischen Regression für Mehrklassenprobleme, Entscheidungsbaum-Klassifikatoren für regelbasierte Vorhersagen, Ensemble-Methoden wie Random Forests für eine verbesserte Generalisierung und unüberwachte Clustering-Techniken mit dem K-Means Algorithmus. Durch praktische Demonstrationen erlangen die Lernenden Kenntnisse in der Datenaufbereitung, Modellkonfiguration, Vorhersageinterpretation und Modellevaluation in großen verteilten Umgebungen.
Das ist alles enthalten
5 Videos3 Aufgaben
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Mehr von Datenanalyse entdecken
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Status: Kostenloser TestzeitraumEdureka
Status: Kostenloser Testzeitraum
Warum entscheiden sich Menschen für Coursera für ihre Karriere?





Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.
Ja. Für ausgewählte Lernprogramme können Sie eine finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Anmeldungsgebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.
Weitere Fragen
Finanzielle Unterstützung verfügbar,

