In diesem 1-stündigen projektbasierten Kurs lernen Sie, ein logistisches Regressionsmodell mit Pyspark MLLIB zu erstellen, um Patienten entweder als Diabetiker oder als Nicht-Diabetiker zu klassifizieren. Wir werden den beliebten Pima Indian Diabetes-Datensatz verwenden. Unser Ziel ist es, einen einfachen logistischen Regressionsklassifikator aus der Pyspark Bibliothek für Maschinelles Lernen für die Klassifizierung von Diabetes zu verwenden. Wir werden das gesamte Projekt in der Google Colab-Umgebung mit der Installation von Pyspark durchführen. Sie benötigen ein kostenloses Gmail-Konto, um dieses Projekt durchzuführen. Bitte beachten Sie, dass der Datensatz und das Modell in diesem Projekt nicht im wirklichen Leben verwendet werden können. Am Ende dieses Projekts werden Sie in der Lage sein, einen logistischen Regressionsklassifikator mit der Pyspark MLlib zu erstellen, um zwischen Diabetikern und Nicht-Diabetikern zu unterscheiden. Darüber hinaus sind Sie in der Lage, Daten zu bereinigen und für die Analyse vorzubereiten. Sie sollten mit der Programmiersprache Python vertraut sein und über ein theoretisches Verständnis des Algorithmus der Logistischen Regression verfügen. Sie benötigen ein kostenloses Gmail-Konto, um dieses Projekt abzuschließen. Hinweis: Dieser Kurs eignet sich am besten für Lernende, die in der Region Nordamerika ansässig sind. Wir arbeiten derzeit daran, diese Erfahrung auch in anderen Regionen anzubieten.


(22 Bewertungen)
Was Sie lernen werden
Lernen Sie, wie man mit Pyspark MLLIB einen Klassifikator für logistische Regression erstellt und trainiert
Lernen Sie, Pyspark in der Google Colab-Umgebung einzurichten
Lernen Sie, mit Pyspark Dataframe zu arbeiten
Kompetenzen, die Sie festigen
- Kategorie: Python-Programmierung
- Kategorie: Datenmanipulation
- Kategorie: PySpark
- Kategorie: Angewandtes maschinelles Lernen
- Kategorie: Maschinelles Lernen
- Kategorie: Datenverarbeitung
- Kategorie: Vorverarbeitung der Daten
- Kategorie: Apache Spark
- Kategorie: Logistische Regression
- Kategorie: Klassifizierungs- und Regressionsbaum (CART)
- Kategorie: Daten bereinigen
- Kategorie: Google Cloud-Platform
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
Nur als Desktop-Version verfügbar
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Lernen, Üben und Anwenden von berufsrelevanten Fähigkeiten in weniger als 2 Stunden
- Nehmen Sie an Schulungen von Branchenexperten teil
- Sammeln Sie mit Aufgaben aus der realen Welt praktische Erfahrung
- Schaffen Sie Vertrauen durch neueste Tools und Technologien

Über dieses begleitete Projekt
Schritt für Schritt lernen
In einem Video, das auf einer Hälfte Ihres Arbeitsbereichs abgespielt wird, führt Sie Ihr Dozent durch diese Schritte:
Einführung & Installationsabhängigkeiten
Klonen und Erkunden von Datensätzen
Bereinigung und Aufbereitung von Daten
Korrelationsanalyse und Feature Selection
Datensatz teilen und logistisches Regressionsmodell erstellen
Das Modell auswerten und speichern
Modell Vorhersage auf einem neuen Satz unmarkierter Datensätze
4 Projektbilder
Was Sie beim Lernen erwartet
Auf Kompetenzen basierendes, praktisches Lernen
Üben Sie die Anwendung neuer Kompetenzen anhand von berufsbezogenen Aufgabenstellungen.
Anleitung durch Experten
Lernen Sie mit vorab von Experten aufgezeichneten Videos in einer einzigartigen aufgeteilten Oberfläche.
Keine Downloads oder Installation erforderlich
Greifen Sie in einem vordefinierten Cloud-Arbeitsbereich auf die Tools und Ressourcen zu.
Nur für Desktop verfügbar
Dieses begleitete Projekt ist für die Bearbeitung an einem Laptop oder Desktop-Computer mit stabiler Internetverbindung konzipiert und nicht für Mobilgeräte.
Warum entscheiden sich Menschen für Coursera für ihre Karriere?




Bewertungen von Lernenden
22 Bewertungen
- 5 stars
72,72 %
- 4 stars
13,63 %
- 3 stars
13,63 %
- 2 stars
0 %
- 1 star
0 %
Zeigt 3 von 22 an
Geprüft am 21. Aug. 2024
Understand the concept easily and practice it at the same time.
Geprüft am 16. Okt. 2021
Thank You for making course so simple to learn how to develop prediction model
Geprüft am 2. Nov. 2022
Solid introduction to pyspark MLLib but left much would have liked to see more model evaluation and comparison to at least another model.
Ihnen könnte auch Folgendes gefallen:
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum

Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Mit dem Kauf eines angeleiteten Projekts erhalten Sie alles, was Sie zum Abschließen des angeleiteten Projekts benötigen, einschließlich des Zugriffs auf einen Cloud-Desktop-Arbeitsbereich über Ihren Webbrowser, der die Dateien und Software enthält, die Sie für den Start benötigen, sowie schrittweise Videoanweisungen von einem Fachexperten.
Da Ihr Arbeitsbereich einen Cloud-Desktop enthält, der für einen Laptop oder Desktop-Computer ausgelegt ist, sind angeleitete Projekte auf Ihrem Mobilgerät nicht verfügbar.
Die Dozenten bei angeleiteten Projekten sind Fachexperten, die Erfahrung in den Fähigkeiten, Werkzeugen oder Bereichen der jeweiligen Projekte haben und leidenschaftlich daran interessiert sind, ihr Wissen weiterzugeben und so Millionen von Lernenden auf der ganzen Welt zu beeinflussen.




