Die meisten realen Daten sind nicht sauber, sondern unordentlich, unvollständig und über verschiedene Quellen wie Websites, APIs und Datenbanken verteilt. In diesem Kurs lernen Sie, wie Sie diese Daten sammeln, bereinigen und für die Analyse mit Python und SQL vorbereiten. Sie beginnen mit der Extraktion von Daten aus Webseiten mithilfe von Tools wie Pandas und Beautiful Soup und lernen, wie Sie mit unstrukturiertem Text umgehen und ethische Scraping-Praktiken anwenden. Als Nächstes greifen Sie über APIs auf Echtzeitdaten zu, parsen JSON-Dateien und bereinigen numerische Daten mithilfe von Techniken wie Normalisierung und Binning. Außerdem lernen Sie, wie Sie die Authentifizierung mit API-Schlüsseln verwalten und diese sicher speichern. Schließlich arbeiten Sie mit Datenbanken: Abfragen und Verknüpfen von Tabellen mithilfe von SQL, Validieren von Ergebnissen und Verstehen, wann SQL und wann Python für verschiedene Vorverarbeitungsaufgaben verwendet werden sollten. Am Ende des Kurses werden Sie in der Lage sein, Rohdaten aus der realen Welt in zuverlässige, analysefähige Eingaben zu verwandeln - eine Kernkompetenz für jeden Datenexperten.


Daten-E/A und Vorverarbeitung mit Python und SQL
Dieser Kurs ist Teil von DeepLearning.AI Data Analytics (berufsbezogenes Zertifikat)

Dozent: Sean Barnes
TOP-LEHRKRAFT
4.265 bereits angemeldet
(11 Bewertungen)
Empfohlene Erfahrung
Was Sie lernen werden
Sie werden mit realen Daten arbeiten, wie sie in der Praxis vorkommen: unübersichtlich, unstrukturiert und über verschiedene Quellen verteilt.
Sie werden lernen, Daten aus Websites, APIs und Datenbanken zu extrahieren und sie mit Python und SQL zu bereinigen, ein wesentlicher Schritt in jeder Analyse-Pipeline.
Kompetenzen, die Sie erwerben
- Kategorie: Text Mining
- Kategorie: Unstrukturierte Daten
- Kategorie: Datenintegrität
- Kategorie: SQL
- Kategorie: Schnittstelle zur Anwendungsprogrammierung (API)
- Kategorie: Datenüberprüfung
- Kategorie: Datenverarbeitung
- Kategorie: Extrahieren, Transformieren, Laden
- Kategorie: Daten bereinigen
- Kategorie: Datenumwandlung
- Kategorie: JSON
- Kategorie: Generative KI
- Kategorie: Datenmanipulation
- Kategorie: Web Scraping
- Kategorie: Pandas (Python-Paket)
- Kategorie: Relationale Datenbanken
- Kategorie: Datenethik
- Kategorie: Daten importieren/exportieren
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
16 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihr Fachwissen im Bereich Datenanalyse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat von DeepLearning.AI zur Vorlage

In diesem Kurs gibt es 4 Module
In diesem Modul werden Techniken zur Erfassung von Daten aus einem breiten Bereich von Quellen vorgestellt, wobei der Schwerpunkt auf Web Scraping und Textverarbeitung liegt. Sie werden zunächst untersuchen, wie Daten in Analyse-Pipelines fließen, und praktische Erfahrungen mit Tools wie Pandas und Beautiful Soup sammeln, um Daten zu extrahieren, zu bereinigen und zu strukturieren. Sie werden Methoden zur Textvorverarbeitung anwenden, um fehlende Werte zu behandeln und HTML zu analysieren. Außerdem werden Sie sich mit den ethischen Implikationen des Scrapens von Daten aus dem Web auseinandersetzen.
Das ist alles enthalten
22 Videos3 Lektüren4 Aufgaben1 Programmieraufgabe3 Unbewertete Labore
Dieses Modul konzentriert sich auf die Erfassung von Daten mithilfe von APIs sowie auf die Anwendung numerischer Bereinigungstechniken. Sie lernen, wie man Daten von webbasierten APIs abruft, die Authentifizierung sicher handhabt und rohe JSON-Antworten in brauchbare Datenrahmen umwandelt. Das Modul behandelt auch Techniken zur Bereinigung und Aufbereitung numerischer Daten, einschließlich Skalierung, Binning, Normalisierung und Behandlung von Ausreißern.
Das ist alles enthalten
17 Videos2 Lektüren4 Aufgaben1 Programmieraufgabe3 Unbewertete Labore
In diesem Modul werden die Grundlagen der Datenspeicherung und -abfrage mit Hilfe von Datenbanken und SQL vermittelt. Sie lernen, wie Daten in relationalen Systemen strukturiert sind, erforschen Kernkonzepte wie Entitäten, Beziehungen und Schemata und sammeln praktische Erfahrungen beim Schreiben von SQL-Abfragen. Außerdem lernen Sie, wie Sie Datenbanken von einem Python-Notizbuch aus abfragen können und wie generative KI-Tools SQL-basierte Aufgaben unterstützen können.
Das ist alles enthalten
15 Videos3 Lektüren4 Aufgaben1 Programmieraufgabe2 Unbewertete Labore
In diesem Modul erweitern Sie Ihre SQL-Kenntnisse in den Bereichen Datenvorverarbeitung, Validierung und Joins (Kombination von Tabellen). Sie lernen, wie Sie SQL zum Filtern, für bedingte Logik und für den Umgang mit fehlenden Werten einsetzen und Validierungstechniken mit Aggregation und Gruppierung anwenden. Das Modul befasst sich auch mit verschiedenen Arten von Joins und demonstriert, wie diese verwendet werden können, um Daten über mehrere Tabellen hinweg zu kombinieren und zu analysieren - insbesondere in realen Szenarien wie der Analyse von Sportleistungsdaten.
Das ist alles enthalten
17 Videos11 Lektüren4 Aufgaben2 Programmieraufgaben4 Unbewertete Labore
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Dozent

Mehr von Datenanalyse entdecken
Status: Kostenloser TestzeitraumDuke University
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Status: Kostenloser TestzeitraumJohns Hopkins University
Warum entscheiden sich Menschen für Coursera für ihre Karriere?




Bewertungen von Lernenden
11 Bewertungen
- 5 stars
100 %
- 4 stars
0 %
- 3 stars
0 %
- 2 stars
0 %
- 1 star
0 %
Zeigt 3 von 11 an
Geprüft am 27. Juni 2025
Very broad and thorough course on data collection techniques, preprocessing, analysis, and visualization. Highly recommend.
Geprüft am 22. Okt. 2025
Sean Barnes is a great teacher and his courses are terrific. How I wish his courses were available when I first decided to learn data science!
Geprüft am 20. Juni 2025
very precise. touches all relevant concepts with perfect examples. Good datasets and great evaluation.

Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Wenn Sie sich für den Kurs anmelden, erhalten Sie Zugang zu allen Kursen des Zertifikats, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird zu Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen.
Weitere Fragen
Finanzielle Unterstützung verfügbar,