Modelle für maschinelles Lernen sind auf gute Daten angewiesen, um aussagekräftige Erkenntnisse zu gewinnen. Aus diesem Grund ist die Datenvorbereitung eine der wichtigsten Fähigkeiten für maschinelles Lernen.
In diesem Kurs lernen Sie, wie Sie Daten importieren und bereinigen, bevor Sie fehlende Werte mithilfe der Imputation auffüllen. Sie lernen, wie Sie Histogramme, Streudiagramme und Box-Plots visualisieren, um interessante Trends zu erkennen, bevor Sie die Analyse nutzen, um die wichtigsten Merkmale auszuwählen. Feature-Engineering-Techniken wie One-Hot-Codierung, Binning und Skalierung werden uns helfen, die Struktur unserer Daten umzuwandeln, um qualitativ hochwertigere Erkenntnisse des maschinellen Lernens zu gewinnen. Dieser Kurs zur Datenvorbereitung in Python enthält mehr interaktive Übungen und Herausforderungen als frühere BIDA-Kurse. Sie werden auch die Möglichkeit haben, Ihre Fähigkeiten in einer umfassenden geführten Python Fallstudie zu testen, bevor Sie die Abschlussprüfung ablegen. Nach Abschluss dieses Kurses sind Sie in der Lage: - Ihre Daten in Python zu importieren und zu bereinigen - Imputation anzuwenden, um fehlende Werte im Datensatz zu schätzen - eine explorative Datenanalyse (EDA) durchzuführen, um erste Muster zu finden, an denen sich unsere Analyse orientieren kann - Merkmale auszuwählen, um sich auf die wichtigsten Variablen zu konzentrieren - Merkmalstechniken anzuwenden, um Datensätze maschinenlernfreundlich zu machen - geeignete Merkmalstechniken auf der Grundlage des Modelltyps auszuwählen Ob Sie eine Führungskraft in einem Unternehmen sind oder ein aufstrebender Analyst, der sich mit Datenwissenschaft befasst, dieser Kurs "Data Prep for Machine Learning in Python" wird Ihnen als umfassende Einführung in dieses faszinierende Thema dienen. Sie werden alle wichtigen Begriffe lernen, um mit Ihren Teams über Datenwissenschaft zu sprechen, Analysen zu implementieren und zu verstehen, wie Datenwissenschaft Ihrem Unternehmen helfen kann.
















