Kursbeschreibung: Dieser Kurs bietet ein umfassendes Training in Regressionsanalyse und Prognosetechniken für die Datenwissenschaft mit Schwerpunkt auf Python-Programmierung. Sie werden Zeitreihenanalysen, Prognosen, lineare Regression und Datenvorverarbeitung beherrschen, so dass Sie in der Lage sind, in allen Branchen datengesteuerte Entscheidungen zu treffen. Lernziele: - Entwickeln Sie Fachkenntnisse in den Bereichen Zeitreihenanalyse, Prognosen und lineare Regression. - Erwerben Sie Kenntnisse in der Python-Programmierung für die Datenanalyse und -modellierung. - Analysieren Sie die Techniken für die explorative Datenanalyse, die Trenderkennung und die Behandlung von Saisonalität.
- Verschiedene Zeitreihenmodelle herausfinden und mit Python implementieren - Daten für eine genaue lineare Regressionsmodellierung vorbereiten und vorverarbeiten - Lineare Regressionsmodelle vorhersagen und interpretieren, um fundierte Entscheidungen treffen zu können. Dieser Kurs besteht aus vier Modulen: Modul 1: Zeitreihenanalyse und -prognose Modulbeschreibung: Das Modul Zeitreihenanalyse und -prognose bietet eine umfassende Erkundung von Techniken zur Gewinnung von Erkenntnissen und zur Vorhersage von Trends aus sequentiellen Daten. Sie werden grundlegende Konzepte wie Trendidentifizierung, Saisonalität und Modellauswahl beherrschen. Mit praktischer Erfahrung in führender Software werden sie lernen, Prognosemodelle zu erstellen, zu validieren und zu interpretieren. Durch die Vertiefung in reale Fallstudien und ethische Überlegungen werden die Teilnehmer in die Lage versetzt, strategische Entscheidungen in verschiedenen Branchen zu treffen, indem sie die Leistungsfähigkeit der Zeitreihenanalyse nutzen. Dieses Modul ist eine wertvolle Bereicherung für Fachleute, die das Potenzial zeitlicher Daten nutzen wollen. Sie werden Fachkenntnisse in der Zeitreihenanalyse und -prognose entwickeln. Entdecken Sie Techniken für die explorative Datenanalyse, die Zerlegung von Zeitreihen, die Trendanalyse und den Umgang mit Saisonalität. Erwerben Sie die Fähigkeit, zwischen verschiedenen Arten von Mustern zu unterscheiden und deren Auswirkungen auf die Vorhersage zu verstehen. Modul 2: Zeitreihenmodelle Modulbeschreibung: Zeitreihenmodelle sind leistungsstarke Werkzeuge zur Aufdeckung von Mustern und zur Vorhersage zukünftiger Trends in sequentiellen Daten. Durch die Analyse historischer Muster, Trends und saisonaler Schwankungen bieten diese Modelle Einblicke in das Datenverhalten im Zeitverlauf. Durch den Einsatz von Methoden wie ARIMA, exponentielle Glättung und Zustandsraummodelle ermöglichen sie genaue Vorhersagen und versetzen Entscheidungsträger in verschiedenen Bereichen in die Lage, fundierte Entscheidungen auf der Grundlage datengesteuerter Vorhersagen zu treffen. Sie werden in die Lage versetzt, Prognosemodelle für zukünftige Vorhersagen auf der Grundlage historischer Daten zu erstellen. Sie lernen verschiedene Prognosemethoden kennen, wie z.B. ARIMA-Modelle und saisonale Prognosetechniken, und implementieren diese mit Hilfe der Python-Programmierung. Entwickeln Sie die Fähigkeit, maßgeschneiderte Prognosestrategien für Zeitreihen auf der Grundlage von Datenmerkmalen zu formulieren. Modul 3: Lineare Regression - Datenvorverarbeitung Modulbeschreibung: Das Modul Lineare Regression - Datenvorverarbeitung ist ein grundlegender Kurs, der den Teilnehmern wesentliche Fähigkeiten zur Vorbereitung und Optimierung von Daten vor der Anwendung linearer Regressionstechniken vermittelt. Durch praktisches Lernen verstehen die Teilnehmer die Bedeutung der Datenqualität, den Umgang mit fehlenden Werten, die Erkennung von Ausreißern und die Skalierung von Merkmalen. Sie lernen, wie man Rohdaten in ein sauberes, normalisiertes Format umwandelt, indem Sie sich mit realen Datensätzen befassen, um genaue und zuverlässige Ergebnisse für lineare Regressionsmodelle zu gewährleisten. Dieses Modul ist entscheidend für den Aufbau eines soliden Grundwissens in der Vorhersagemodellierung und Datenanalyse. Sie erhalten Einblicke in verschiedene Regressionstechniken wie lineare Regression, polynomiale Regression und logistische Regression sowie deren Implementierung mit Hilfe der Python-Programmierung. Identifizieren Sie fehlende Daten und Ausreißer in Datensätzen und implementieren Sie geeignete Strategien, um diese effektiv zu behandeln. Erkennen Sie die Bedeutung der Skalierung und Auswahl von Merkmalen und lernen Sie, wie Sie Techniken wie Standardisierung und Normalisierung anwenden, um die Konvergenz und Interpretierbarkeit der Modelle zu verbessern. Modul 4: Lineare Regression - Modellerstellung Modulbeschreibung: Das Modul Lineare Regression - Modellerstellung bietet ein umfassendes Verständnis der Erstellung von Vorhersagemodellen durch lineare Regressionstechniken. Sie werden lernen, relevante Merkmale auszuwählen und zu entwickeln, Regressionsalgorithmen anzuwenden und Modellkoeffizienten zu interpretieren. Anhand von Fallstudien aus der Praxis erhalten Sie Einblicke in die Bewertung der Modellleistung und lernen, wie Sie die Parameter für optimale Ergebnisse fein abstimmen können. Dieses Modul versetzt Sie in die Lage, robuste lineare Regressionsmodelle für die datengesteuerte Entscheidungsfindung in verschiedenen Bereichen zu erstellen. Sie werden verstehen, wie Sie relevante Merkmale aus Datensätzen identifizieren und auswählen können, um sie in lineare Regressionsmodelle einzubeziehen. Sie erwerben die Fähigkeit, Modellkoeffizienten zu interpretieren, ihre Signifikanz zu erkennen und die Implikationen dieser Koeffizienten an nicht-technische Interessengruppen zu vermitteln. Entdecken Sie, wie man Modellparameter und Regularisierungstechniken fein abstimmt und eine Kreuzvalidierung durchführt, um die Modellgeneralisierung zu verbessern. Zielgruppe: Dieser Kurs richtet sich an angehende Datenwissenschaftler, Analysten und Fachleute, die ihre Fähigkeiten in den Bereichen Regressionsanalyse, Prognosen und Python-Programmierung verbessern möchten. Er eignet sich für alle, die die Möglichkeiten zeitlicher Daten und prädiktiver Modelle in ihrer Karriere nutzen möchten. Voraussetzungen: - Grundkenntnisse der Python-Programmierung - Vertrautheit mit grundlegenden Konzepten der Datenanalyse - Verständnis statistischer Konzepte ist von Vorteil, aber nicht zwingend erforderlich. Referenzdateien: Sie haben Zugang zu den Code-Dateien im Abschnitt Ressourcen und zu den Labordateien im Abschnitt Lab Manager. Kursdauer: 5 Stunden 44 Minuten Gesamtdauer: Ungefähr 4 Wochen - Modul 1: Zeitreihen-Analyse und -Vorhersage (1 Woche) - Modul 2: Zeitreihen-Modelle (1 Woche) - Modul 3: Lineare Regression - Datenvorverarbeitung (1 Woche) - Modul 4: Lineare Regression - Erstellung von Modellen (1 Woche)












