Dieser Kurs befasst sich sowohl mit den theoretischen Aspekten als auch mit den praktischen Anwendungen des Data Mining im Bereich der Ingenieurwissenschaften. Er bietet einen umfassenden Überblick über die wesentlichen Grundlagen und zentralen Konzepte, die dem Data Mining zugrunde liegen. Darüber hinaus werden zentrale Data-Mining-Methoden vorgestellt und eine Anleitung zur Ausführung dieser Techniken durch verschiedene Algorithmen geboten. Die Studenten werden in eine Reihe von Data-Mining-Techniken eingeführt, wie z.B. Datenvorverarbeitung, Extraktion von Assoziationsregeln, Klassifizierung, Vorhersage, Clustering und die Erforschung komplexer Daten, und werden ein Abschlussprojekt durchführen, das diese Techniken untersucht. Darüber hinaus werden wir anhand von Fallstudien die Anwendung von Data Mining in verschiedenen Sektoren untersuchen, einschließlich, aber nicht beschränkt auf die Bereiche Fertigung, Gesundheitswesen, Medizin, Wirtschaft und verschiedene Dienstleistungsbranchen.
In diesem Modul werden die Teilnehmer wesentliche Datenkonzepte in verschiedenen Bereichen erforschen und verschiedene Datentypen, Attribute und Merkmale verstehen. Sie lernen die grundlegenden Prinzipien, Methoden und den Umfang des Data Mining kennen.
Das ist alles enthalten
4 Videos9 Lektüren1 Aufgabe
Infos zu Modulinhalt anzeigen
4 Videos•Insgesamt 22 Minuten
Überblick über den Kurs•1 Minute
Einführung in das Data Mining - Daten•6 Minuten
Einführung in Data Mining-Bergbau•6 Minuten
Data Mining-Techniken•9 Minuten
9 Lektüren•Insgesamt 41 Minuten
Einführung in den Kurs•2 Minuten
Treffen Sie Ihre Fakultät: Chinthaka Pathum "Dinesh" Herath Gedara•10 Minuten
Maschinelles Lernen und Data Analytics Teil 1 Lehrplan•10 Minuten
Akademische Integrität•3 Minuten
Einführung in das Data Mining - Daten•2 Minuten
Einführung in Data Mining-Bergbau•5 Minuten
Data Mining Lebenszyklus•5 Minuten
Data Mining-Techniken•1 Minute
Arten von maschinellem Lernen•3 Minuten
1 Aufgabe•Insgesamt 20 Minuten
Modul 1: Bewerten Sie Ihr Lernen: Einführung in das Data Mining im Ingenieurwesen•20 Minuten
Explorative Datenanalyse und Visualisierung
Modul 2•2 Stunden abzuschließen
Moduldetails
Dieses Modul zielt darauf ab, ein umfassendes Verständnis von Datenkonzepten zu vermitteln, die verschiedene Bereiche abdecken. Die Teilnehmer werden lernen, zwischen verschiedenen Datentypen, Attributen und Merkmalen zu unterscheiden. Sie werden die grundlegenden Prinzipien und Methoden des Data Mining erforschen
Das ist alles enthalten
3 Videos13 Lektüren1 Aufgabe
Infos zu Modulinhalt anzeigen
3 Videos•Insgesamt 13 Minuten
Explorative Datenanalyse (EDA)•4 Minuten
Bereinigung und Vorverarbeitung von Daten•6 Minuten
Datenumwandlung•3 Minuten
13 Lektüren•Insgesamt 92 Minuten
Explorative Datenanalyse (EDA)•30 Minuten
Bereinigung und Vorverarbeitung von Daten•1 Minute
Datenbereinigung und Vorverarbeitungsmethoden•5 Minuten
Techniken der Datenvisualisierung: Diagramme und Diagramme•3 Minuten
Balkendiagramme und Kreisdiagramme•5 Minuten
Liniendiagramme und Streudiagramme•5 Minuten
Pearson-Korrelation, Paardiagramme und Radardiagramme•8 Minuten
Paralleles Koordinatendiagramm und Sankey-Diagramm•5 Minuten
Histogramme, Box-Plots und Geigenbilder•8 Minuten
Flächendiagramme und Blasendiagramme•5 Minuten
Heatmap-, Baum- und Choropleth-Karten•8 Minuten
Wortwolken und Netzwerkgraphen•8 Minuten
Datenumwandlung•1 Minute
1 Aufgabe•Insgesamt 30 Minuten
Modul 2: Bewerten Sie Ihr Lernen: Explorative Datenanalyse und Visualisierung•30 Minuten
Dimensionalitätsreduktion
Modul 3•2 Stunden abzuschließen
Moduldetails
In diesem Modul werden wir uns mit der Dimensionalitätsreduktion befassen, einer Technik zur Vereinfachung komplexer Datensätze, die eine effiziente Analyse und Visualisierung ermöglicht. Durch die Implementierung von Methoden zur Dimensionalitätsreduktion wie der Hauptkomponentenanalyse (PCA) und der t-Distributed Stochastic Neighbor Embedding (t-SNE) erhalten wir einen Einblick in die effektive Reduzierung der Anzahl von Merkmalen unter Beibehaltung wesentlicher Informationen. Wir lernen auch, die am besten geeigneten Techniken zur Dimensionalitätsreduktion auf der Basis von Datentypen und analytischen Zielen auszuwählen und anzuwenden.
Modul 3: Bewerten Sie Ihr Lernen: Dimensionalitätsreduktion•10 Minuten
Leistungsbewertungsmatrizen
Modul 4•3 Stunden abzuschließen
Moduldetails
In diesem Modul lernen wir das Konzept des Bias-Varianz-Abgleichs beim Maschinellen Lernen kennen. Das Streben nach Modellen, die sich gut verallgemeinern lassen, erfordert ein empfindliches Gleichgewicht zwischen Bias und Varianz, um Underfitting und Überanpassung zu vermeiden. Bias verhindert, dass der Fehler ein komplexes Problem zu stark vereinfacht, während die Abweichung die Empfindlichkeit des Modells gegenüber verschiedenen Untergruppen von Trainingsdaten quantifiziert. Wir werden Strategien zur Bekämpfung von Bias und Varianz bei der Entwicklung von Modellen untersuchen, die das richtige Gleichgewicht zwischen Genauigkeit und Verallgemeinerung herstellen. Beim Übergang zu den Regressionsmetriken werden wir uns mit praktischen Tools zur Messung und Bewertung der Modellleistung bei Regressionsaufgaben befassen und uns dabei auf Metriken wie den Root Mean Squared Error (RMSE) konzentrieren. Schließlich werden wir uns mit der Bewertung der Modellleistung bei Aufgaben der Binären Klassifizierung befassen und dabei fortgeschrittene Maße wie den F1-Score, den Matthews-Korrelationskoeffizienten (Speichercontroller), Propensity Scores und die AUC-ROC-Kurve untersuchen.
Das ist alles enthalten
5 Videos9 Lektüren1 Aufgabe
Infos zu Modulinhalt anzeigen
5 Videos•Insgesamt 44 Minuten
Leistungsbeurteilung Metrik•4 Minuten
Bias Abweichung Trade-Off•9 Minuten
Regressionsmetriken•14 Minuten
Metriken zur Klassifizierung - Genauigkeit, Präzision, Recall•8 Minuten
Metriken zur Klassifizierung - F1-Score, ROC-AUC•9 Minuten
9 Lektüren•Insgesamt 111 Minuten
Leistungsbeurteilung Metrik•1 Minute
Bias Abweichung Trade-Off•75 Minuten
Regressionsmetriken•2 Minuten
Regression Beispiel•5 Minuten
Metriken zur Klassifizierung•2 Minuten
Klassifizierung Überprüfung•3 Minuten
AUC•8 Minuten
Hub- und Gewinntabelle•5 Minuten
Praktische Anwendung von Lift and Gains Chart•10 Minuten
1 Aufgabe•Insgesamt 10 Minuten
Modul 4: Bewerten Sie Ihr Lernen: Metriken zur Leistungsbewertung•10 Minuten
Grundlegende Algorithmen zur Klassifizierung - Teil 1
Modul 5•2 Stunden abzuschließen
Moduldetails
In diesem Modul werden wir die wichtigsten Lernziele weiter erforschen, um Ihr Verständnis und Ihre Anwendung grundlegender Techniken des Maschinellen Lernens zu stärken. Durch die Beherrschung grundlegender Algorithmen zur Klassifizierung, wie KNN, LDA und Logistische Regression, erhalten Sie die Werkzeuge, um praktische Data Mining-Aufgaben effektiv zu lösen. Durch die Analyse realer Datensätze lernen Sie, diese Algorithmen mit Präzision und Einsicht zu implementieren, so dass Sie wertvolle Erkenntnisse gewinnen und fundierte Entscheidungen in verschiedenen Bereichen treffen können. Nehmen Sie diese Woche teil, um das Potenzial von Algorithmen zur Klassifizierung zu erschließen und Ihre Fähigkeiten im Maschinellen Lernen zu verbessern.
Das ist alles enthalten
6 Videos9 Lektüren1 Aufgabe
Infos zu Modulinhalt anzeigen
6 Videos•Insgesamt 42 Minuten
Klassifizierung•6 Minuten
K-Nearest Neighbors (KNN) Modell Entfernungen•10 Minuten
Durchführung von KNN, Auswahl des besten K, Propensity Score und Regressionsvorhersage•9 Minuten
Logistische Regression, Intuitionen, Quoten/Logits und Interpretation•9 Minuten
Parameter-Schätzung•3 Minuten
Multiklassen-Klassifizierung•4 Minuten
9 Lektüren•Insgesamt 72 Minuten
Klassifizierung•35 Minuten
K-Nearest Neighbors (KNN) Modell Entfernungen•10 Minuten
Durchführung von KNN, Auswahl des besten K, Propensity Score und Regressionsvorhersage•1 Minute
KNN-Beispiel•10 Minuten
KNN-Vorteile und -Einschränkungen•3 Minuten
Logistische Regression, Intuitionen, Quoten/Logits und Interpretation•1 Minute
Parameter-Schätzung•1 Minute
Beispiel für logistische Regression•10 Minuten
Multiklassen-Klassifizierung•1 Minute
1 Aufgabe•Insgesamt 10 Minuten
Modul 5: Bewerten Sie Ihr Lernen: Grundlegende Algorithmen zur Klassifizierung - Teil 1•10 Minuten
Grundlegende Algorithmen zur Klassifizierung - Teil 2
Modul 6•4 Stunden abzuschließen
Moduldetails
Begeben Sie sich in diesem Modul auf eine fesselnde Reise durch die Welt der Klassifizierungsalgorithmen. Wir tauchen ein in die Feinheiten grundlegender Techniken wie Entscheidungsbäume, Bayes-Klassifikator, Ensemble Learning und mehr, während Sie lernen, die Analyse realer Datensätze mit Zuversicht zu bewältigen. Nachdem wir die Leistungsfähigkeit des Bayes-Klassifikators kennengelernt haben, gehen wir nahtlos zur Bewältigung von Regressionsaufgaben mit Entscheidungsbäumen über. Schließlich tauchen wir in die Welt des Ensemble Learning ein. Im Laufe des Moduls werden Sie mit dem Wissen und den Fähigkeiten ausgestattet, diese Algorithmen effektiv zu implementieren, um Ihre Data Mining-Bemühungen zu neuen Höhen zu treiben.
Das ist alles enthalten
4 Videos12 Lektüren1 Aufgabe
Infos zu Modulinhalt anzeigen
4 Videos•Insgesamt 44 Minuten
Bayes-Klassifikator•14 Minuten
Entscheidungsbäume•11 Minuten
Entscheidungsbäume: Regression-Analyse•9 Minuten
Ensemble Learning•9 Minuten
12 Lektüren•Insgesamt 170 Minuten
Bayes-Klassifikator•1 Minute
Naive Bayes•10 Minuten
Bayessche Entscheidungstheorie•5 Minuten
Anwendung des Bayes-Klassifikators auf einen Datensatz•8 Minuten
Anwendung des Naive Bayes-Klassifikators auf einen Datensatz•10 Minuten
Entscheidungsbäume•10 Minuten
Entscheidungsbäume: Regression Aufgabe•10 Minuten
Entscheidungsbäume Beispiele•8 Minuten
Vorteile und Grenzen des Entscheidungsbaums•3 Minuten
Modul 6: Bewerten Sie Ihr Lernen: Grundlegende Algorithmen zur Klassifizierung - Teil 2•10 Minuten
Wichtige Regressionstechniken - Teil 1
Modul 7•1 Stunde abzuschließen
Moduldetails
In diesem Modul werden grundlegende Regressionstechniken behandelt, die Sie in die Lage versetzen, reale Daten zu analysieren und zu modellieren. In praktischen Lektionen lernen Sie die Grundlagen der linearen, multiplen und logistischen Regression kennen und erlernen die Anwendung dieser Methoden auf verschiedene Datensätze zur Vorhersagemodellierung. Die Lektionen behandeln Themen, die vom Verständnis der linearen Regression und der Berechnung von Koeffizienten bis hin zur Erforschung der polynomialen Regression und Feature Selection reichen. Am Ende dieses Moduls verfügen die Studierenden über ein umfassendes Verständnis von Regressionstechniken, das sie in die Lage versetzt, fundierte Entscheidungen zu treffen und wertvolle Erkenntnisse aus Daten zu gewinnen.
Das ist alles enthalten
3 Videos6 Lektüren1 Aufgabe
Infos zu Modulinhalt anzeigen
3 Videos•Insgesamt 22 Minuten
Lineare Regression•11 Minuten
Lineare Regression: Berechnung der Koeffizienten und Minimierung der Kostenfunktion•6 Minuten
Polynomielle Regression•5 Minuten
6 Lektüren•Insgesamt 26 Minuten
Lineare Regression•1 Minute
Lineare Regression: Berechnung der Koeffizienten und Minimierung der Kostenfunktion•1 Minute
Anwendung der Linearen Regression auf einen Datensatz•10 Minuten
Vorteile und Nachteile linearer Regressionsmodelle•3 Minuten
Polynomielle Regression•1 Minute
Herzlichen Glückwunsch!•10 Minuten
1 Aufgabe•Insgesamt 10 Minuten
Modul 7: Bewerten Sie Ihr Wissen: Lineare, multiple und logistische Regressionstechniken•10 Minuten
Northeastern wurde 1898 gegründet und ist eine globale Forschungsuniversität mit einem unverwechselbaren, erfahrungsorientierten Ansatz für Bildung und Entdeckung. Die Universität ist führend im Bereich des erfahrungsbasierten Lernens und verfügt über das weltweit umfassendste Programm für kooperative Ausbildung. Der Geist der Zusammenarbeit leitet ein vom Nutzen inspiriertes Forschungsunternehmen, das sich auf die Lösung globaler Herausforderungen in den Bereichen Gesundheit, Sicherheit und Nachhaltigkeit konzentriert.
Wann werde ich Zugang zu den Vorlesungen und Aufgaben haben?
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Was erhalte ich, wenn ich das Zertifikat kaufe?
Wenn Sie ein Zertifikat erwerben, erhalten Sie Zugang zu allen Kursmaterialien, einschließlich der benoteten Aufgaben. Nach Abschluss des Kurses wird Ihr elektronisches Zertifikat zu Ihrer Erfolgsseite hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen.
Ist finanzielle Hilfe verfügbar?
Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.