Ce cours aborde à la fois les aspects théoriques et les applications pratiques du Data mining dans le domaine de l'ingénierie. Il fournit un examen complet des fondamentaux essentiels et des concepts centraux qui sous-tendent le data mining. En outre, il présente les principales méthodologies de Data mining et offre un guide pour l'exécution de ces techniques par le biais de divers algorithmes. Les étudiants seront initiés à une gamme de techniques de Data mining, telles que le prétraitement des données, l'extraction de règles d'association, la classification, la prédiction, le clustering et l'exploration de données complexes, et mettront en œuvre un projet de capstone explorant ces mêmes techniques. En outre, nous utiliserons des études de cas pour explorer l'application de l'exploration de données dans divers secteurs, y compris, mais sans s'y limiter, la fabrication, les soins de santé, la médecine, les affaires et diverses industries de services.
Dans ce module, les participants exploreront les concepts essentiels des données dans tous les domaines, en comprenant les divers types, attributs et caractéristiques des données. Ils comprendront les principes fondamentaux, les méthodologies et le champ d'application du Data mining.
Inclus
4 vidéos9 lectures1 devoir
Afficher les informations sur le contenu du module
Apprentissage automatique et Analytique des données Partie 1 Syllabus•10 minutes
Intégrité académique•3 minutes
Introduction au Data mining - Données•2 minutes
Introduction au Data mining-Mining•5 minutes
Cycle de vie des données mining•5 minutes
Techniques de Data mining•1 minute
Types d'apprentissage automatique•3 minutes
1 devoir•Total 20 minutes
Module 1 : Évaluer son apprentissage : Introduction au Data mining en ingénierie•20 minutes
Analyse et visualisation des données exploratoires
Module 2•2 heures à terminer
Détails du module
Ce module vise à transmettre une compréhension globale des concepts de données, couvrant divers domaines. Les participants apprendront à différencier les types de données, les attributs et les caractéristiques. Ils exploreront les principes fondamentaux et les méthodologies du Data mining
Inclus
3 vidéos13 lectures1 devoir
Afficher les informations sur le contenu du module
3 vidéos•Total 13 minutes
Analyse exploratoire des données (AED)•4 minutes
Nettoyage des données et Prétraitement•6 minutes
Transformation de données•3 minutes
13 lectures•Total 92 minutes
Analyse exploratoire des données (AED)•30 minutes
Nettoyage des données et Prétraitement•1 minute
Nettoyage des données et méthodes de prétraitement•5 minutes
Techniques de Visualisation des données : Graphiques et diagrammes•3 minutes
Graphiques à barres et Graphiques circulaires•5 minutes
Graphiques linéaires et diagrammes de dispersion•5 minutes
Corrélation de Pearson, diagrammes en paires et diagrammes radar•8 minutes
Tracé des coordonnées parallèles et tracé de Sankey•5 minutes
Histogrammes, Graphique en boîte et Graphique en violon•8 minutes
Graphiques en aires et bulles•5 minutes
Cartes thermiques, arborescentes et choroplèthes•8 minutes
Nuages de mots et graphes de réseaux•8 minutes
Transformation de données•1 minute
1 devoir•Total 30 minutes
Module 2 : Évaluer votre apprentissage : Analyse exploratoire des données (AED) et Visualisation des données (AED)•30 minutes
Réduction de la dimensionnalité
Module 3•2 heures à terminer
Détails du module
Tout au long de ce module, nous nous intéresserons à la réduction de la dimensionnalité, une technique permettant de simplifier les ensembles de données complexes afin de faciliter l'analyse et la visualisation. En mettant en œuvre des méthodes de réduction de la dimensionnalité telles que l'Analyse en composantes principales (ACP) et le t-Distributed Stochastic Neighbor Embedding (t-SNE), nous comprenons comment réduire efficacement le nombre de caractéristiques tout en préservant les informations essentielles. Nous apprendrons également à sélectionner et à appliquer les techniques de réduction de dimensionnalité les plus appropriées en fonction des types de données et des objectifs analytiques.
Inclus
5 vidéos11 lectures1 devoir
Afficher les informations sur le contenu du module
5 vidéos•Total 52 minutes
Sélection de caractéristiques-Méthodes linéaires ACP•8 minutes
ACP•11 minutes
t-SNE : Qu'est-ce que c'est ?•5 minutes
t-SNE : comment ça marche•15 minutes
Analyse discriminante linéaire (LDA)•13 minutes
11 lectures•Total 69 minutes
Réduction de dimensionnalité•3 minutes
Pourquoi la réduction de dimensionnalité ?•5 minutes
Sélection et extraction des caractéristiques•3 minutes
Extraction de caractéristiques - Méthodes linéaires ACP•1 minute
Dans ce module, nous apprenons le concept du compromis biais-variance dans l'apprentissage automatique. Pour obtenir des modèles qui généralisent bien, il faut trouver un équilibre délicat entre le biais et la variance afin d'éviter le sous-ajustement et le surajustement. Le biais empêche l'erreur de trop simplifier un problème complexe, tandis que la variance quantifie la sensibilité du modèle à différents sous-ensembles de données d'entraînement. Nous explorerons les stratégies de lutte contre le biais et la variance en développant des modèles qui trouvent le juste équilibre entre précision et généralisation. En passant aux mesures de régression, nous examinerons les outils pratiques utilisés pour mesurer et évaluer les performances des modèles dans les tâches de régression, en nous concentrant sur des mesures telles que l'erreur quadratique moyenne (RMSE). Enfin, nous naviguerons dans le paysage de l'évaluation des performances des modèles dans les tâches de classification binaire, en explorant des mesures avancées telles que le score F1-score, le Coefficient de corrélation de Matthews (MCC), les scores de propension et la courbe AUC-ROC.
Inclus
5 vidéos9 lectures1 devoir
Afficher les informations sur le contenu du module
5 vidéos•Total 44 minutes
Évaluations de la performance Mesure•4 minutes
Biais Variance Trade-Off•9 minutes
Métriques de régression•14 minutes
Mesures de classification - Précision, exactitude, rappel•8 minutes
Mesures de classification - F1-score, ROC-AUC•9 minutes
9 lectures•Total 111 minutes
Évaluations de la performance Mesure•1 minute
Biais Variance Trade-Off•75 minutes
Métriques de régression•2 minutes
Exemple de régression•5 minutes
Métriques de classification•2 minutes
Examen de la classification•3 minutes
CUA•8 minutes
Tableau des levées et des gains•5 minutes
Application pratique du tableau des levées et des gains•10 minutes
Algorithmes de classification fondamentaux - Partie 1
Module 5•2 heures à terminer
Détails du module
Dans ce module, nous continuerons à explorer les objectifs d'apprentissage clés pour renforcer votre compréhension et l'application de techniques essentielles dans l'apprentissage automatique. En maîtrisant les algorithmes de classification fondamentaux tels que KNN, LDA et la régression logistique, vous obtiendrez les outils nécessaires pour aborder efficacement les tâches pratiques d'exploration de données. Grâce à l'analyse d'ensembles de données du monde réel, vous apprendrez à mettre en œuvre ces algorithmes avec précision et perspicacité, ce qui vous permettra d'extraire des informations précieuses et de prendre des décisions éclairées dans divers domaines. Rejoignez-nous cette semaine pour libérer le potentiel des algorithmes de classification et élever vos compétences en apprentissage automatique.
Inclus
6 vidéos9 lectures1 devoir
Afficher les informations sur le contenu du module
6 vidéos•Total 42 minutes
Classification•6 minutes
Distances du modèle des k plus proches voisins (KNN)•10 minutes
Exécution du KNN, sélection du meilleur K, score de propension et prédiction par régression•9 minutes
Régression logistique, Intuitions, Odds/Logits et Interprétation•9 minutes
Estimation des paramètres•3 minutes
Classification multi-classe•4 minutes
9 lectures•Total 72 minutes
Classification•35 minutes
Distances du modèle des k plus proches voisins (KNN)•10 minutes
Exécution du KNN, sélection du meilleur K, score de propension et prédiction par régression•1 minute
Exemple KNN•10 minutes
KNN - Avantages et limites•3 minutes
Régression logistique, Intuitions, Odds/Logits et Interprétation•1 minute
Estimation des paramètres•1 minute
Exemple de régression logistique•10 minutes
Classification multi-classe•1 minute
1 devoir•Total 10 minutes
Module 5 : Évaluer votre apprentissage : Algorithmes de classification fondamentaux - Partie 1•10 minutes
Algorithmes de classification fondamentaux - Partie 2
Module 6•4 heures à terminer
Détails du module
Embarquez pour un voyage captivant dans le monde des algorithmes de classification dans ce module. Nous allons nous plonger dans les subtilités des techniques fondamentales telles que les arbres décisionnels, le classificateur de Bayes, l'apprentissage ensembliste, et plus encore, pour vous permettre de naviguer en toute confiance dans l'analyse d'ensembles de données du monde réel. Après avoir découvert la puissance du classificateur de Bayes, nous passerons sans transition aux tâches de régression avec les arbres décisionnels. Enfin, nous plongerons dans le domaine de l'apprentissage ensembliste. Au cours de ce module, vous acquerrez les connaissances et les compétences nécessaires pour mettre en œuvre ces algorithmes de manière efficace, propulsant ainsi vos projets d'exploration de données vers de nouveaux sommets.
Inclus
4 vidéos12 lectures1 devoir
Afficher les informations sur le contenu du module
4 vidéos•Total 44 minutes
Classificateur de Bayes•14 minutes
Arbre décisionnel•11 minutes
Arbre décisionnel : Analyse de régression•9 minutes
Apprentissage ensembliste•9 minutes
12 lectures•Total 170 minutes
Classificateur de Bayes•1 minute
Classification naïve bayésienne•10 minutes
Théorie de la décision bayésienne•5 minutes
Comment appliquer le classificateur de Bayes à un ensemble de données ?•8 minutes
Comment appliquer la classification naïve bayésienne à un ensemble de données ?•10 minutes
Arbre décisionnel•10 minutes
Arbre décisionnel : Tâche de régression•10 minutes
Exemples d'arbres décisionnels•8 minutes
Avantages et limites de l'Arbre décisionnel•3 minutes
Apprentissage ensembliste•85 minutes
Algorithmes de stimulation AdaBoost (stimulation adaptative)•10 minutes
Algorithmes de stimulation : Machines de renforcement du gradient (GBM)•10 minutes
1 devoir•Total 10 minutes
Module 6 : Évaluer votre apprentissage : Algorithmes de classification fondamentaux - Partie 2•10 minutes
Principales techniques de régression - Partie 1
Module 7•1 heure à terminer
Détails du module
Dans ce module, nous abordons les techniques de régression essentielles, en vous dotant des compétences nécessaires pour analyser et modéliser les données du monde réel. Grâce à des leçons pratiques, les apprenants saisiront les principes fondamentaux de la régression linéaire, multiple et logistique, et apprendront à mettre en œuvre ces méthodes sur divers ensembles de données à des fins de modélisation prédictive. Les leçons couvrent des sujets allant de la compréhension de la régression linéaire et du calcul des coefficients à l'exploration de la régression polynomiale et de la sélection des caractéristiques. À la fin de ce module, les étudiants auront une compréhension complète des techniques de régression, ce qui leur permettra de prendre des décisions éclairées et de générer des informations précieuses à partir des données.
Inclus
3 vidéos6 lectures1 devoir
Afficher les informations sur le contenu du module
3 vidéos•Total 22 minutes
Régression linéaire•11 minutes
Régression linéaire : Calcul des coefficients et minimisation de la fonction de coût•6 minutes
Régression polynomiale•5 minutes
6 lectures•Total 26 minutes
Régression linéaire•1 minute
Régression linéaire : Calcul des coefficients et minimisation de la fonction de coût•1 minute
Application de la régression linéaire à un ensemble de données•10 minutes
Avantages et inconvénients des modèles de régression linéaire•3 minutes
Régression polynomiale•1 minute
Félicitations !•10 minutes
1 devoir•Total 10 minutes
Module 7 : Évaluer votre apprentissage : Techniques de Régression linéaire, multiple et logistique•10 minutes
Fondée en 1898, Northeastern est une université de recherche internationale qui se distingue par une approche de l'éducation et de la découverte axée sur l'expérience. L'université est un leader en matière d'apprentissage par l'expérience, grâce au programme d'éducation coopérative le plus étendu au monde. L'esprit de collaboration guide une entreprise de recherche inspirée par l'utilisation et axée sur la résolution des défis mondiaux en matière de santé, de sécurité et de durabilité.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Que recevrai-je si j'achète le certificat ?
Lorsque vous achetez un certificat, vous avez accès à tous les supports de cours, y compris les devoirs notés. Une fois le cours terminé, votre certificat électronique sera ajouté à votre page de réalisations. Vous pourrez alors l'imprimer ou l'ajouter à votre profil LinkedIn.
Une aide financière est-elle disponible ?
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.