Identifier les principales fonctionnalités de la modélisation des données dans le pipeline d'exploration des données
Appliquer les techniques qui peuvent être utilisées pour réaliser les fonctionnalités de base de la modélisation des données et expliquer comment elles fonctionnent.
Évaluer les techniques de modélisation des données, déterminer celle qui convient le mieux à une tâche particulière et identifier les améliorations potentielles.
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a 4 modules dans ce cours
Ce cours couvre les techniques de base utilisées dans l'exploration de données, y compris l'analyse des motifs fréquents, la classification, le regroupement, l'analyse des valeurs aberrantes, ainsi que l'exploration de données complexes et les frontières de la recherche dans le domaine de l'exploration de données.
Ce cours peut être suivi pour un crédit académique dans le cadre des diplômes MS in Data Science ou MS in Computer Science de CU Boulder offerts sur la plate-forme Coursera. Ces diplômes d'études supérieures entièrement accrédités offrent des cours ciblés, des sessions courtes de 8 semaines et des frais de scolarité à la carte. L'admission est basée sur la performance dans trois cours préliminaires, et non sur les antécédents scolaires. Les diplômes CU sur Coursera sont idéaux pour les jeunes diplômés ou les professionnels en activité. Pour en savoir plus :
MS en science des données : https://hua.dididi.sbs/degrees/master-of-science-data-science-boulder MS en informatique : https://coursera.org/degrees/ms-computer-science-boulder Image du logo du Coursera avec l'aimable autorisation de Lachlan Cormie, disponible ici sur Unsplash : https://unsplash.com/photos/jbJp18srifE
Cette semaine commence par une présentation de ce cours, Méthodes d'exploration de données, puis se concentre sur l'analyse des motifs fréquents, y compris l'algorithme Apriori et l'algorithme FP-growth pour l'exploration des items fréquents, ainsi que sur les règles d'association et l'analyse des corrélations.
Inclus
15 vidéos6 lectures1 devoir1 devoir de programmation1 sujet de discussion
Afficher les informations sur le contenu du module
15 vidéos•Total 152 minutes
Rencontrez votre instructeur !•5 minutes
Se préparer à cette Specializations•9 minutes
Exploration de données : Vue technique•12 minutes
Analyse des motifs fréquents, algorithme Apriori•12 minutes
Exemple d'algorithme Apriori, détails•9 minutes
Exemple : Analyse Apriori des motifs fréquents•9 minutes
Défis et améliorations de l'algorithme Apriori•14 minutes
Algorithme de croissance FP, exemple•17 minutes
Règle d'association, exemple•8 minutes
Corrélation, exemple•13 minutes
Autres mesures de corrélation•10 minutes
Exemple : FP-growth Frequent Pattern Analysis (analyse des motifs fréquents)•9 minutes
Exemple : Contraintes monotones et anti-monotones•10 minutes
Exemple : Corrélation de l'ascenseur•7 minutes
Exemple : Corrélation X^2•7 minutes
6 lectures•Total 46 minutes
Mises à jour des cours et soutien à l'accessibilité•1 minute
Obtenez des crédits académiques pour votre travail !•10 minutes
Soutien aux cours•10 minutes
À propos de ce cours•10 minutes
Attentes en matière d'évaluation•5 minutes
Citation et remerciements de l'IA•10 minutes
1 devoir•Total 5 minutes
Quiz sur la politique de l'IA•5 minutes
1 devoir de programmation•Total 240 minutes
Analyse des motifs fréquents•240 minutes
1 sujet de discussion•Total 10 minutes
Présentez-vous !•10 minutes
Classification
Module 2•6 heures à terminer
Détails du module
Cette semaine présente l'apprentissage supervisé, la classification, la prédiction et couvre plusieurs méthodes de classification de base, notamment l'induction par arbre de décision, la classification bayésienne, les machines à vecteurs de support, les réseaux neuronaux et les méthodes d'ensemble. Elle aborde également l'évaluation et la comparaison des modèles de classification.
Inclus
9 vidéos1 devoir de programmation
Afficher les informations sur le contenu du module
9 vidéos•Total 126 minutes
Introduction à la classification•15 minutes
Induction par arbre de décision, exemple•20 minutes
Classification bayésienne, exemple•17 minutes
Exemple : Classification par induction de l'arbre de décision•10 minutes
Exemple : Classification bayésienne•9 minutes
Machines à vecteurs de support•9 minutes
Réseau neuronal•12 minutes
Ensemble, évaluation des modèles•20 minutes
Sélection du modèle•14 minutes
1 devoir de programmation•Total 240 minutes
Classification•240 minutes
Clustering
Module 3•6 heures à terminer
Détails du module
Cette semaine vous présente l'apprentissage non supervisé, le clustering, et couvre plusieurs méthodes de clustering de base, notamment le partitionnement, le clustering hiérarchique, le clustering basé sur une grille, le clustering basé sur la densité et le clustering probabiliste. Des sujets avancés pour le clustering en haute dimension, le bi-clustering, le clustering de graphe et le clustering basé sur les contraintes sont également abordés.
Inclus
8 vidéos1 lecture1 devoir de programmation
Afficher les informations sur le contenu du module
Regroupement EM : Explications complémentaires•10 minutes
1 devoir de programmation•Total 240 minutes
Clustering•240 minutes
Analyse des valeurs aberrantes
Module 4•5 heures à terminer
Détails du module
Cette semaine aborde trois types de valeurs aberrantes (globales, contextuelles et collectives) et la manière dont différentes méthodes peuvent être utilisées pour identifier et analyser ces valeurs aberrantes. Elle aborde également certaines méthodes avancées d'exploration de données complexes, ainsi que les frontières de la recherche dans le domaine de l'exploration de données.
Inclus
8 vidéos1 évaluation par les pairs
Afficher les informations sur le contenu du module
8 vidéos•Total 110 minutes
Types de valeurs aberrantes•13 minutes
Méthodes de détection des anomalies 1•16 minutes
Méthodes de détection des anomalies 2•16 minutes
Exemples de détection d'anomalies•13 minutes
Séquences et séries chronologiques•14 minutes
Graphique et données de réseaux sociaux en ligne•10 minutes
Données Web, Conférence KDD•14 minutes
Frontières de la recherche en exploration de données•14 minutes
1 évaluation par les pairs•Total 180 minutes
Examen par les pairs : Analyse des valeurs aberrantes, Research Frontiers•180 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Préparer un diplôme
Ce site cours fait partie du (des) programme(s) diplômant(s) suivant(s) proposé(s) par University of Colorado Boulder. Si vous êtes admis et que vous vous inscrivez, les cours que vous avez suivis peuvent compter pour l'apprentissage de votre diplôme et vos progrès peuvent être transférés avec vous.¹
Consulter les diplômes éligibles
Préparer un diplôme
Ce site cours fait partie du (des) programme(s) diplômant(s) suivant(s) proposé(s) par University of Colorado Boulder. Si vous êtes admis et que vous vous inscrivez, les cours que vous avez suivis peuvent compter pour l'apprentissage de votre diplôme et vos progrès peuvent être transférés avec vous.¹
¹La réussite de la candidature et de l'inscription est requise. Les conditions d'admissibilité s'appliquent. Chaque établissement détermine le nombre de crédits reconnus en complétant ce contenu qui peut compter pour les exigences du diplôme, en tenant compte de tout crédit existant que vous pourriez avoir. Cliquez sur un cours spécifique pour plus d'informations.
OK
Instructeur
Évaluations de l’enseignant
Évaluations de l’enseignant
Nous avons demandé à tous les étudiants de fournir des commentaires sur nos enseignants au sujet de la qualité de leur pédagogie.
CU Boulder est une communauté dynamique de chercheurs et d'apprenants sur l'un des campus universitaires les plus spectaculaires du pays. En tant que l'un des 34 établissements publics américains membres de la prestigieuse Association des universités américaines (AAU), nous sommes fiers de notre tradition d'excellence universitaire, avec cinq lauréats du prix Nobel et plus de 50 membres d'académies académiques prestigieuses.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Avis des étudiants
4.3
72 avis
5 stars
66,66 %
4 stars
19,44 %
3 stars
1,38 %
2 stars
6,94 %
1 star
5,55 %
Affichage de 3 sur 72
Y
YW
5·
Révisé le 23 avr. 2026
Assignments are well designed guiding students to learn not only the concepts of data mining methods but also the necessary Python coding techniques.
Un cours cross-listed est proposé dans le cadre de deux ou plusieurs programmes diplômants de CU Boulder sur Coursera. Par exemple, Dynamic Programming, Greedy Algorithms est proposé en tant que CSCA 5414 pour le MS-CS et DTSA 5503 pour le MS-DS.
- Vous ne pouvez pas obtenir de crédits pour plus d'une version d'un cours figurant sur une liste croisée.
- Vous pouvez identifier les cours à liste croisée en consultant le manuel de l'étudiant de votre programme.
- Votre relevé de notes en sera affecté. Les cours figurant sur des listes croisées sont considérés comme équivalents lors de l'évaluation des conditions d'obtention du diplôme. Toutefois, nous vous encourageons à suivre les versions de votre programme de ces cours (lorsqu'ils sont disponibles) afin de vous assurer que votre relevé de notes reflète le nombre important de cours que vous suivez directement dans votre département d'origine. Tous les cours que vous suivez dans le cadre d'un autre programme apparaîtront sur votre relevé de notes avec le préfixe de ce programme (par exemple, DTSA ou CSCA).
- Les programmes peuvent avoir des exigences différentes en matière de notes minimales pour l'admission et l'obtention du diplôme. Par exemple, le MS-DS exige un C ou mieux dans tous les cours pour l'obtention du diplôme (et une MPC de 3,0 pour l'admission), tandis que le MS-CS exige un B ou mieux dans tous les cours d'approfondissement et un C ou mieux dans tous les cours à option pour l'obtention du diplôme (et un B ou mieux dans chaque cours de la voie d'accès pour l'admission). Tous les programmes exigent que les étudiants maintiennent une moyenne pondérée cumulative de 3,0 pour l'admission et l'obtention du diplôme.
Puis-je suivre des cours communs pour satisfaire aux exigences de mon diplôme ?
Oui. Les cours figurant sur des listes croisées sont considérés comme équivalents lors de l'évaluation des conditions d'obtention du diplôme. Vous pouvez identifier les cours croisés en consultant le manuel de l'étudiant de votre programme.
Comment puis-je obtenir un surclassement et des crédits auprès de CU Boulder ?
Vous pouvez mettre à niveau et payer des frais de scolarité pendant toute période d'inscription ouverte pour obtenir des crédits de CU Boulder de niveau supérieur pour << ce cours / ces cours dans cette spécialisation>>. Étant donné que << ce cours est / ces cours sont >> répertoriés à la fois dans les programmes MS in Computer Science et MS in Data Science, vous devrez déterminer quel programme vous souhaitez obtenir le crédit avant de vous mettre à niveau.
Crédit MS in Data Science (MS-DS) : Pour passer à la version de << ce cours / ces cours >> donnant droit à des crédits en science des données (DTSA), utilisez le formulaire d'inscription au MS-DS. Voir comment cela fonctionne.
MS in Computer Science (MS-CS) Credit : Pour passer à la version à crédits en informatique (CSCA) de << ce cours / ces cours >>, utilisez le formulaire d'inscription MS-CS. Voir comment cela fonctionne.
Si vous n'êtes pas sûr du programme qui vous convient le mieux, consultez les sites web des programmes MS-CS et MS-DS, puis contactez [email protected] ou [email protected] si vous avez encore des questions.
Quand aurai-je accès aux cours et aux devoirs ?
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Qu'est-ce que je recevrai si je souscris à cette Specializations ?
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Une aide financière est-elle disponible ?
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.