Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire
Expérience recommandée
Expérience recommandée
Niveau intermédiaire
Les étudiants doivent avoir appris les bases de Python et des paquets tels que Nunpy et Pandas. Si ce n'est pas le cas, veuillez d'abord suivre "Fundamental Tools for Data wrangling".
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire
Expérience recommandée
Expérience recommandée
Niveau intermédiaire
Les étudiants doivent avoir appris les bases de Python et des paquets tels que Nunpy et Pandas. Si ce n'est pas le cas, veuillez d'abord suivre "Fundamental Tools for Data wrangling".
Comprendre l'importance du traitement et de la manipulation des données dans le pipeline d'analyse des données.
Apprenez les techniques de traitement des valeurs manquantes et des valeurs aberrantes, de réduction des données, de mise à l'échelle et de discrétisation des données.
Comprendre le concept de cube de données et effectuer une agrégation multidimensionnelle pour une analyse exploratoire (AED).
Compétences que vous acquerrez
Catégorie : Nettoyage des données
Nettoyage des données
Catégorie : Prétraitement des données
Prétraitement des données
Catégorie : Analyse exploratoire des données
Analyse exploratoire des données
Catégorie : Traitement des données
Traitement des données
Catégorie : Transformation des données
Transformation des données
Catégorie : Traitement des données
Traitement des données
Catégorie : Entreposage de données
Entreposage de données
Catégorie : Tableaux croisés dynamiques et graphiques
Tableaux croisés dynamiques et graphiques
Catégorie : Détection des anomalies
Détection des anomalies
Catégorie : Échantillonnage (statistiques)
Échantillonnage (statistiques)
Catégorie : Manipulation de données
Manipulation de données
Catégorie : Qualité des données
Qualité des données
Catégorie : Réduction de la dimensionnalité
Réduction de la dimensionnalité
Détails à connaître
Certificat partageable
Ajouter à votre profil LinkedIn
Évaluations
6 devoirs
Enseigné en Français (doublage IA)
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a 4 modules dans ce cours
Le cours "Traitement et manipulation des données" permet aux étudiants d'acquérir une connaissance approfondie de divers concepts et outils de traitement et de manipulation des données. Les participants apprendront à traiter les valeurs manquantes, à détecter les valeurs aberrantes, à procéder à l'échantillonnage et à la réduction des dimensions, à appliquer des techniques de mise à l'échelle et de discrétisation, et à explorer les opérations sur les cubes de données et les tableaux croisés dynamiques. Ce cours permet aux étudiants d'acquérir les compétences essentielles pour préparer et transformer efficacement les données en vue de l'analyse et de la prise de décision. Objectifs d'apprentissage : 1. Comprendre l'importance du traitement et de la manipulation des données dans le pipeline d'analyse des données. 2. Apprendre les techniques pour traiter les valeurs manquantes dans les ensembles de données, y compris les stratégies d'imputation et d'exclusion. 3. Identifier et détecter les valeurs aberrantes pour évaluer leur impact sur l'analyse des données et la prise de décision. 4. Explorer les méthodes d'échantillonnage et les techniques de réduction des dimensions pour les grands ensembles de données et les données à haute dimension. 5. Appliquer des techniques de mise à l'échelle des données pour normaliser et standardiser les variables en vue de comparaisons significatives. 6. Utiliser la discrétisation pour transformer les données continues en représentations catégorielles, simplifiant ainsi l'analyse. 7. Comprendre le concept de cube de données et effectuer une agrégation multidimensionnelle pour une analyse exploratoire. 8. Créer des tableaux croisés dynamiques pour résumer et remodeler les données, afin d'obtenir des informations précieuses à partir d'ensembles de données complexes. Tout au long du cours, les étudiants participeront activement à des exercices pratiques et à des projets, ce qui leur permettra d'appliquer les techniques de traitement et de manipulation des données à des ensembles de données du monde réel. À la fin du cours, les participants seront bien équipés pour préparer, nettoyer et transformer efficacement les données pour les tâches d'analyse ultérieures et la prise de décision basée sur les données.
La semaine "Valeurs manquantes et valeurs aberrantes" se concentre sur la manière de gérer les valeurs manquantes et de détecter les valeurs aberrantes à l'aide de la bibliothèque Pandas. Vous apprendrez des techniques essentielles pour identifier et traiter efficacement les données manquantes, ainsi que des méthodes pour détecter et gérer les valeurs aberrantes dans les ensembles de données.
Inclus
3 vidéos6 lectures2 devoirs1 sujet de discussion
Afficher les informations sur le contenu du module
3 vidéos•Total 33 minutes
Valeurs manquantes•20 minutes
Détection des valeurs aberrantes à l'aide de statistiques•6 minutes
Détection des valeurs aberrantes à l'aide de l'Écart interquartile (EI)•8 minutes
6 lectures•Total 221 minutes
Mises à jour des cours et soutien à l'accessibilité•1 minute
Stratégie d'évaluation•30 minutes
Stratégie d'activité•10 minutes
Démonstration des valeurs manquantes•60 minutes
Détection des valeurs aberrantes à l'aide des statistiques Démonstration•60 minutes
Détection des valeurs aberrantes à l'aide de l'Écart interquartile (EI)•60 minutes
2 devoirs•Total 60 minutes
Quiz sur les valeurs manquantes•30 minutes
Quiz sur la détection des valeurs aberrantes•30 minutes
1 sujet de discussion•Total 120 minutes
Exercice d'exploration sur la détection des valeurs manquantes et des valeurs aberrantes•120 minutes
Réduction des données
Module 2•7 heures à terminer
Détails du module
La semaine "Réduction de Données" se concentre sur la réduction des données par échantillonnage et réduction de la dimensionnalité à l'aide de la bibliothèque Pandas. Vous apprendrez des techniques essentielles pour obtenir des sous-ensembles de données gérables tout en préservant des informations significatives pour l'analyse et la Visualisation.
Inclus
2 vidéos3 lectures1 devoir1 sujet de discussion
Afficher les informations sur le contenu du module
2 vidéos•Total 14 minutes
Élimination des dimensions•6 minutes
Échantillonnage•7 minutes
3 lectures•Total 240 minutes
Démonstration de l'élimination des dimensions•60 minutes
Démonstration d'échantillonnage•60 minutes
Étude de cas sur la réduction des données•120 minutes
1 devoir•Total 30 minutes
Quiz sur la réduction des données•30 minutes
1 sujet de discussion•Total 120 minutes
Exercice d'exploration de la réduction des données•120 minutes
Mise à l'échelle et discrétisation
Module 3•7 heures à terminer
Détails du module
La semaine "Mise à l'échelle et discrètes" se concentre sur l'importance de la mise à l'échelle et de la discrétisation des données dans le processus de Prétraitement de données. Vous apprendrez pourquoi et comment effectuer une mise à l'échelle des données pour normaliser les variables et traiter les données à différentes échelles. En outre, vous explorerez le concept de discrétisation des données et son application dans la transformation des données continues en représentations catégoriques.
Inclus
2 vidéos3 lectures1 devoir1 sujet de discussion
Afficher les informations sur le contenu du module
2 vidéos•Total 24 minutes
Mise à l'échelle des données•12 minutes
Discrétisation des données•12 minutes
3 lectures•Total 240 minutes
Démonstration de la mise à l'échelle des données•60 minutes
Démonstration de la discrètes des données•60 minutes
Étude de cas sur la mise à l'échelle et la discrétisation•120 minutes
1 devoir•Total 30 minutes
Quiz sur la mise à l'échelle et la discrétisation•30 minutes
1 sujet de discussion•Total 120 minutes
Exercice d'exploration de la mise à l'échelle et de la discrétisation•120 minutes
Entrepôt de données
Module 4•8 heures à terminer
Détails du module
La semaine "Entrepôt de données" se concentre sur les concepts et les méthodologies d'organisation des données en cours d'utilisation d'un cube de données et d'un tableau croisé dynamique dans Pandas. Vous apprendrez l'importance de l'Entreposage de données pour une gestion et une analyse efficaces des données, ainsi que la façon de construire des cubes de données et des tableaux croisés dynamiques pour faciliter l'exploration des données multidimensionnelles.
Inclus
2 vidéos3 lectures2 devoirs1 sujet de discussion
Afficher les informations sur le contenu du module
2 vidéos•Total 22 minutes
Tableau croisé•10 minutes
Cube de données•12 minutes
3 lectures•Total 240 minutes
Tableau croisé dynamique Demo•60 minutes
Démonstration d'un cube de données•60 minutes
Étude de cas sur l'Entrepôt de données•120 minutes
2 devoirs•Total 90 minutes
Quiz sur l'Entrepôt de données•30 minutes
Réflexion personnelle•60 minutes
1 sujet de discussion•Total 120 minutes
Exercice d'exploration de l'Entrepôt de données•120 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
CU Boulder est une communauté dynamique de chercheurs et d'apprenants sur l'un des campus universitaires les plus spectaculaires du pays. En tant que l'un des 34 établissements publics américains membres de la prestigieuse Association des universités américaines (AAU), nous sommes fiers de notre tradition d'excellence universitaire, avec cinq lauréats du prix Nobel et plus de 50 membres d'académies académiques prestigieuses.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Qu'est-ce que je recevrai si je souscris à cette Specializations ?
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Une aide financière est-elle disponible ?
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.