Ce cours présente les concepts nécessaires et les techniques courantes d'analyse des données. L'accent est mis sur le processus d'analyse des données, y compris la préparation des données, l'analyse descriptive, l'entraînement des modèles et l'interprétation des résultats. Le processus commence par l'élimination des distractions et des anomalies, suivie de la découverte d'idées, de la formulation de propositions, de la validation de preuves et enfin de la construction de solutions de qualité professionnelle. Suivre le processus correctement, régulièrement et de manière transparente apporte de la crédibilité et augmente l'impact des résultats.

Débloquez l'accès à plus de 10 000 cours avec Coursera Plus. Essai gratuit de 7 jours.


Préparation et analyse des données
Ce cours fait partie de plusieurs programmes.


Instructeurs : Ming-Long Lam
2 178 déjà inscrits
Inclus avec
Expérience recommandée
Ce que vous apprendrez
1. Appliquer les techniques appropriées pour obtenir des informations à partir des données.
2. Présenter avec confiance des solutions exploitables aux parties prenantes de l'entreprise.
Compétences que vous acquerrez
- Catégorie : Programmation en Python
- Catégorie : Manipulation de données
- Catégorie : Analyse exploratoire des données (AED)
- Catégorie : Arbre de décision
- Catégorie : Analyse de régression
- Catégorie : Algorithmes d'apprentissage automatique
- Catégorie : Visualisation de Données
- Catégorie : Modélisation statistique
- Catégorie : Analyse des Données
- Catégorie : Ingénierie des caractéristiques
- Catégorie : Analyse statistique
- Catégorie : Nettoyage des données
- Catégorie : Scikit-learn (Bibliothèque d'Apprentissage automatique)
- Catégorie : Apprentissage automatique
- Catégorie : Data mining
- Catégorie : Science des données
- Catégorie : Analytique
- Catégorie : Arbre de classification et de régression (CART)
Détails à connaître

Ajouter à votre profil LinkedIn
32 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 9 modules dans ce cours
Bienvenue dans la section Préparation et analyse des données ! Le module 1 guide les étudiants dans l'art de créer des histogrammes informatifs et visuellement attrayants, un aspect fondamental de la visualisation des données. Les étudiants apprendront des techniques pour mesurer l'emplacement et l'échelle des données, comprendre les origines et les impacts du bruit et des valeurs manquantes dans les ensembles de données. Ce module présente également le Processus CRISP-DM, une approche structurée du Data mining, ainsi que le Modèle Analytique des données de Gartner pour une analyse des données avancée. En outre, les étudiants exploreront la distinction entre les données brutes et les informations traitées, un concept clé pour une interprétation efficace des données et la prise de décision.
Inclus
10 vidéos7 lectures4 devoirs1 sujet de discussion1 laboratoire non noté
Le module 2 plonge dans les subtilités de l'analyse statistique, en commençant par une compréhension approfondie du concept de Valeur P et de sa Significativité statistique en tant qu'indicateur d'Erreur de type I. Les étudiants apprendront à appliquer des tests statistiques en Python pour identifier les caractéristiques significativement corrélées, en explorant diverses métriques de corrélation adaptées aux caractéristiques catégorielles, de type mixte et continues. Ce module met l'accent sur l'application pratique, en dotant les étudiants des compétences nécessaires pour calculer et interpréter ces métriques en Python, améliorant ainsi leur capacité à mener des analyses de données sophistiquées et à tirer des conclusions significatives à partir d'ensembles de données complexes.
Inclus
7 vidéos5 lectures4 devoirs1 laboratoire non noté
Le module 3 offre une plongée profonde dans le monde des règles d'association, enseignant aux étudiants comment improviser ces règles pour identifier des combinaisons de caractéristiques précieuses qui génèrent des valeurs d'étiquettes spécifiques. Les apprenants maîtriseront la définition de seuils appropriés pour l'Assistance informatique et la Confiance et acquerront une compréhension complète de l'algorithme Apriori et de l'importance des ensembles d'éléments fréquents au sein de cet algorithme. Ce module couvre le calcul des métriques communes pour les règles d'association, en familiarisant les étudiants avec la terminologie pertinente. En outre, les apprenants exploreront l'application pratique des règles d'association dans l'analyse des paniers de marché, y compris les stratégies de vente croisée, de vente incitative et de regroupement de produits, les dotant ainsi de compétences précieuses pour la prise de décision fondée sur les données dans les contextes commerciaux.
Inclus
7 vidéos5 lectures3 devoirs1 laboratoire non noté
Dans le module 4, les étudiants apprendront à décrire et à interpréter les profils des clusters, en acquérant des compétences dans le déploiement des algorithmes de clustering K-Moyennes et K-Modes. Ils exploreront l'application de l'analyse de fréquence, de récence et monétaire (RFM) pour identifier les clients les plus précieux dans le secteur de la vente au détail. Le module couvre également la technique de l'Échantillonnage aléatoire simple avec la possibilité d'incorporer des variables de stratification, améliorant ainsi la précision de l'analyse des données. En outre, il souligne l'importance de la validation objective des modèles à l'aide d'une partition de test, garantissant la fiabilité et l'efficacité des modèles analytiques dans les scénarios du monde réel.
Inclus
8 vidéos5 lectures4 devoirs1 laboratoire non noté
Ce module approfondit l'analyse de l'importance des caractéristiques dans l'apprentissage automatique, couvrant les valeurs de Shapley, les méthodes de sélection des caractéristiques, l'évaluation statistique, l'interaction des caractéristiques, l'aliasing, et l'algorithme des moindres carrés. Les étudiants seront capables de maîtriser ces concepts pour construire des modèles robustes et interprétables.
Inclus
8 vidéos5 lectures4 devoirs1 laboratoire non noté
Dans le module 6, les étudiants maîtriseront l'art de la sélection des caractéristiques dans l'apprentissage automatique en explorant la méthode de sélection avant et arrière, la méthode des sous-ensembles possibles et le concept de séparation complète et quasi-complète. Les étudiants découvriront également des règles d'association pour identifier les séparations, interpréteront les paramètres du modèle et les probabilités prédites, et approfondiront les concepts d'Estimation du maximum vraisemblance, de cotes et de rapports de cotes.
Inclus
6 vidéos5 lectures4 devoirs1 laboratoire non noté
Le module 7 donnera aux étudiants la capacité d'exploiter la puissance des modèles arborescents pour découvrir des modèles cachés dans vos données. Les étudiants seront capables de décrire efficacement les clusters, de définir intelligemment les paramètres des algorithmes, de construire des règles d'entreprise à partir des résultats des arbres, et d'utiliser les métriques de variance, les valeurs d'entropie et les indices de Gini pour une construction optimale des arbres.
Inclus
7 vidéos5 lectures4 devoirs1 laboratoire non noté
Le module 8 plonge dans le domaine des métriques d'évaluation des modèles d'apprentissage automatique. Les étudiants maîtriseront les concepts de courbes de précision et de rappel, de courbes de lift et de courbes de caractéristiques d'exploitation du récepteur (ROC). En outre, ils seront en mesure de découvrir des méthodes de calcul des seuils de probabilité à l'aide des statistiques de Kolmogorov-Smirnov et des F1-score. Ils pourront explorer des mesures telles que le taux de classification erronée, l'aire sous la courbe (AUC) et l'erreur quadratique moyenne (RMSE), ainsi que des techniques de calcul de la RMSE et de détection d'observations gravement mal ajustées à l'aide de résidus spécifiques au modèle.
Inclus
8 vidéos5 lectures4 devoirs1 laboratoire non noté
Ce module contient l'évaluation sommative du cours qui a été conçue pour évaluer votre compréhension du matériel du cours et votre capacité à appliquer les connaissances que vous avez acquises tout au long du cours. Veillez à bien réviser le matériel de cours avant de passer l'évaluation.
Inclus
1 devoir
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Préparer un diplôme
Ce site cours fait partie du (des) programme(s) diplômant(s) suivant(s) proposé(s) par Illinois Tech. Si vous êtes admis et que vous vous inscrivez, les cours que vous avez suivis peuvent compter pour l'apprentissage de votre diplôme et vos progrès peuvent être transférés avec vous.¹
Instructeurs


Offert par
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?





Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien de demande sur la page de description.
Plus de questions
Aide financière disponible,

