Illinois Tech
Préparation et analyse des données
Illinois Tech

Préparation et analyse des données

Ming-Long Lam
Jawahar Panchal

Instructeurs : Ming-Long Lam

2 177 déjà inscrits

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

8 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Préparer un diplôme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

8 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Préparer un diplôme

Ce que vous apprendrez

  • 1. Appliquer les techniques appropriées pour obtenir des informations à partir des données.

    2. Présenter avec confiance des solutions exploitables aux parties prenantes de l'entreprise.

Compétences que vous acquerrez

  • Catégorie : Programmation en Python
  • Catégorie : Manipulation de données
  • Catégorie : Analyse exploratoire des données (AED)
  • Catégorie : Arbre de décision
  • Catégorie : Analyse de régression
  • Catégorie : Algorithmes d'apprentissage automatique
  • Catégorie : Visualisation de Données
  • Catégorie : Modélisation statistique
  • Catégorie : Analyse des Données
  • Catégorie : Ingénierie des caractéristiques
  • Catégorie : Analyse statistique
  • Catégorie : Nettoyage des données
  • Catégorie : Scikit-learn (Bibliothèque d'Apprentissage automatique)
  • Catégorie : Apprentissage automatique
  • Catégorie : Data mining
  • Catégorie : Science des données
  • Catégorie : Analytique
  • Catégorie : Arbre de classification et de régression (CART)

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

32 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours est disponible dans le cadre de
Lorsque vous vous inscrivez à ce cours, vous devez également sélectionner un programme spécifique.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 9 modules dans ce cours

Bienvenue dans la section Préparation et analyse des données ! Le module 1 guide les étudiants dans l'art de créer des histogrammes informatifs et visuellement attrayants, un aspect fondamental de la visualisation des données. Les étudiants apprendront des techniques pour mesurer l'emplacement et l'échelle des données, comprendre les origines et les impacts du bruit et des valeurs manquantes dans les ensembles de données. Ce module présente également le Processus CRISP-DM, une approche structurée du Data mining, ainsi que le Modèle Analytique des données de Gartner pour une analyse des données avancée. En outre, les étudiants exploreront la distinction entre les données brutes et les informations traitées, un concept clé pour une interprétation efficace des données et la prise de décision.

Inclus

10 vidéos7 lectures4 devoirs1 sujet de discussion1 laboratoire non noté

Le module 2 plonge dans les subtilités de l'analyse statistique, en commençant par une compréhension approfondie du concept de Valeur P et de sa Significativité statistique en tant qu'indicateur d'Erreur de type I. Les étudiants apprendront à appliquer des tests statistiques en Python pour identifier les caractéristiques significativement corrélées, en explorant diverses métriques de corrélation adaptées aux caractéristiques catégorielles, de type mixte et continues. Ce module met l'accent sur l'application pratique, en dotant les étudiants des compétences nécessaires pour calculer et interpréter ces métriques en Python, améliorant ainsi leur capacité à mener des analyses de données sophistiquées et à tirer des conclusions significatives à partir d'ensembles de données complexes.

Inclus

7 vidéos5 lectures4 devoirs1 laboratoire non noté

Le module 3 offre une plongée profonde dans le monde des règles d'association, enseignant aux étudiants comment improviser ces règles pour identifier des combinaisons de caractéristiques précieuses qui génèrent des valeurs d'étiquettes spécifiques. Les apprenants maîtriseront la définition de seuils appropriés pour l'Assistance informatique et la Confiance et acquerront une compréhension complète de l'algorithme Apriori et de l'importance des ensembles d'éléments fréquents au sein de cet algorithme. Ce module couvre le calcul des métriques communes pour les règles d'association, en familiarisant les étudiants avec la terminologie pertinente. En outre, les apprenants exploreront l'application pratique des règles d'association dans l'analyse des paniers de marché, y compris les stratégies de vente croisée, de vente incitative et de regroupement de produits, les dotant ainsi de compétences précieuses pour la prise de décision fondée sur les données dans les contextes commerciaux.

Inclus

7 vidéos5 lectures3 devoirs1 laboratoire non noté

Dans le module 4, les étudiants apprendront à décrire et à interpréter les profils des clusters, en acquérant des compétences dans le déploiement des algorithmes de clustering K-Moyennes et K-Modes. Ils exploreront l'application de l'analyse de fréquence, de récence et monétaire (RFM) pour identifier les clients les plus précieux dans le secteur de la vente au détail. Le module couvre également la technique de l'Échantillonnage aléatoire simple avec la possibilité d'incorporer des variables de stratification, améliorant ainsi la précision de l'analyse des données. En outre, il souligne l'importance de la validation objective des modèles à l'aide d'une partition de test, garantissant la fiabilité et l'efficacité des modèles analytiques dans les scénarios du monde réel.

Inclus

8 vidéos5 lectures4 devoirs1 laboratoire non noté

Ce module approfondit l'analyse de l'importance des caractéristiques dans l'apprentissage automatique, couvrant les valeurs de Shapley, les méthodes de sélection des caractéristiques, l'évaluation statistique, l'interaction des caractéristiques, l'aliasing, et l'algorithme des moindres carrés. Les étudiants seront capables de maîtriser ces concepts pour construire des modèles robustes et interprétables.

Inclus

8 vidéos5 lectures4 devoirs1 laboratoire non noté

Dans le module 6, les étudiants maîtriseront l'art de la sélection des caractéristiques dans l'apprentissage automatique en explorant la méthode de sélection avant et arrière, la méthode des sous-ensembles possibles et le concept de séparation complète et quasi-complète. Les étudiants découvriront également des règles d'association pour identifier les séparations, interpréteront les paramètres du modèle et les probabilités prédites, et approfondiront les concepts d'Estimation du maximum vraisemblance, de cotes et de rapports de cotes.

Inclus

6 vidéos5 lectures4 devoirs1 laboratoire non noté

Le module 7 donnera aux étudiants la capacité d'exploiter la puissance des modèles arborescents pour découvrir des modèles cachés dans vos données. Les étudiants seront capables de décrire efficacement les clusters, de définir intelligemment les paramètres des algorithmes, de construire des règles d'entreprise à partir des résultats des arbres, et d'utiliser les métriques de variance, les valeurs d'entropie et les indices de Gini pour une construction optimale des arbres.

Inclus

7 vidéos5 lectures4 devoirs1 laboratoire non noté

Le module 8 plonge dans le domaine des métriques d'évaluation des modèles d'apprentissage automatique. Les étudiants maîtriseront les concepts de courbes de précision et de rappel, de courbes de lift et de courbes de caractéristiques d'exploitation du récepteur (ROC). En outre, ils seront en mesure de découvrir des méthodes de calcul des seuils de probabilité à l'aide des statistiques de Kolmogorov-Smirnov et des F1-score. Ils pourront explorer des mesures telles que le taux de classification erronée, l'aire sous la courbe (AUC) et l'erreur quadratique moyenne (RMSE), ainsi que des techniques de calcul de la RMSE et de détection d'observations gravement mal ajustées à l'aide de résidus spécifiques au modèle.

Inclus

8 vidéos5 lectures4 devoirs1 laboratoire non noté

Ce module contient l'évaluation sommative du cours qui a été conçue pour évaluer votre compréhension du matériel du cours et votre capacité à appliquer les connaissances que vous avez acquises tout au long du cours. Veillez à bien réviser le matériel de cours avant de passer l'évaluation.

Inclus

1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Préparer un diplôme

Ce site cours fait partie du (des) programme(s) diplômant(s) suivant(s) proposé(s) par Illinois Tech. Si vous êtes admis et que vous vous inscrivez, les cours que vous avez suivis peuvent compter pour l'apprentissage de votre diplôme et vos progrès peuvent être transférés avec vous.¹

 

Instructeurs

Ming-Long Lam
Illinois Tech
1 Cours2 177 apprenants
Jawahar Panchal
Illinois Tech
1 Cours2 177 apprenants

Offert par

Illinois Tech

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions