IBM

Science des données avec R - Projet Capstone

IBM

Science des données avec R - Projet Capstone

Ce cours fait partie de plusieurs programmes.

Jeff Grossman
Yan Luo

Instructeurs : Jeff Grossman

18 052 déjà inscrits

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

111 avis

niveau Intermédiaire
Certaines connaissances prérequises
3 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

111 avis

niveau Intermédiaire
Certaines connaissances prérequises
3 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Écrivez un programme de scraping web pour extraire des données d'un fichier HTML à l'aide de requêtes HTTP et convertissez les données en un cadre de données.

  • Préparez les données pour la modélisation en traitant les valeurs manquantes, en formatant et en normalisant les données, en les regroupant et en transformant les valeurs catégorielles en valeurs numériques.

  • Interpréter les données à l'aide de techniques d'analyse exploratoire des données en calculant des statistiques descriptives, en établissant des graphiques et en générant des statistiques de corrélation.

  • Créez une application Shiny contenant une carte Leaflet et un tableau de bord interactif, puis créez une présentation du projet à partager avec vos pairs.

Compétences que vous acquerrez

  • Catégorie : Tidyverse (R Package)
  • Catégorie : Data Visualization
  • Catégorie : Data Cleansing
  • Catégorie : Predictive Analytics
  • Catégorie : Predictive Modeling
  • Catégorie : Data Presentation
  • Catégorie : Interactive Data Visualization
  • Catégorie : Data Wrangling
  • Catégorie : Exploratory Data Analysis
  • Catégorie : Data Science
  • Catégorie : Data Collection
  • Catégorie : Data Manipulation
  • Catégorie : Data Transformation
  • Catégorie : Data Analysis
  • Catégorie : Statistical Modeling
  • Catégorie : Regression Analysis

Outils que vous découvrirez

  • Catégorie : R Programming
  • Catégorie : Dashboard
  • Catégorie : Shiny (R Package)
  • Catégorie : Ggplot2

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours est disponible dans le cadre de
Lorsque vous vous inscrivez à ce cours, vous devez également sélectionner un programme spécifique.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 6 modules dans ce cours

Dans ce module, vous serez initié au projet Data Science with R Capstone et au scénario du problème sur lequel vous travaillerez tout au long du projet. Vous explorerez les ensembles de données utilisés dans le projet et comprendrez comment les données peuvent être collectées à partir de différentes sources. Vous apprendrez comment collecter des données en utilisant des techniques de web scraping pour extraire des informations à partir de pages HTML et comment utiliser des requêtes HTTP avec l'API OpenWeather pour récupérer des données météorologiques. Les données collectées seront ensuite organisées dans des formats structurés, tels que des cadres de données, en vue d'une analyse plus approfondie.

Inclus

2 vidéos1 devoir3 éléments d'application5 plugins

Dans ce module, vous apprendrez à nettoyer et à préparer des ensembles de données pour l'analyse grâce à diverses techniques de traitement des données. Vous travaillerez avec des données extraites du Web et appliquerez des méthodes telles que le renommage de colonnes, le nettoyage de texte à l'aide d'expressions régulières et la suppression de liens ou de caractères inutiles. Vous apprendrez également à gérer les données manquantes, à convertir les valeurs catégorielles en formats numériques et à normaliser les données afin de préparer l'ensemble de données pour une analyse plus poussée. Grâce à des travaux pratiques, vous vous exercerez à utiliser des fonctions et des techniques de manipulation de données pour transformer des données brutes en un format propre et structuré.

Inclus

1 vidéo1 devoir2 éléments d'application3 plugins

À ce stade du projet Capstone, vous avez acquis de précieuses connaissances pratiques en matière de collecte et de traitement des données. Vous avez également beaucoup appris sur les requêtes SQL et la visualisation. Félicitations ! Il est maintenant temps d'appliquer certaines de vos nouvelles connaissances et d'apprendre les techniques d'analyse exploratoire des données (AED), toujours par la pratique. Vous pouvez utiliser les ensembles de données que vous avez manipulés dans le module précédent. Cependant, si vous avez eu des difficultés à compléter le wrangling, ne vous inquiétez pas - nous avons préparé des ensembles de données propres que vous pouvez utiliser. Il vous sera demandé de réaliser trois laboratoires :

Inclus

1 vidéo1 devoir3 éléments d'application3 plugins

Dans ce module, vous apprendrez à construire et à évaluer des modèles de régression pour prédire la demande horaire de vélos en libre-service en utilisant des données météorologiques et temporelles. Vous commencerez par construire un modèle de régression linéaire de base, puis vous améliorerez le modèle en incorporant des termes polynomiaux, d'interaction et de régularisation. Grâce à des travaux pratiques, vous comparerez différents modèles et évaluerez leurs performances à l'aide de mesures telles que le R au carré et le RMSE. Vous analyserez également l'influence des variables prédictives en examinant et en visualisant leurs coefficients.

Inclus

1 vidéo1 devoir2 éléments d'application2 plugins

Dans ce module, vous apprendrez à construire un tableau de bord interactif en utilisant R Shiny pour visualiser les prévisions de la demande de vélos en libre-service. Vous créerez un tableau de bord qui intègre une carte Leaflet pour afficher la demande prédite dans différentes villes et permettre aux utilisateurs d'explorer les résultats grâce à des contrôles interactifs tels que des menus déroulants. Vous améliorerez également le tableau de bord en incorporant des visualisations de données avec ggplot2 pour afficher les tendances détaillées de la demande de vélos en libre-service pour les villes sélectionnées. Grâce à des travaux pratiques, vous acquerrez une expérience concrète dans la conception et l'amélioration d'applications de données interactives.

Inclus

1 vidéo1 devoir1 laboratoire non noté3 plugins

Dans ce dernier module, vous vous concentrerez sur la présentation des résultats de votre projet. Vous créerez une présentation PowerPoint complète qui mettra en évidence les étapes clés de votre analyse, les idées que vous avez découvertes et les résultats de votre travail de modélisation prédictive. Vous apprendrez les meilleures pratiques pour structurer et communiquer efficacement des résultats fondés sur des données. Après avoir préparé votre présentation, vous soumettrez votre projet final soit par le biais d'une soumission notée par l'IA, soit par le biais d'une soumission évaluée par les pairs.

Inclus

2 vidéos3 lectures1 évaluation par les pairs1 élément d'application5 plugins

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Évaluations de l’enseignant
(33 évaluations)
Jeff Grossman
IBM
3 Cours 730 782 apprenants
Yan Luo
IBM
7 Cours 399 557 apprenants

Offert par

IBM

En savoir plus sur Analyse des Données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

  • 5 stars

    81,98 %

  • 4 stars

    9 %

  • 3 stars

    2,70 %

  • 2 stars

    4,50 %

  • 1 star

    1,80 %

Affichage de 3 sur 111

BT

Révisé le 21 oct. 2023

SP

Révisé le 12 juin 2024

Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.