La plupart des données du monde réel ne sont pas propres, elles sont désordonnées, incomplètes et réparties dans des sources telles que les sites Web, les API et les bases de données. Dans ce cours, vous apprendrez à collecter ces données, à les nettoyer et à les préparer pour l'analyse à l'aide de Python et de SQL. Vous commencerez par extraire des données à partir de pages Web à l'aide d'outils tels que Pandas et Beautiful Soup, tout en apprenant à gérer le texte non structuré et à appliquer des pratiques de scraping éthiques. Ensuite, vous accéderez à des données en temps réel via des API, analyserez des fichiers JSON et nettoierez des données numériques à l'aide de techniques telles que la normalisation et la mise en bacs. Vous apprendrez également à gérer l'authentification avec des clés API et à les stocker de manière sécurisée. Enfin, vous travaillerez avec des bases de données : Interroger et joindre des tables en utilisant SQL, valider les résultats et comprendre quand utiliser SQL ou Python pour différentes tâches de prétraitement. À la fin du cours, vous serez en mesure de transformer les données brutes du monde réel en entrées fiables et prêtes à l'analyse - une compétence de base pour tout professionnel des données.

E/S et Prétraitement de données avec Python et SQL
Ce cours fait partie de DeepLearning.IA Analytique des données Certificat Professionnel

Instructeur : Sean Barnes
Enseignant de premier plan
4 267 déjà inscrits
(13 avis)
Expérience recommandée
Ce que vous apprendrez
Vous travaillerez avec des données réelles telles qu'elles existent dans la pratique : désordonnées, non structurées et réparties entre plusieurs sources.
Vous apprendrez à extraire des données de sites web, d'API et de bases de données, et à les nettoyer en cours d'utilisation de Python et de SQL, une étape essentielle dans tout pipeline d'analyse.
Compétences que vous acquerrez
- Catégorie : Importation/exportation de données
- Catégorie : Extraction, transformation, chargement (ETL)
- Catégorie : Web scraping
- Catégorie : Transformation de données
- Catégorie : Exploration de texte
- Catégorie : Interface de programmation d'application (API)
- Catégorie : JSON
- Catégorie : Intégrité des données
- Catégorie : Bases de données relationnelles
- Catégorie : Manipulation de données
- Catégorie : Pandas (paquetage Python)
- Catégorie : IA générative
- Catégorie : Validation des données
- Catégorie : Traitement des données
- Catégorie : Données non structurées
- Catégorie : SQL
- Catégorie : Éthique des données
- Catégorie : Nettoyage des données
Détails à connaître

Ajouter à votre profil LinkedIn
16 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise en Analyse des Données
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable auprès de DeepLearning.AI

Il y a 4 modules dans ce cours
Ce module présente les techniques d'acquisition de données à partir d'un large éventail de sources, en mettant l'accent sur le web scraping et le traitement de texte. Vous commencerez par explorer la façon dont les données circulent dans les pipelines d'analyse et vous acquerrez une expérience pratique en utilisant des outils tels que Pandas et Beautiful Soup pour extraire, nettoyer et structurer les données. Vous appliquerez des méthodes de prétraitement de texte pour gérer les valeurs manquantes et analyser le HTML. De plus, vous examinerez les implications éthiques de l'extraction de données sur le Web.
Inclus
22 vidéos3 lectures4 devoirs1 devoir de programmation3 laboratoires non notés
Ce module se concentre sur l'acquisition de données en cours d'utilisation d'API, ainsi que sur l'application de techniques de nettoyage numérique. Vous apprendrez à récupérer des données à partir d'API basées sur le Web, à gérer l'authentification en toute sécurité et à transformer les réponses JSON brutes en cadres de données utilisables. Le module couvre également les techniques de nettoyage et de préparation des données numériques, y compris la mise à l'échelle, le binning, la normalisation et le traitement des valeurs aberrantes.
Inclus
17 vidéos2 lectures4 devoirs1 devoir de programmation3 laboratoires non notés
Ce module présente les principes fondamentaux du stockage et de l'extraction des données en cours d'utilisation et en SQL. Vous apprendrez comment les données sont structurées dans les systèmes relationnels, explorerez les concepts de base tels que les entités, les relations et les schémas, et acquerrez une expérience pratique de l'écriture de requêtes SQL. Vous découvrirez également comment interroger des bases de données à partir d'un Bloc-notes Python, ainsi que la manière dont les outils d'IA générative peuvent prendre en charge les tâches basées sur SQL.
Inclus
15 vidéos3 lectures4 devoirs1 devoir de programmation2 laboratoires non notés
Dans ce module, vous développerez vos compétences SQL en matière de prétraitement des données, de validation et de jointures (combinaison de tables). Vous apprendrez à utiliser SQL pour le filtrage, la logique conditionnelle et la gestion des valeurs manquantes, et à appliquer des techniques de validation à l'aide de l'agrégation et du regroupement. Le module explore également les différents types de jointures et montre comment les utiliser pour combiner et analyser les données de plusieurs tables, en particulier dans des scénarios réels tels que l'analyse des données de performances sportives.
Inclus
17 vidéos11 lectures4 devoirs2 devoirs de programmation4 laboratoires non notés
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeur

Offert par
En savoir plus sur Analyse des Données
Statut : Essai gratuit
Statut : Essai gratuitDuke University
Statut : Essai gratuitJohns Hopkins University
Statut : Essai gratuitDuke University
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?




Avis des étudiants
13 avis
- 5 stars
100 %
- 4 stars
0 %
- 3 stars
0 %
- 2 stars
0 %
- 1 star
0 %
Affichage de 3 sur 13
Révisé le 20 juin 2025
very precise. touches all relevant concepts with perfect examples. Good datasets and great evaluation.
Révisé le 27 juin 2025
Very broad and thorough course on data collection techniques, preprocessing, analysis, and visualization. Highly recommend.
Révisé le 22 oct. 2025
Sean Barnes is a great teacher and his courses are terrific. How I wish his courses were available when I first decided to learn data science!

Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours du certificat et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - à partir de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Plus de questions
Aide financière disponible,