Ce cours de niveau débutant est conçu pour présenter aux apprenants la puissante combinaison de Python et Apache Spark (PySpark) pour le traitement et l'analyse des données distribuées. À travers des leçons structurées et des exemples du monde réel, les apprenants rappelleront la syntaxe fondamentale de Python, identifieront les éléments clés de PySpark et démontreront l'utilisation des transformations et des actions de base de Spark en utilisant des ensembles de données distribuées résilientes (RDD). Au fur et à mesure que le cours progresse, les apprenants appliqueront des techniques avancées de traitement des données telles que les jointures et l'intégration des données en utilisant JDBC avec MySQL, et construiront des pipelines de données évolutifs tels que le comptage de mots en utilisant des chaînes de transformation. Chaque module met l'accent sur un mélange de compréhension conceptuelle et d'expérience de codage pratique, permettant aux apprenants d'analyser, de déboguer et d'évaluer efficacement leurs applications PySpark. À la fin du cours, les apprenants auront acquis une compétence pratique dans la construction de flux de travail de données distribuées et seront prêts à avancer vers des défis plus complexes d'ingénierie des données et d'analytique des données.


PySpark & Python : Guide pratique pour le traitement des données
Ce cours fait partie de Spécialisation Spark et Python pour le Big data avec PySpark

Instructeur : EDUCBA
Inclus avec
(36 avis)
Ce que vous apprendrez
Rappeler la syntaxe de Python et identifier les composants clés de PySpark pour le traitement des données.
Appliquer les transformations RDD, les jointures et l'intégration JDBC avec MySQL.
Construire des pipelines évolutifs comme le comptage de mots et déboguer les applications PySpark.
Compétences que vous acquerrez
- Catégorie : SQL
- Catégorie : Informatique distribuée
- Catégorie : Principes de programmation
- Catégorie : PySpark
- Catégorie : MySQL
- Catégorie : Programmation en Python
- Catégorie : Apache Spark
- Catégorie : Traitement des données
- Catégorie : Transformation de données
- Catégorie : Manipulation de données
- Catégorie : Pipelines de données
- Catégorie : Débogage
Détails à connaître

Ajouter à votre profil LinkedIn
août 2025
7 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours
Ce module présente aux apprenants les concepts fondamentaux nécessaires pour travailler avec PySpark, en commençant par l'évolution des données et la pertinence des cadres informatiques distribués. Il établit les bases de la programmation Python, en mettant l'accent sur la syntaxe, les structures et le flux de contrôle nécessaires au développement d'applications PySpark. A la fin de ce module, les apprenants seront dotés de connaissances essentielles en programmation et d'une compréhension claire de la manière d'initier le traitement de données basé sur PySpark.
Inclus
9 vidéos4 devoirs
Ce module s'appuie sur les connaissances fondamentales de PySpark en présentant aux apprenants des opérations avancées, notamment la manipulation de DataFrame, les opérations de jointure et l'intégration de données externes avec MySQL. A travers des exemples pratiques, les étudiants exploreront comment traiter, combiner et analyser efficacement des ensembles de données distribuées. Le module culmine avec une application pratique à travers le problème classique du COUNT, renforçant les pipelines de transformation et les techniques d'agrégation dans un environnement distribué.
Inclus
7 vidéos3 devoirs
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
En savoir plus sur Analyse des Données
Statut : PrévisualisationEdureka
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?




Avis des étudiants
36 avis
- 5 stars
69,44 %
- 4 stars
27,77 %
- 3 stars
0 %
- 2 stars
2,77 %
- 1 star
0 %
Affichage de 3 sur 36
Révisé le 6 déc. 2025
I also appreciated the explanations around performance tuning and optimization basics, which many beginner courses often skip.
Révisé le 20 oct. 2025
I’ve taken many courses before, but this one stands out for its practical approach to PySpark. Real examples made all the difference. Highly recommended for professionals.
Révisé le 15 nov. 2025
Topics progress naturally—from basic operations to more advanced transformations—without overwhelming beginners.

Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien de demande sur la page de description.
Plus de questions
Aide financière disponible,

