Ce cours pratique dote les apprenants des compétences nécessaires pour concevoir, construire et gérer des flux de travail ETL (Extraction, Transformation, Chargement) de bout en bout à l'aide d'Apache Spark dans un contexte réel d'ingénierie des données. Structuré en deux modules complets, le cours commence par une configuration fondamentale, guidant les apprenants à travers l'installation de composants essentiels tels que PySpark, Hadoop et MySQL. Les participants apprendront à configurer leur environnement, à organiser les structures de projet et à explorer efficacement les ensembles de données sources. Au fur et à mesure que le cours progresse, les apprenants développeront des applications Spark pour effectuer des chargements de données complets et incrémentiels en utilisant l'intégration JDBC avec MySQL. Grâce à des exemples pratiques, ils appliqueront une logique de transformation à l'aide de Spark SQL, filtreront les données en fonction des règles métier et traiteront les pièges courants tels que les incohérences de type et les problèmes de structure de dossier lors du déploiement de Spark. À la fin du cours, les apprenants seront en mesure de construire, d'exécuter et d'optimiser des pipelines ETL basés sur Spark qui sont évolutifs et prêts pour la production, ce qui leur permettra de contribuer efficacement à des rôles d'ingénierie des données dans le monde réel.

Apache Spark : Conception et exécution de pipelines ETL (Hands-On)

Apache Spark : Conception et exécution de pipelines ETL (Hands-On)
Ce cours fait partie de Spécialisation "Spark et Python pour le Big data avec PySpark"

Instructeur : EDUCBA
Inclus avec
20 avis
Ce que vous apprendrez
Installer et configurer PySpark, Hadoop et MySQL pour les flux de travail ETL.
Construisez des applications Spark pour des chargements de données complets et incrémentaux via JDBC.
Appliquer des transformations, gérer les problèmes de déploiement et optimiser les pipelines ETL.
Compétences que vous acquerrez
- Catégorie : Software Installation
- Catégorie : Extract, Transform, Load
- Catégorie : Data Transformation
- Catégorie : Data Import/Export
- Catégorie : Data Pipelines
- Catégorie : Development Environment
- Catégorie : Data Manipulation
Outils que vous découvrirez
- Catégorie : Apache Spark
- Catégorie : Apache Hadoop
- Catégorie : Java Platform Enterprise Edition (J2EE)
- Catégorie : Data Persistence
- Catégorie : PySpark
- Catégorie : MySQL
Détails à connaître

Ajouter à votre profil LinkedIn
6 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

En savoir plus sur Analyse des Données
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
45 %
- 4 stars
40 %
- 3 stars
10 %
- 2 stars
0 %
- 1 star
5 %
Affichage de 3 sur 20
Révisé le 27 nov. 2025
The course does a good job comparing Spark’s distributed processing with traditional ETL tools, so you understand why Spark is used.
Révisé le 31 janv. 2026
Great mix of theory and hands-on labs. I now feel comfortable using DataFrames, Spark SQL, and basic optimization techniques.
Révisé le 25 déc. 2025
At roughly a few hours of content, the course doesn’t overwhelm and is easy to complete in a weekend or short crash-learning session.

Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Plus de questions
Aide financière disponible,





