Ce cours présente aux débutants les concepts fondamentaux et intermédiaires du traitement des données distribuées à l'aide d'Apache Spark, l'un des moteurs les plus puissants pour l'analytique à grande échelle. À travers deux modules progressivement structurés, les apprenants identifieront l'architecture de Spark, décriront ses composants de base et démontreront des constructions de programmation clés telles que les RDD (Resilient Distributed Datasets). Dans le module 1, les apprenants reconnaîtront les principes derrière le modèle transformateur distribué de Spark et illustreront les transformations RDD de base. Dans le module 2, ils appliqueront une logique de transformation avancée, mettront en œuvre des stratégies de persistance et différencieront les formats de fichiers tels que CSV, JSON, Parquet et Avro pour un traitement efficace des données. À la fin du cours, les apprenants seront en mesure d'analyser les applications Spark pour l'optimisation, d'évaluer les stratégies de stockage et de développer des flux de travail de traitement de données évolutifs en utilisant les API de base de Spark. Le cours mélange la clarté conceptuelle avec des exemples pratiques pour équiper les apprenants pour les défis Big data du monde réel.

Débloquez l'accès à plus de 10 000 cours avec Coursera Plus. Essai gratuit de 7 jours.

Apache Spark : Appliquer et évaluer les flux de travail Big data
Ce cours fait partie de Spécialisation Spark et Python pour le Big data avec PySpark

Instructeur : EDUCBA
Inclus avec
Ce que vous apprendrez
Décrire l'architecture de Spark, les composants de base et les constructions de programmation RDD.
Appliquer des transformations, la persistance, et gérer plusieurs formats de fichiers dans Spark.
Développez des flux de travail évolutifs et évaluez les applications Spark pour les optimiser.
Compétences que vous acquerrez
- Catégorie : Big Data
- Catégorie : Manipulation de données
- Catégorie : JSON
- Catégorie : Transformation de données
- Catégorie : PySpark
- Catégorie : Informatique distribuée
- Catégorie : Pipelines de données
- Catégorie : Apache Spark
- Catégorie : Optimisation des performances
- Catégorie : Traitement des données
Détails à connaître

Ajouter à votre profil LinkedIn
août 2025
6 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours
Ce module présente aux apprenants les concepts fondamentaux d'Apache Spark, un puissant moteur open source conçu pour le traitement et l'analytique des Big data. À travers une série de leçons structurées, les apprenants explorent l'architecture de Spark, ses composants de base et les constructions de programmation essentielles. Le module développe une compréhension conceptuelle de la façon dont Spark tire parti de l'informatique distribuée et du traitement en mémoire, suivie d'une introduction pratique au travail avec les RDD (Resilient Distributed Datasets), l'abstraction de base de Spark pour le traitement des données. À la fin du module, les apprenants seront dotés des connaissances nécessaires pour lancer des opérations informatiques de base dans Spark et comprendre son architecture de haut niveau.
Inclus
5 vidéos3 devoirs
Ce module permet d'approfondir la compréhension d'Apache Spark en se concentrant sur les transformations RDD avancées, les stratégies de persistance, les opérations sur les RDD clé-valeur (Paire) et la manipulation efficace de divers formats de données. Les apprenants découvriront comment appliquer des transformations telles que map, flatMap et reduceByKey, comprendre le rôle et la configuration des niveaux de persistance dans Spark, manipuler les RDD Pair à l'aide d'actions de tri et de regroupement, et travailler avec des formats de fichiers couramment utilisés, notamment CSV, JSON, Parquet et Avro. Le module dote les apprenants de la capacité à optimiser les applications Spark tant sur le plan du calcul que sur celui du stockage et du traitement des données.
Inclus
6 vidéos3 devoirs
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
En savoir plus sur Analyse des Données
Statut : Essai gratuit
Statut : PrévisualisationÉcole Polytechnique Fédérale de Lausanne
Statut : Essai gratuit
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?





Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien de demande sur la page de description.
Plus de questions
Aide financière disponible,

