Apache Spark : Appliquer et évaluer les flux de travail Big data

Ce cours fait partie de Spécialisation "Spark et Python pour le Big data avec PySpark"

Instructeur : EDUCBA

Inclus avec

2 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

4 heures à compléter

Planning flexible

Apprenez à votre propre rythme

2 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

4 heures à compléter

Planning flexible

Apprenez à votre propre rythme

Ce que vous apprendrez

Décrire l'architecture de Spark, les composants de base et les constructions de programmation RDD.
Appliquer des transformations, la persistance, et gérer plusieurs formats de fichiers dans Spark.
Développez des flux de travail évolutifs et évaluez les applications Spark pour les optimiser.

Compétences que vous acquerrez

Catégorie : Importation/exportation de données
Catégorie : Traitement des données
Catégorie : Informatique distribuée
Catégorie : Big Data
Catégorie : Optimisation des performances
Catégorie : Transformation des données

Outils que vous découvrirez

Catégorie : Persistance des données
Catégorie : JSON
Catégorie : Apache Spark

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

6 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "Spark et Python pour le Big data avec PySpark"

Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.

Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours

Ce cours présente aux débutants les concepts fondamentaux et intermédiaires du traitement des données distribuées à l'aide d'Apache Spark, l'un des moteurs les plus puissants pour l'analytique à grande échelle. À travers deux modules progressivement structurés, les apprenants identifieront l'architecture de Spark, décriront ses composants de base et démontreront des constructions de programmation clés telles que les RDD (Resilient Distributed Datasets). Dans le module 1, les apprenants reconnaîtront les principes derrière le modèle transformateur distribué de Spark et illustreront les transformations RDD de base. Dans le module 2, ils appliqueront une logique de transformation avancée, mettront en œuvre des stratégies de persistance et différencieront les formats de fichiers tels que CSV, JSON, Parquet et Avro pour un traitement efficace des données. À la fin du cours, les apprenants seront en mesure d'analyser les applications Spark pour l'optimisation, d'évaluer les stratégies de stockage et de développer des flux de travail de traitement de données évolutifs en utilisant les API de base de Spark. Le cours mélange la clarté conceptuelle avec des exemples pratiques pour équiper les apprenants pour les défis Big data du monde réel.

Ce module présente aux apprenants les concepts fondamentaux d'Apache Spark, un puissant moteur open source conçu pour le traitement et l'analytique des Big data. À travers une série de leçons structurées, les apprenants explorent l'architecture de Spark, ses composants de base et les constructions de programmation essentielles. Le module développe une compréhension conceptuelle de la façon dont Spark tire parti de l'informatique distribuée et du traitement en mémoire, suivie d'une introduction pratique au travail avec les RDD (Resilient Distributed Datasets), l'abstraction de base de Spark pour le traitement des données. À la fin du module, les apprenants seront dotés des connaissances nécessaires pour lancer des opérations informatiques de base dans Spark et comprendre son architecture de haut niveau.

Inclus

5 vidéos3 devoirs

Ce module permet d'approfondir la compréhension d'Apache Spark en se concentrant sur les transformations RDD avancées, les stratégies de persistance, les opérations sur les RDD clé-valeur (Paire) et la manipulation efficace de divers formats de données. Les apprenants découvriront comment appliquer des transformations telles que map, flatMap et reduceByKey, comprendre le rôle et la configuration des niveaux de persistance dans Spark, manipuler les RDD Pair à l'aide d'actions de tri et de regroupement, et travailler avec des formats de fichiers couramment utilisés, notamment CSV, JSON, Parquet et Avro. Le module dote les apprenants de la capacité à optimiser les applications Spark tant sur le plan du calcul que sur celui du stockage et du traitement des données.

Inclus

6 vidéos3 devoirs

6 vidéosTotal 44 minutes

Transformations RDD dans Spark8 minutes
Les transformations RDD dans Spark se poursuivent7 minutes
Persistance des RDD dans Spark10 minutes
Tri par groupe et actions sur des paires de RDD7 minutes
Formats de fichiers Spark10 minutes
Les formats de fichiers Spark se poursuivent2 minutes

3 devoirsTotal 50 minutes

Quiz noté - Opérations RDD avancées et traitement des données30 minutes
Transformations et persistance10 minutes
Paire de RDD et formats de fichiers10 minutes

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

EDUCBA

1 213 Cours285 051 apprenants

Offert par

EDUCBA

En savoir plus sur Analyse des données

Statut : Essai gratuit
Packt
Apache Spark with Scala – Hands-On with Big Data!
Cours
Statut : Essai gratuit
University of Pittsburgh
Big Data Processing with Hadoop and Spark
Cours
Statut : Prévisualisation
École Polytechnique Fédérale de Lausanne
Big Data Analysis with Scala and Spark (Scala 2 version)
Cours
Statut : Essai gratuit
IBM
Introduction to Big Data with Spark and Hadoop
Cours

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Découvrir les diplômes

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.

Plus de questions

Visitez le Centre d'Aide pour les Étudiants

Aide financière disponible,

Apache Spark : Appliquer et évaluer les flux de travail Big data

Apache Spark : Appliquer et évaluer les flux de travail Big data

Ce que vous apprendrez

Compétences que vous acquerrez

Outils que vous découvrirez

Détails à connaître

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet

Il y a 2 modules dans ce cours

Démarrer avec Apache Spark

Inclus

5 vidéosTotal 40 minutes

3 devoirsTotal 50 minutes

Opérations avancées de RDD et traitement des données

Inclus

6 vidéosTotal 44 minutes

3 devoirsTotal 50 minutes

Obtenez un certificat professionnel

Instructeur

Offert par

En savoir plus sur Analyse des données

Apache Spark with Scala – Hands-On with Big Data!

Big Data Processing with Hadoop and Spark

Big Data Analysis with Scala and Spark (Scala 2 version)

Introduction to Big Data with Spark and Hadoop

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.

Ouvrez de nouvelles portes avec Coursera Plus

Faites progresser votre carrière avec un diplôme en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Foire Aux Questions

Plus de questions

Apache Spark : Appliquer et évaluer les flux de travail Big data

Apache Spark : Appliquer et évaluer les flux de travail Big data

Ce que vous apprendrez

Compétences que vous acquerrez

Outils que vous découvrirez

Détails à connaître

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet

Il y a 2 modules dans ce cours

Démarrer avec Apache Spark

Inclus

Opérations avancées de RDD et traitement des données

Inclus

Obtenez un certificat professionnel

Instructeur

Offert par

En savoir plus sur Analyse des données

Apache Spark with Scala – Hands-On with Big Data!

Big Data Processing with Hadoop and Spark

Big Data Analysis with Scala and Spark (Scala 2 version)

Introduction to Big Data with Spark and Hadoop

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.

Ouvrez de nouvelles portes avec Coursera Plus

Faites progresser votre carrière avec un diplôme en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Foire Aux Questions

Quand aurai-je accès aux cours et aux devoirs ?

Qu'est-ce que je recevrai si je souscris à cette Specializations ?

Une aide financière est-elle disponible ?

Plus de questions