Ce cours offre un voyage complet dans Apache Spark avec Scala, conçu pour les apprenants qui veulent analyser, concevoir, mettre en œuvre et évaluer des applications Big data. En commençant par les fondements de l'architecture Spark et de la programmation Scala, les apprenants exploreront les variables, les fonctions, les collections et les concepts Scala avancés tels que les traits, les classes abstraites et la gestion des exceptions. Le cours avance ensuite dans les opérations Spark RDD, le streaming, le fenêtrage et le checkpoint, aidant les apprenants à appliquer des transformations distribuées et à mettre en œuvre des pipelines de données en temps réel. Enfin, les participants construiront des projets intégrés à l'aide de Maven, connecteront Spark à des systèmes externes tels que les API de Twitter et évalueront l'impact de Hadoop 1.x par rapport à 2.x dans la gestion des ressources pour les applications évolutives. À la fin de ce cours, les participants seront en mesure d'appliquer les principes fondamentaux de Scala, de différencier les transformations et les actions RDD, de mettre en œuvre Spark Streaming avec une tolérance aux pannes et de construire des solutions de big data en temps réel, se positionnant ainsi dans des rôles d'ingénierie de données, d'analyse de big data et de développement de données en temps réel.

Apache Spark avec Scala : Construction et analyse des données de référence

Apache Spark avec Scala : Construction et analyse des données de référence
Ce cours fait partie de Spécialisation "Spark et Python pour le Big data avec PySpark"

Instructeur : EDUCBA
Inclus avec
Ce que vous apprendrez
Appliquer les principes fondamentaux de Scala, notamment les variables, les fonctions et les concepts avancés.
Mettre en œuvre les opérations Spark RDD, le streaming et les pipelines tolérants aux erreurs.
Construire des solutions Big data en temps réel intégrant Spark avec des systèmes externes.
Compétences que vous acquerrez
- Catégorie : Real Time Data
- Catégorie : Data Processing
- Catégorie : Scalability
- Catégorie : Systems Integration
- Catégorie : Data Structures
- Catégorie : Object Oriented Programming (OOP)
Outils que vous découvrirez
- Catégorie : Apache Hadoop
- Catégorie : Apache Maven
- Catégorie : Apache Spark
- Catégorie : Scala Programming
Détails à connaître

Ajouter à votre profil LinkedIn
8 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

En savoir plus sur Analyse des Données

École Polytechnique Fédérale de Lausanne
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.

Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Plus de questions
Aide financière disponible,




