Packt

Data Engineering with Scala and Spark

Ce cours n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Packt

Data Engineering with Scala and Spark

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

2 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

2 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Set up a development environment for building data pipelines in Scala

  • Use Spark DataFrames, Datasets, and SQL with Scala for data processing

  • Profile and clean data using Deequ for improved data quality

Compétences que vous acquerrez

  • Catégorie : Unit Testing
  • Catégorie : Data Processing
  • Catégorie : Cloud Engineering
  • Catégorie : Real Time Data
  • Catégorie : Data Transformation
  • Catégorie : CI/CD
  • Catégorie : Data Architecture
  • Catégorie : Test Driven Development (TDD)
  • Catégorie : Data Quality
  • Catégorie : Data Infrastructure
  • Catégorie : Big Data
  • Catégorie : Data Validation
  • Catégorie : Data Integrity
  • Catégorie : Data Pipelines
  • Catégorie : Performance Tuning

Outils que vous découvrirez

  • Catégorie : Data Lakes
  • Catégorie : Apache Kafka
  • Catégorie : Scala Programming
  • Catégorie : Apache Airflow
  • Catégorie : Apache Spark

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

mars 2026

Évaluations

13 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 13 modules dans ce cours

In this section, we explore functional programming, higher-order functions, polymorphic functions, and pattern matching in Scala for data engineering applications.

Inclus

2 vidéos6 lectures1 devoir

In this section, we explore cloud-based and local environments for data engineering pipelines, focusing on setup processes, trade-offs, and practical applications.

Inclus

1 vidéo5 lectures1 devoir

In this section, we explore Apache Spark's APIs, focusing on DataFrame and Dataset for distributed data processing.

Inclus

1 vidéo3 lectures1 devoir

In this section, we explore using Spark JDBC API for database access, designing database interfaces, and performing operations with configuration loading.

Inclus

1 vidéo3 lectures1 devoir

In this section, we explore object stores, data lakes, and lakehouses, focusing on their roles in managing large-scale data workflows efficiently.

Inclus

1 vidéo6 lectures1 devoir

In this section, we explore Spark transformations, aggregations, joins, and window functions to enhance data processing for BI and analytics. Key concepts include efficient data manipulation and pipeline development.

Inclus

1 vidéo4 lectures1 devoir

In this section, we explore Deequ for implementing data quality checks, analyzing completeness and accuracy, and defining constraints to ensure reliable data pipelines.

Inclus

1 vidéo3 lectures1 devoir

In this section, we explore test-driven development, static code analysis, and linting to improve code quality, maintainability, and consistency in data engineering projects.

Inclus

1 vidéo4 lectures1 devoir

In this section, we explore CI/CD practices with GitHub to automate Scala data pipeline workflows, focusing on GitHub Actions, version control, and reliable deployment processes.

Inclus

1 vidéo4 lectures1 devoir

In this section, we explore data pipeline orchestration using tools like Airflow, Argo, Databricks, and Azure Data Factory. We focus on workflow design, task management, and real-world implementation strategies.

Inclus

1 vidéo6 lectures1 devoir

In this section, we analyze Spark UI metrics to identify performance issues, optimize data shuffling, and right-size compute resources for efficient data processing.

Inclus

1 vidéo4 lectures1 devoir

In this section, we explore building batch pipelines using Spark and Scala, focusing on medallion architecture, data ingestion, transformation, and orchestration for scalable data processing.

Inclus

1 vidéo5 lectures1 devoir

In this section, we explore building real-time data pipelines using Spark, Scala, and Kafka for IoT applications. Key concepts include data ingestion, transformation, and serving layer design.

Inclus

1 vidéo4 lectures1 devoir

Instructeur

Packt - Course Instructors
Packt
1 550 Cours 433 439 apprenants

Offert par

Packt

En savoir plus sur Data Management

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions