Coursera

Spécialisation "Performance Engineering for Data Systems"

Saisissez l'occasion de faire des économies ! Bénéficiez de 40 % de réduction sur 3 mois de Coursera Plus et d'un accès complet à des milliers de cours.

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Spécialisation "Performance Engineering for Data Systems"

Optimize SQL, Spark, and Data Warehouses.

Learn to diagnose bottlenecks and optimize performance in databases, warehouses, and Spark systems.

Hurix Digital
Merna Elzahaby

Instructeurs : Hurix Digital

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Analyze SQL execution plans and Spark UI metrics to diagnose performance bottlenecks and implement targeted optimizations.

  • Design scalable database schemas, partitioning strategies, and storage architectures that balance performance with cost.

  • Engineer resilient cloud data infrastructure using IaC, disaster recovery planning, and systematic resource management.

Compétences que vous acquerrez

  • Catégorie : Cloud Computing Architecture
  • Catégorie : Cost Management
  • Catégorie : Data Architecture
  • Catégorie : Data Pipelines
  • Catégorie : Data Transformation
  • Catégorie : Data Warehousing
  • Catégorie : Database Design
  • Catégorie : Database Management
  • Catégorie : Disaster Recovery
  • Catégorie : Distributed Computing
  • Catégorie : Infrastructure as Code (IaC)
  • Catégorie : Performance Analysis
  • Catégorie : Performance Tuning
  • Catégorie : Resource Management
  • Catégorie : Root Cause Analysis
  • Catégorie : Scalability
  • Catégorie : SQL

Outils que vous découvrirez

  • Catégorie : Apache Spark
  • Catégorie : PySpark
  • Catégorie : Query Languages

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

février 2026

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 9 cours

Ce que vous apprendrez

  • Performance optimization requires methodical analysis of execution plans to identify root causes, not just symptoms.

  • Query restructuring with CTEs, optimized joins, and window functions can dramatically improve execution efficiency.

  • Index design needs ongoing analysis of query patterns and data access requirements for sustainable performance.

  • Scalable systems depend on proactive monitoring and optimization cycles that prevent production bottlenecks.

Ce que vous apprendrez

  • Proactive resource management prevents performance degradation and ensures consistent query execution across diverse workloads and user groups.

  • Security through least-privilege access requires continuous monitoring and systematic auditing of permissions against actual business requirements.

  • Effective incident response depends on blameless post-mortem processes that focus on systemic improvements rather than individual accountability.

  • Operational excellence in data infrastructure requires balancing performance, security, and reliability engineering principles.

Compétences que vous acquerrez

Catégorie : Identity and Access Management
Catégorie : Compliance Auditing
Catégorie : Problem Management
Catégorie : Root Cause Analysis
Catégorie : Resource Management
Catégorie : Configuration Management
Catégorie : Role-Based Access Control (RBAC)
Catégorie : Capacity Management
Catégorie : Site Reliability Engineering
Catégorie : Data Security

Ce que vous apprendrez

  • Denormalization boosts query speed but demands careful analysis of consistency risks and maintenance costs.

  • Partitioning and clustering strategies must align with actual query patterns and access methods to deliver meaningful performance gains.

  • ER diagrams serve as documentation and validation tools, enabling better communication and system understanding.

  • Schema optimization balances query performance, data integrity, storage efficiency, and maintenance complexity.

Compétences que vous acquerrez

Catégorie : Database Design
Catégorie : Snowflake Schema
Catégorie : Database Development
Catégorie : SQL
Catégorie : Star Schema
Catégorie : Data Modeling
Catégorie : Database Architecture and Administration
Catégorie : Technical Documentation

Ce que vous apprendrez

  • Batch data transformation converts raw semi-structured data into analysis-ready formats that support enterprise decisions.

  • Workload analysis guides database design by linking access patterns and query frequency to performance and cost gains.

  • Migration choices must rely on performance testing and quantitative analysis to ensure ROI-driven transformations.

  • System performance depends on storage, queries, and hardware, requiring holistic technical and business evaluation.

Compétences que vous acquerrez

Catégorie : Data Transformation
Catégorie : Apache Hive
Catégorie : Operational Databases
Catégorie : Data Architecture
Catégorie : Database Design
Catégorie : Azure Synapse Analytics
Catégorie : Database Management
Catégorie : Data Wrangling
Catégorie : Apache Cassandra
Catégorie : Amazon Redshift

Ce que vous apprendrez

  • Slowly Changing Dimensions maintain historical data integrity and enable accurate, time-based enterprise analysis.

  • Analyzing data lifecycles balances storage costs with business value, guiding efficient archiving and retention.

  • Multi-cluster architectures isolate workloads, prevent contention, and enable cost control and performance optimization.

  • Sustainable scaling requires governance, automated resource management, and continuous monitoring of performance and cost.

Ce que vous apprendrez

  • Infrastructure as Code automates data platform deployments, replacing manual processes with version-controlled, repeatable systems.

  • Cost optimization uses performance benchmarking and data analysis to identify efficient compute/storage configs for specific workloads.

  • Business continuity requires proactive disaster recovery with automated failover and continuous replication for strict recovery goals.

  • Successful cloud data engineering balances performance, cost, and reliability through strategic design and continuous monitoring.

Compétences que vous acquerrez

Catégorie : Business Continuity
Catégorie : Disaster Recovery
Catégorie : IT Infrastructure
Catégorie : Cloud Computing Architecture
Catégorie : Automation
Catégorie : Infrastructure as Code (IaC)
Catégorie : Performance Analysis
Catégorie : Cost Management
Catégorie : Terraform
Catégorie : AWS CloudFormation
Catégorie : Cloud Deployment
Catégorie : Business Continuity Planning
Catégorie : Data Architecture
Catégorie : Benchmarking
Catégorie : Capacity Management
Catégorie : Data Infrastructure
Catégorie : Data Warehousing

Ce que vous apprendrez

  • Performance optimization is a systematic process requiring analysis of data access patterns, not random configuration changes.

  • Strategic partitioning minimizes expensive network shuffles and is the foundation of scalable Spark applications.

  • Intelligent caching of reusable intermediate datasets can dramatically reduce computation costs and improve job reliability.

  • The Spark UI provides actionable insights that guide optimization decisions and enable data-driven performance improvements.

Compétences que vous acquerrez

Catégorie : Performance Tuning
Catégorie : Apache Spark
Catégorie : Data Processing
Catégorie : Systems Analysis
Catégorie : Data Pipelines
Catégorie : PySpark

Ce que vous apprendrez

  • Performance bottlenecks in distributed systems often stem from uneven data distribution rather than insufficient computational resources.

  • Visual execution plan analysis is essential for identifying specific stages where data processing imbalances occur.

  • Proactive partition strategy selection prevents performance degradation more effectively than reactive optimization

  • Spark's shuffle.partitions configuration and broadcast join patterns are fundamental tools for sustainable pipeline optimization.

Compétences que vous acquerrez

Catégorie : Apache Spark
Catégorie : Performance Tuning
Catégorie : PySpark
Catégorie : Scalability
Catégorie : Data Pipelines
Catégorie : Debugging
Catégorie : Performance Analysis
Catégorie : Data Processing
Catégorie : Distributed Computing

Ce que vous apprendrez

  • Inspect Spark UI and metrics (task duration, shuffle I/O, executor CPU/mem) to find bottlenecks and recommend actionable optimizations.

  • Apply partitioning and skew mitigation (salting/custom partitioner) & reduce shuffle (broadcast joins, avoid groupByKey, AQE) to improve parallelism.

  • Configure executors, cores, memory, dynamic allocation and parallelism/caching settings to maximize throughput while meeting defined SLA targets.

Compétences que vous acquerrez

Catégorie : Apache Spark
Catégorie : Performance Tuning
Catégorie : Debugging
Catégorie : PySpark
Catégorie : Job Analysis
Catégorie : System Configuration
Catégorie : Resource Allocation
Catégorie : Scalability
Catégorie : Process Optimization
Catégorie : Performance Analysis
Catégorie : Database Management

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Hurix Digital
Coursera
354 Cours 26 598 apprenants
Merna Elzahaby
Coursera
1 Cours 34 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions