Coursera

Spécialisation "Performance Engineering for Data Systems"

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Spécialisation "Performance Engineering for Data Systems"

Optimize SQL, Spark, and Data Warehouses.

Learn to diagnose bottlenecks and optimize performance in databases, warehouses, and Spark systems.

Hurix Digital
Merna Elzahaby

Instructeurs : Hurix Digital

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Analyze SQL execution plans and Spark UI metrics to diagnose performance bottlenecks and implement targeted optimizations.

  • Design scalable database schemas, partitioning strategies, and storage architectures that balance performance with cost.

  • Engineer resilient cloud data infrastructure using IaC, disaster recovery planning, and systematic resource management.

Compétences que vous acquerrez

  • Catégorie : Cloud Computing Architecture
  • Catégorie : Cost Management
  • Catégorie : Data Architecture
  • Catégorie : Data Pipelines
  • Catégorie : Data Transformation
  • Catégorie : Data Warehousing
  • Catégorie : Database Design
  • Catégorie : Database Management
  • Catégorie : Disaster Recovery
  • Catégorie : Distributed Computing
  • Catégorie : Infrastructure as Code (IaC)
  • Catégorie : Performance Analysis
  • Catégorie : Performance Tuning
  • Catégorie : Resource Management
  • Catégorie : Root Cause Analysis
  • Catégorie : Scalability
  • Catégorie : SQL

Outils que vous découvrirez

  • Catégorie : Apache Spark
  • Catégorie : PySpark
  • Catégorie : Query Languages

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

février 2026

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 11 cours

Ce que vous apprendrez

  • Performance optimization requires methodical analysis of execution plans to identify root causes, not just symptoms.

  • Query restructuring with CTEs, optimized joins, and window functions can dramatically improve execution efficiency.

  • Index design needs ongoing analysis of query patterns and data access requirements for sustainable performance.

  • Scalable systems depend on proactive monitoring and optimization cycles that prevent production bottlenecks.

Ce que vous apprendrez

  • Proactive resource management prevents performance degradation and ensures consistent query execution across diverse workloads and user groups.

  • Security through least-privilege access requires continuous monitoring and systematic auditing of permissions against actual business requirements.

  • Effective incident response depends on blameless post-mortem processes that focus on systemic improvements rather than individual accountability.

  • Operational excellence in data infrastructure requires balancing performance, security, and reliability engineering principles.

Compétences que vous acquerrez

Catégorie : Resource Management
Catégorie : Site Reliability Engineering
Catégorie : Capacity Management
Catégorie : Identity and Access Management
Catégorie : Data Security
Catégorie : Problem Management
Catégorie : Role-Based Access Control (RBAC)
Catégorie : Configuration Management
Catégorie : Compliance Auditing
Catégorie : Root Cause Analysis

Ce que vous apprendrez

  • Denormalization boosts query speed but demands careful analysis of consistency risks and maintenance costs.

  • Partitioning and clustering strategies must align with actual query patterns and access methods to deliver meaningful performance gains.

  • ER diagrams serve as documentation and validation tools, enabling better communication and system understanding.

  • Schema optimization balances query performance, data integrity, storage efficiency, and maintenance complexity.

Compétences que vous acquerrez

Catégorie : Database Design
Catégorie : SQL
Catégorie : Technical Documentation
Catégorie : Database Development
Catégorie : Snowflake Schema
Catégorie : Database Architecture and Administration
Catégorie : Data Modeling
Catégorie : Star Schema

Ce que vous apprendrez

  • Batch data transformation converts raw semi-structured data into analysis-ready formats that support enterprise decisions.

  • Workload analysis guides database design by linking access patterns and query frequency to performance and cost gains.

  • Migration choices must rely on performance testing and quantitative analysis to ensure ROI-driven transformations.

  • System performance depends on storage, queries, and hardware, requiring holistic technical and business evaluation.

Compétences que vous acquerrez

Catégorie : Database Management
Catégorie : Azure Synapse Analytics
Catégorie : Amazon Redshift
Catégorie : Database Design
Catégorie : Operational Databases
Catégorie : Data Architecture
Catégorie : Data Wrangling
Catégorie : Data Transformation
Catégorie : Apache Hive
Catégorie : Apache Cassandra

Ce que vous apprendrez

  • Slowly Changing Dimensions maintain historical data integrity and enable accurate, time-based enterprise analysis.

  • Analyzing data lifecycles balances storage costs with business value, guiding efficient archiving and retention.

  • Multi-cluster architectures isolate workloads, prevent contention, and enable cost control and performance optimization.

  • Sustainable scaling requires governance, automated resource management, and continuous monitoring of performance and cost.

Compétences que vous acquerrez

Catégorie : Data Analysis
Catégorie : Extract, Transform, Load
Catégorie : Expense Management
Catégorie : Descriptive Analytics
Catégorie : Data Storage
Catégorie : Cost Management
Catégorie : Cost Reduction
Catégorie : Cloud Computing Architecture
Catégorie : Data Architecture
Catégorie : Data Manipulation
Catégorie : Cost Control

Ce que vous apprendrez

  • Infrastructure as Code automates data platform deployments, replacing manual processes with version-controlled, repeatable systems.

  • Cost optimization uses performance benchmarking and data analysis to identify efficient compute/storage configs for specific workloads.

  • Business continuity requires proactive disaster recovery with automated failover and continuous replication for strict recovery goals.

  • Successful cloud data engineering balances performance, cost, and reliability through strategic design and continuous monitoring.

Compétences que vous acquerrez

Catégorie : Disaster Recovery
Catégorie : Business Continuity
Catégorie : AWS CloudFormation
Catégorie : IT Infrastructure
Catégorie : Automation
Catégorie : Data Infrastructure
Catégorie : Cost Management
Catégorie : Infrastructure as Code (IaC)
Catégorie : Cloud Computing Architecture
Catégorie : Cloud Deployment
Catégorie : Benchmarking
Catégorie : Data Architecture
Catégorie : Capacity Management
Catégorie : Data Warehousing
Catégorie : Business Continuity Planning
Catégorie : Terraform
Catégorie : Performance Analysis

Ce que vous apprendrez

  • Performance optimization is a systematic process requiring analysis of data access patterns, not random configuration changes.

  • Strategic partitioning minimizes expensive network shuffles and is the foundation of scalable Spark applications.

  • Intelligent caching of reusable intermediate datasets can dramatically reduce computation costs and improve job reliability.

  • The Spark UI provides actionable insights that guide optimization decisions and enable data-driven performance improvements.

Compétences que vous acquerrez

Catégorie : Apache Spark
Catégorie : Performance Tuning
Catégorie : PySpark
Catégorie : Data Pipelines
Catégorie : Systems Analysis
Catégorie : Data Processing

Ce que vous apprendrez

  • Performance bottlenecks in distributed systems often stem from uneven data distribution rather than insufficient computational resources.

  • Visual execution plan analysis is essential for identifying specific stages where data processing imbalances occur.

  • Proactive partition strategy selection prevents performance degradation more effectively than reactive optimization

  • Spark's shuffle.partitions configuration and broadcast join patterns are fundamental tools for sustainable pipeline optimization.

Compétences que vous acquerrez

Catégorie : Apache Spark
Catégorie : Performance Tuning
Catégorie : PySpark
Catégorie : Data Pipelines
Catégorie : Data Processing
Catégorie : Scalability
Catégorie : Debugging
Catégorie : Performance Analysis
Catégorie : Distributed Computing

Ce que vous apprendrez

  • Storage format choice strongly affects query performance and should match workload needs, not general assumptions.

  • Column storage suits read-heavy analytics, while row storage performs better for transactional and write-focused workloads.

  • Benchmarking with real datasets and queries offers the best basis for sound storage architecture decisions.

  • Compression and ingestion speed must be balanced carefully to align performance with business priorities.

Ce que vous apprendrez

  • Proactive performance monitoring prevents system failures and ensures consistent user experience across production environments.

  • Systematic diagnosis of query bottlenecks requires understanding both query logic efficiency and underlying resource limitations.

  • Strategic resource allocation combines technical optimization with business requirements to maintain service level agreements.

  • Continuous performance analysis creates a feedback loop that improves system reliability over time.

Ce que vous apprendrez

  • Inspect Spark UI and metrics (task duration, shuffle I/O, executor CPU/mem) to find bottlenecks and recommend actionable optimizations.

  • Apply partitioning and skew mitigation (salting/custom partitioner) & reduce shuffle (broadcast joins, avoid groupByKey, AQE) to improve parallelism.

  • Configure executors, cores, memory, dynamic allocation and parallelism/caching settings to maximize throughput while meeting defined SLA targets.

Compétences que vous acquerrez

Catégorie : Performance Tuning
Catégorie : Apache Spark
Catégorie : Database Management
Catégorie : PySpark
Catégorie : Performance Analysis
Catégorie : System Configuration
Catégorie : Job Analysis
Catégorie : Debugging
Catégorie : Process Optimization
Catégorie : Resource Allocation
Catégorie : Scalability

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Hurix Digital
Coursera
361 Cours 27 916 apprenants
Merna Elzahaby
Coursera
1 Cours 38 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions