Coursera

Spezialisierung „Building Smarter Data Pipelines: SQL, Spark, Kafka & GenAI “

Sparen Sie mit 40% Rabatt auf 3 Monate Coursera Plus bei den Fähigkeiten, die Sie zum Strahlen bringen. Jetzt sparen

Coursera

Spezialisierung „Building Smarter Data Pipelines: SQL, Spark, Kafka & GenAI “

Build Scalable Data Engineering Systems.

Learn to design, implement, and optimize data pipelines using industry-standard tools and frameworks

Caio Avelino
Starweaver
Soheil Haddadi

Dozenten: Caio Avelino

1.938 bereits angemeldet

Bei Coursera Plus enthalten

Befassen Sie sich eingehend mit einem Thema

aus 98 Bewertungen von Kursen in diesem Programm

Stufe Mittel

Empfohlene Erfahrung

4 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Befassen Sie sich eingehend mit einem Thema

aus 98 Bewertungen von Kursen in diesem Programm

Stufe Mittel

Empfohlene Erfahrung

4 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Design and implement scalable data ingestion, processing, and storage systems using Apache Kafka and Spark

  • Build high-performance data pipelines integrating cloud platforms, databases, and generative AI technologies

  • Apply data engineering best practices for enterprise-scale analytics, optimization, and real-time processing

Kompetenzen, die Sie erwerben

  • Kategorie: Business Intelligence
  • Kategorie: Cloud Computing Architecture
  • Kategorie: Cloud Infrastructure
  • Kategorie: Data Governance
  • Kategorie: Data Modeling
  • Kategorie: Data Pipelines
  • Kategorie: Data Quality
  • Kategorie: Data Warehousing
  • Kategorie: Database Design
  • Kategorie: Extract, Transform, Load
  • Kategorie: Performance Tuning
  • Kategorie: Quality Management
  • Kategorie: Real Time Data
  • Kategorie: Responsible AI
  • Kategorie: SQL

Werkzeuge, die Sie lernen werden

  • Kategorie: Apache Hadoop
  • Kategorie: Apache Kafka
  • Kategorie: Apache Spark
  • Kategorie: Generative AI
  • Kategorie: Microsoft SQL Servers

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse.

  • Erlernen Sie gefragte Kompetenzen von Universitäten und Branchenexperten.
  • Erlernen Sie ein Thema oder ein Tool mit echten Projekten.
  • Entwickeln Sie ein fundiertes Verständnisse der Kernkonzepte.
  • Erwerben Sie ein Karrierezertifikat von Coursera.

Spezialisierung - 8 Kursreihen

Data Engineering: Pipelines, ETL, Hadoop

Data Engineering: Pipelines, ETL, Hadoop

KURS 1, 3 Stunden

Was Sie lernen werden

  • Analyse the architecture and components of data pipelines to understand their impact on data flow and processing efficiency.

  • Implement robust ETL processes, for scalability and maintainability.

  • Analyze big data challenges and introduce Hadoop ecosystem tools (HDFS, MapReduce, Hive, Pig, and Spark) for data processing tasks.

Kompetenzen, die Sie erwerben

Kategorie: Extract, Transform, Load
Kategorie: Data Pipelines
Kategorie: Apache Hadoop
Kategorie: Data Collection
Kategorie: Data Management
Kategorie: Data-Driven Decision-Making
Kategorie: Data Analysis
Kategorie: Data Warehousing
Kategorie: Apache Spark
Kategorie: Data Strategy
Kategorie: Data Import/Export
Kategorie: Data Integration
Kategorie: Big Data
Kategorie: Dataflow
Kategorie: Data Processing
Kategorie: Scalability
Kategorie: Data Architecture
Kategorie: Apache Hive
Kategorie: Data Capture
Kategorie: Data Transformation
Engineering Data Ecosystems: Pipelines, ETL, Spark

Engineering Data Ecosystems: Pipelines, ETL, Spark

KURS 2, 3 Stunden

Was Sie lernen werden

  • Identify and describe the components and importance of data ecosystems.

  • Understand the basic structure and function of data pipelines.

  • Recognize the steps involved in ETL workflows and their role in data handling.

  • Gain an introductory knowledge of big data and the application of Apache Spark.

Kompetenzen, die Sie erwerben

Kategorie: Apache Spark
Kategorie: Extract, Transform, Load
Kategorie: Data Pipelines
Kategorie: Dataflow
Kategorie: Data Integration
Kategorie: Data Management
Kategorie: Data Processing
Kategorie: Big Data
Data Warehousing: Schema, ETL, Optimal Performance

Data Warehousing: Schema, ETL, Optimal Performance

KURS 3, 3 Stunden

Was Sie lernen werden

  • Explain the importance of data warehousing in business intelligence.

  • Design and implement effective schema designs for data warehouses.

  • Implement ETL processes to load and transform data into a data warehouse.

  • Apply performance optimization techniques to enhance data warehouse efficiency.

Kompetenzen, die Sie erwerben

Kategorie: Extract, Transform, Load
Kategorie: Query Languages
Kategorie: Data Warehousing
Kategorie: Data Integration
Kategorie: Data Modeling
Kategorie: Database Design
Kategorie: Data Transformation
Kategorie: Business Intelligence
Kategorie: Data Management
Kategorie: Performance Improvement
Kategorie: Databases
Kategorie: Performance Tuning
Microsoft SQL Server: Performance Tuning Essentials

Microsoft SQL Server: Performance Tuning Essentials

KURS 4, 3 Stunden

Was Sie lernen werden

  • Analyze and tune SQL queries to enhance SQL performance and reduce application latency.

  • Evaluate effective database index and maintenance task strategies to improve efficiency.

  • Monitor the performance of troubleshooting techniques used for resolving common SQL server issues.

  • Apply best practices for SQL Server performance to ensure consistent and reliable operations.

Kompetenzen, die Sie erwerben

Kategorie: SQL
Kategorie: Microsoft SQL Servers
Kategorie: Performance Tuning
Kategorie: System Monitoring
Kategorie: Database Management
Kategorie: Application Performance Management
Kategorie: Query Languages
Kategorie: Database Management Systems
Cloud Architecture Design Patterns

Cloud Architecture Design Patterns

KURS 5, 3 Stunden

Was Sie lernen werden

  • Show understanding of the fundamentals of cloud architecture, including key components like virtual machines, storage, and networking.

  • Identify and implement core cloud design patterns such as Load Balancer, Circuit Breaker, and Auto-Scaling to ensure scalability and reliability.

  • Demonstrate advanced cloud design patterns, including Microservices Architecture, Event-Driven Architecture, and Serverless Computing.

Kompetenzen, die Sie erwerben

Kategorie: Cloud Computing Architecture
Kategorie: Load Balancing
Kategorie: Serverless Computing
Kategorie: Microservices
Kategorie: Scalability
Kategorie: Cloud Computing
Kategorie: Cloud Solutions
Kategorie: Software Architecture
Kategorie: Cloud Services
Kategorie: Cloud Infrastructure
Kategorie: Cloud Platforms
Kategorie: Cloud Deployment
Kategorie: Event-Driven Programming
Kategorie: Infrastructure As A Service (IaaS)
Kategorie: Software Design Patterns
GenAI for Data Engineers: Scaling with GenAI

GenAI for Data Engineers: Scaling with GenAI

KURS 6, 3 Stunden

Was Sie lernen werden

  • Identify the capabilities of GenAI for basic role specific, Data Engineer functions.

  • Examine real-world applications to leverage GenAI for streamlining work and fostering innovation in Data Engineering functions.

  • Deploy strategies and tactics to responsibly integrate GenAI into data engineering practices, while maintaining human oversight and accountability.

Kompetenzen, die Sie erwerben

Kategorie: Generative AI
Kategorie: Data Pipelines
Kategorie: Responsible AI
Kategorie: Data Transformation
Kategorie: SQL
Kategorie: Data Modeling
Apache Kafka - An Introduction

Apache Kafka - An Introduction

KURS 7, 3 Stunden

Was Sie lernen werden

  • Describe Apache Kafka's architecture and its components, enhancing data pipeline efficiency.

  • Configure and manage Kafka clusters, ensuring high availability and fault tolerance.

  • Apply (Create and use) topics, publishers, and subscribers to facilitate real-time data exchange.

  • Implement basic stream processing applications using Kafka Streams, addressing real-world data challenges.

Kompetenzen, die Sie erwerben

Kategorie: Real Time Data
Kategorie: Scalability
Kategorie: Apache Kafka
Kategorie: Data Pipelines
Kategorie: Data Processing
Smart Data Cleaning with Generative AI

Smart Data Cleaning with Generative AI

KURS 8, 7 Stunden

Was Sie lernen werden

Kompetenzen, die Sie erwerben

Kategorie: Data Cleansing
Kategorie: Automation
Kategorie: Generative AI
Kategorie: Responsible AI
Kategorie: Data Preprocessing
Kategorie: Alteryx
Kategorie: Data Validation
Kategorie: Tensorflow
Kategorie: OpenAI
Kategorie: Data Quality

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozenten

Caio Avelino
9 Kurse8.605 Lernende
Starweaver
Coursera
560 Kurse1.106.102 Lernende
Soheil Haddadi
Coursera
6 Kurse5.649 Lernende

von

Coursera

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen