z.B. Dieser Kurs richtet sich in erster Linie an Studenten im ersten und zweiten Studienjahr, die sich für Ingenieur- oder Naturwissenschaften interessieren, sowie an Gymnasiasten und Berufstätige mit Interesse an der ProgrammierungErwerben Sie die Fähigkeiten zum Aufbau effizienter und skalierbarer Datenpipelines. Lernen Sie die wichtigsten Data-Engineering-Plattformen (Hadoop, Spark und Snowflake) kennen und erfahren Sie, wie Sie diese optimieren und verwalten können. Lernen Sie Databricks kennen, eine leistungsstarke Plattform für die Durchführung von Datenanalysen und maschinellem Lernen, und vertiefen Sie Ihre Python-Kenntnisse in Data Science mit PySpark. Schließlich lernen Sie die Schlüsselkonzepte von MLflow kennen, einer Open-Source-Plattform für die Verwaltung des gesamten Lebenszyklus des maschinellen Lernens, und erfahren, wie Sie sie in Databricks integrieren können. Dieser Kurs richtet sich an Lernende, die ihre Karriere in den Bereichen Data Science oder Data Engineering verfolgen oder vorantreiben möchten, oder an Softwareentwickler oder Ingenieure, die ihre Kenntnisse im Bereich Datenmanagement erweitern möchten. Zusätzlich zu den Technologien, die Sie erlernen, erhalten Sie auch Methoden, die Ihnen helfen, Ihre Projektmanagement- und Workflow-Fähigkeiten für das Data Engineering zu verbessern, einschließlich der Anwendung von Kaizen-, DevOps- und Data Ops-Methoden und Best Practices. Mit Quizfragen, die Ihr Wissen während des gesamten Kurses testen, wird dieser umfassende Kurs Ihnen helfen, ein kompetenter Data Engineer zu werden, der bereit ist, die Herausforderungen der heutigen datengesteuerten Welt zu meistern.



Spark, Hadoop und Snowflake für Data Engineering
Dieser Kurs ist Teil von Spezialisierung für Angewandte Python Datentechnik



Dozenten: Noah Gift
13.281 bereits angemeldet
Bei enthalten
(61 Bewertungen)
Empfohlene Erfahrung
Was Sie lernen werden
Erstellung skalierbarer Datenpipelines (Hadoop, Spark, Snowflake, Databricks) für eine effiziente Datenverarbeitung.
Optimierung des Data Engineer mit Clustering und Skalierung zur Steigerung von Leistung und Ressourcennutzung.
Erstellung von ML-Lösungen (PySpark, MLFlow) auf Databricks für die nahtlose Entwicklung und Bereitstellung von Modellen.
Implementierung von DataOps- und DevOps-Verfahren für die kontinuierliche Integration und Bereitstellung (CI/CD) von datengesteuerten Anwendungen, einschließlich der Automatisierung von Prozessen.
Kompetenzen, die Sie erwerben
- Kategorie: PySpark
- Kategorie: Schneeflocken-Schema
- Kategorie: MLOps (Maschinelles Lernen Operations)
- Kategorie: Datenbausteine
- Kategorie: Datenumwandlung
- Kategorie: Apache Spark
- Kategorie: Big Data
- Kategorie: DevOps
- Kategorie: Datenqualität
- Kategorie: Data-Warehousing
- Kategorie: Datenverarbeitung
- Kategorie: Daten-Integration
- Kategorie: SQL
- Kategorie: Daten-Pipelines
- Kategorie: Python-Programmierung
- Kategorie: Apache Hadoop
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
21 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 4 Module
In diesem Modul lernen Sie, wie Sie mit verschiedenen Data-Engineering-Plattformen wie Hadoop und Spark arbeiten und deren Konzepte auf reale Szenarien anwenden. Zunächst werden Sie die Grundlagen von Hadoop zum Speichern und Verarbeiten von Big Data kennenlernen. Danach werden Sie sich mit Spark-Konzepten, verteiltem Rechnen, zeitversetzter Ausführung und Spark SQL beschäftigen. Am Ende der Woche werden Sie praktische Erfahrungen mit PySpark DataFrames, DataFrame-Methoden und Strategien zur zeitversetzten Ausführung sammeln.
Das ist alles enthalten
10 Videos10 Lektüren7 Aufgaben1 Diskussionsthema2 Unbewertete Labore
In diesem Modul lernen Sie die Snowflake-Plattform kennen und erhalten einen Einblick in die Architektur und die wichtigsten Konzepte. Durch praktische Übungen in der Snowflake Web UI lernen Sie, Tabellen zu erstellen, Warehouses zu verwalten und den Snowflake Python Connector zur Interaktion mit Tabellen zu nutzen. Am Ende dieser Woche werden Sie Ihr Verständnis für die Architektur und die praktischen Anwendungen von Snowflake gefestigt haben und in der Lage sein, die Plattform für das Datenmanagement und die Datenanalyse effektiv zu navigieren und zu nutzen.
Das ist alles enthalten
8 Videos5 Lektüren6 Aufgaben
In diesem Modul üben Sie die wesentlichen Fähigkeiten für die nahtlose Verwaltung von Workflows für maschinelles Lernen mit Databricks und MLFlow. Zunächst werden Sie einen Databricks-Arbeitsbereich erstellen und einen Cluster konfigurieren, um die Voraussetzungen für eine effiziente Datenanalyse zu schaffen. Als Nächstes laden Sie einen Beispieldatensatz in den Databricks-Arbeitsbereich und nutzen die Leistungsfähigkeit von PySpark, um Datenmanipulation und -exploration zu ermöglichen. Schließlich installieren Sie MLFlow entweder lokal oder in der Databricks-Umgebung und erlangen so die Fähigkeit, den gesamten Lebenszyklus des maschinellen Lernens zu orchestrieren. Am Ende dieser Woche werden Sie in der Lage sein, Experimente zum maschinellen Lernen in Databricks zu erstellen, zu verfolgen und zu verwalten, um Präzision, Reproduzierbarkeit und optimale Entscheidungsfindung während Ihrer datengesteuerten Reise zu gewährleisten.
Das ist alles enthalten
16 Videos7 Lektüren4 Aufgaben1 Unbewertetes Labor
In diesem Modul werden Sie die Konzepte von Kaizen, DevOps und DataOps kennenlernen und erfahren, wie diese Methoden synergetisch zu effizienten und nahtlosen Data-Engineering-Workflows beitragen. Anhand praktischer Beispiele lernen Sie, wie die Philosophie der kontinuierlichen Verbesserung von Kaizen, die kollaborativen Praktiken von DevOps und der Fokus von DataOps auf Datenqualität und -integration zusammenkommen, um die Entwicklung, Bereitstellung und Verwaltung von Data-Engineering-Plattformen zu verbessern. Am Ende dieser Woche werden Sie über das Wissen und die Perspektive verfügen, die Sie benötigen, um Data-Engineering-Prozesse zu optimieren und skalierbare, zuverlässige und hochwertige Lösungen zu liefern.
Das ist alles enthalten
21 Videos7 Lektüren4 Aufgaben1 Unbewertetes Labor
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Mehr von Maschinelles Lernen entdecken
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Status: Kostenloser TestzeitraumDuke University
Status: Kostenloser Testzeitraum
Warum entscheiden sich Menschen für Coursera für ihre Karriere?




Bewertungen von Lernenden
61 Bewertungen
- 5 stars
53,22 %
- 4 stars
16,12 %
- 3 stars
9,67 %
- 2 stars
9,67 %
- 1 star
11,29 %
Zeigt 3 von 61 an
Geprüft am 15. Jan. 2024
A course that cover all aspects basic of data engineer, i love it
Geprüft am 6. Aug. 2024
Great course, detailed steps by step walkthrough that really simplifies understanding

Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.
Ja. Für ausgewählte Lernprogramme können Sie eine finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Anmeldungsgebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.
Weitere Fragen
Finanzielle Unterstützung verfügbar,

