Duke University
Spark, Hadoop und Snowflake für Data Engineering

Mit Coursera Plus Zugang zu mehr als 10.000 Kursen freischalten

Duke University

Spark, Hadoop und Snowflake für Data Engineering

Noah Gift
Kennedy Behrman
Matt Harrison

Dozenten: Noah Gift

13.281 bereits angemeldet

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
3.9

(61 Bewertungen)

Stufe Fortgeschritten

Empfohlene Erfahrung

3 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
3.9

(61 Bewertungen)

Stufe Fortgeschritten

Empfohlene Erfahrung

3 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Erstellung skalierbarer Datenpipelines (Hadoop, Spark, Snowflake, Databricks) für eine effiziente Datenverarbeitung.

  • Optimierung des Data Engineer mit Clustering und Skalierung zur Steigerung von Leistung und Ressourcennutzung.

  • Erstellung von ML-Lösungen (PySpark, MLFlow) auf Databricks für die nahtlose Entwicklung und Bereitstellung von Modellen.

  • Implementierung von DataOps- und DevOps-Verfahren für die kontinuierliche Integration und Bereitstellung (CI/CD) von datengesteuerten Anwendungen, einschließlich der Automatisierung von Prozessen.

Kompetenzen, die Sie erwerben

  • Kategorie: PySpark
  • Kategorie: Schneeflocken-Schema
  • Kategorie: MLOps (Maschinelles Lernen Operations)
  • Kategorie: Datenbausteine
  • Kategorie: Datenumwandlung
  • Kategorie: Apache Spark
  • Kategorie: Big Data
  • Kategorie: DevOps
  • Kategorie: Datenqualität
  • Kategorie: Data-Warehousing
  • Kategorie: Datenverarbeitung
  • Kategorie: Daten-Integration
  • Kategorie: SQL
  • Kategorie: Daten-Pipelines
  • Kategorie: Python-Programmierung
  • Kategorie: Apache Hadoop

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

21 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung für Angewandte Python Datentechnik
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 4 Module

In diesem Modul lernen Sie, wie Sie mit verschiedenen Data-Engineering-Plattformen wie Hadoop und Spark arbeiten und deren Konzepte auf reale Szenarien anwenden. Zunächst werden Sie die Grundlagen von Hadoop zum Speichern und Verarbeiten von Big Data kennenlernen. Danach werden Sie sich mit Spark-Konzepten, verteiltem Rechnen, zeitversetzter Ausführung und Spark SQL beschäftigen. Am Ende der Woche werden Sie praktische Erfahrungen mit PySpark DataFrames, DataFrame-Methoden und Strategien zur zeitversetzten Ausführung sammeln.

Das ist alles enthalten

10 Videos10 Lektüren7 Aufgaben1 Diskussionsthema2 Unbewertete Labore

In diesem Modul lernen Sie die Snowflake-Plattform kennen und erhalten einen Einblick in die Architektur und die wichtigsten Konzepte. Durch praktische Übungen in der Snowflake Web UI lernen Sie, Tabellen zu erstellen, Warehouses zu verwalten und den Snowflake Python Connector zur Interaktion mit Tabellen zu nutzen. Am Ende dieser Woche werden Sie Ihr Verständnis für die Architektur und die praktischen Anwendungen von Snowflake gefestigt haben und in der Lage sein, die Plattform für das Datenmanagement und die Datenanalyse effektiv zu navigieren und zu nutzen.

Das ist alles enthalten

8 Videos5 Lektüren6 Aufgaben

In diesem Modul üben Sie die wesentlichen Fähigkeiten für die nahtlose Verwaltung von Workflows für maschinelles Lernen mit Databricks und MLFlow. Zunächst werden Sie einen Databricks-Arbeitsbereich erstellen und einen Cluster konfigurieren, um die Voraussetzungen für eine effiziente Datenanalyse zu schaffen. Als Nächstes laden Sie einen Beispieldatensatz in den Databricks-Arbeitsbereich und nutzen die Leistungsfähigkeit von PySpark, um Datenmanipulation und -exploration zu ermöglichen. Schließlich installieren Sie MLFlow entweder lokal oder in der Databricks-Umgebung und erlangen so die Fähigkeit, den gesamten Lebenszyklus des maschinellen Lernens zu orchestrieren. Am Ende dieser Woche werden Sie in der Lage sein, Experimente zum maschinellen Lernen in Databricks zu erstellen, zu verfolgen und zu verwalten, um Präzision, Reproduzierbarkeit und optimale Entscheidungsfindung während Ihrer datengesteuerten Reise zu gewährleisten.

Das ist alles enthalten

16 Videos7 Lektüren4 Aufgaben1 Unbewertetes Labor

In diesem Modul werden Sie die Konzepte von Kaizen, DevOps und DataOps kennenlernen und erfahren, wie diese Methoden synergetisch zu effizienten und nahtlosen Data-Engineering-Workflows beitragen. Anhand praktischer Beispiele lernen Sie, wie die Philosophie der kontinuierlichen Verbesserung von Kaizen, die kollaborativen Praktiken von DevOps und der Fokus von DataOps auf Datenqualität und -integration zusammenkommen, um die Entwicklung, Bereitstellung und Verwaltung von Data-Engineering-Plattformen zu verbessern. Am Ende dieser Woche werden Sie über das Wissen und die Perspektive verfügen, die Sie benötigen, um Data-Engineering-Prozesse zu optimieren und skalierbare, zuverlässige und hochwertige Lösungen zu liefern.

Das ist alles enthalten

21 Videos7 Lektüren4 Aufgaben1 Unbewertetes Labor

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozenten

Lehrkraftbewertungen
3.8 (16 Bewertungen)
Noah Gift
Duke University
40 Kurse205.349 Lernende

von

Duke University

Mehr von Maschinelles Lernen entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Bewertungen von Lernenden

3.9

61 Bewertungen

  • 5 stars

    53,22 %

  • 4 stars

    16,12 %

  • 3 stars

    9,67 %

  • 2 stars

    9,67 %

  • 1 star

    11,29 %

Zeigt 3 von 61 an

VD
5

Geprüft am 15. Jan. 2024

MK
5

Geprüft am 6. Aug. 2024

Coursera Plus

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen