Der Kurs Big Data Analytics bietet einen tiefen Einblick in die Technologien, Werkzeuge und Techniken, die zur Verarbeitung und Analyse großer Datenmengen verwendet werden. Die Teilnehmer lernen die Ökosysteme von Hadoop und Spark kennen und sammeln praktische Erfahrungen mit wichtigen Komponenten wie dem Hadoop Distributed File System (HDFS), MapReduce, Pig und Hive. Der Kurs deckt auch relationale (SQL) und nicht-relationale (NoSQL) Datenbanken ab und hilft den Lernenden, die geeigneten Kontexte für jede Art der Datenspeicherung zu verstehen. Ein wesentlicher Schwerpunkt liegt auf Apache Spark, das für seine Hochgeschwindigkeits- und In-Memory-Datenverarbeitungsfunktionen bekannt ist, die für die Handhabung von Big Data-Anwendungen unerlässlich sind. Die Kursteilnehmer werden auch praktische Übungen durchführen, einschließlich der Implementierung und Bereitstellung einer Anwendung für maschinelles Lernen, die Streaming-Daten in der Cloud verarbeitet. Dieser Kurs richtet sich an Fachleute mit Kenntnissen in Predictive Analytics, grundlegendem SQL und Python-Programmierung und vermittelt den Kursteilnehmern die praktischen Fähigkeiten zur Verwaltung von Daten, die sich durch hohes Datenvolumen, Geschwindigkeit und Vielfalt auszeichnen. Am Ende des Kurses werden die Teilnehmer in der Lage sein, umsetzbare Erkenntnisse aus Big Data abzuleiten und sie in geschäftlichen Kontexten anzuwenden, was zu einer verbesserten Entscheidungsfindung und einem Wettbewerbsvorteil in datengesteuerten Umgebungen beiträgt.



Empfohlene Erfahrung
Was Sie lernen werden
Gewinnen Sie ein tiefes Verständnis der Hadoop- und Spark-Ökosysteme für die Verwaltung von Big Data. Machen Sie sich mit Tools wie Hive und Pig vertraut, um große Datenmengen abzufragen.
Kompetenzen, die Sie erwerben
- Kategorie: Big Data
- Kategorie: Analytics
- Kategorie: SQL
- Kategorie: Datenbanken
- Kategorie: Angewandtes maschinelles Lernen
- Kategorie: Apache Spark
- Kategorie: Apache Hadoop
- Kategorie: Data-Mining
- Kategorie: Technologien zur Datenspeicherung
- Kategorie: Verteiltes Rechnen
- Kategorie: NoSQL
- Kategorie: Abfragesprachen
- Kategorie: Daten in Echtzeit
- Kategorie: Datenverarbeitung
- Kategorie: Apache Hive
- Kategorie: Skriptsprachen
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
Juni 2025
16 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

In diesem Kurs gibt es 11 Module
Willkommen zum Kurs Big Data Analytics! Am Ende dieses Kurses werden Sie ein Verständnis für die verschiedenen Technologien im Zusammenhang mit Hadoop und dem Spark-Ökosystem von Tools und Technologien entwickeln. Sie werden praktische Erfahrungen mit Hadoop-Kernkomponenten wie MapReduce und dem Hadoop Distributed File System (HDFS) sammeln. Sie werden lernen, Pig-Skripte und Hive-Abfragen zu schreiben und Daten zu extrahieren, die in Hadoop-Clustern gespeichert sind. Sie werden auch etwas über relationale (SQL) und nicht-relationale (NoSQL) Datenbanken erfahren und Szenarien diskutieren, in denen eine der beiden für die Datenspeicherung vorzuziehen ist. Sie werden auch einen Einblick in das Spark-Ökosystem erhalten, das die Ausführung von Aufträgen über Cluster hinweg sehr schnell macht und dadurch mehrere neue Anwendungen ermöglicht. Sie werden auch ein praktisches Beispiel für die Implementierung und Bereitstellung einer Anwendung für Maschinelles Lernen kennenlernen, die Streaming-Daten in der Cloud verarbeitet. Dies ist ein Kurs für Fortgeschrittene, der sich an Teilnehmer richtet, die bereits Erfahrung im Umgang mit Vorhersage-Tools und -Techniken haben, grundlegende Abfragen in Structured Query Language (SQL) schreiben können und mit der Programmierung in Python vertraut sind. Das Wissen, das Sie in diesem Kurs erwerben, wird Ihnen helfen, eine Karriere als Business-Analyst zu machen. Sie erlangen die Fähigkeit, Erkenntnisse aus Daten zu gewinnen, die sich durch eine hohe Geschwindigkeit, ein hohes Volumen und eine große Vielfalt auszeichnen. Daten mit solchen Merkmalen werden als Big Data bezeichnet und werden von Unternehmen zunehmend für Wettbewerbsvorteile und Entscheidungsfindung genutzt. In diesem Modul lernen Sie Big Data-Anwendungen und die verschiedenen Komponenten des Hadoop-Ökosystems kennen. Das Modul behandelt auch das MapReduce-Paradigma, das die verteilte Verarbeitung von Daten ermöglicht. Sie erhalten außerdem einen Einblick in das HDFS und dessen Verwendung zur Speicherung von Dateien. Die praktischen Beispiele werden mit der Hortonworks Data Platform Sandbox durchgeführt, die auf einem Windows/Mac-Computer mit mindestens 8 GB verfügbarem RAM installiert werden kann.
Das ist alles enthalten
13 Videos4 Lektüren2 Aufgaben1 Diskussionsthema
Diese Bewertung ist ein benotetes Quiz, das auf dem in dieser Woche behandelten Modul basiert.
Das ist alles enthalten
1 Aufgabe
In diesem Modul lernen Sie die Skriptsprache Hive und ihre Verwendung für das Mining von Daten aus Hadoop-Clustern kennen. Hive bietet einen SQL-Dialekt namens Hive Query Language (abgekürzt HiveQL oder einfach HQL) für die Abfrage von Daten, die in einem Hadoop-Cluster gespeichert sind. Hive eignet sich am besten für Data Warehouse-Anwendungen, bei denen relativ statische Daten analysiert werden, keine schnellen Antwortzeiten erforderlich sind und die Daten sich nicht schnell ändern. Im Vergleich zu anderen Hadoop-Sprachen und -Werkzeugen können Entwickler mit Hive SQL-basierte Anwendungen leichter auf Hadoop portieren. Wie alle weit verbreiteten SQL-Dialekte entspricht Hive nicht vollständig einer bestimmten Revision des ANSI-SQL-Standards. Er kommt vielleicht dem MySQL-Dialekt am nächsten, weist aber erhebliche Unterschiede auf. Hive unterstützt verschiedene Größen von Ganzzahl- und Fließkommatypen, einen Booleschen Typ und Zeichenfolgen beliebiger Länge. Zuletzt werden Sie einen realen Datensatz in die Ambari-Umgebung laden, um ihn mit HDFS und HQL zu analysieren. Sie werden den Prozess des Erstellens von Tabellen, des Ladens von Daten und deren Analyse mit Hilfe einer Hive Abfragesprache durchlaufen.
Das ist alles enthalten
9 Videos2 Lektüren2 Aufgaben1 Diskussionsthema
Diese Bewertung ist ein benotetes Quiz, das auf den in dieser Woche behandelten Modulen basiert
Das ist alles enthalten
1 Aufgabe
In diesem Modul lernen Sie die Skriptsprache Pig Latin kennen und erfahren, wie Sie sie zur Abfrage von Big Data auf Hadoop-Clustern einsetzen können. Sie lernen auch die verschiedenen Datentypen und Befehle kennen, die in der Sprache Pig Latin zur Verfügung stehen, und wie diese zur Definition und Manipulation von Daten im Hadoop-Ökosystem verwendet werden können. Darüber hinaus werden Sie an einem praktischen Beispiel eines öffentlich verfügbaren Datensatzes arbeiten, um Pig Latin-Skripte für die Datenanalyse auszuführen.
Das ist alles enthalten
7 Videos2 Lektüren2 Aufgaben
In diesem Modul werden Sie mit der Notwendigkeit von NoSQL Datenbanken vertraut gemacht. Sie werden auch HBase, eine NoSQL Datenbank, und ihre Rolle im Hadoop Ökosystem kennenlernen. Sie lernen das CAP-Theorem kennen und erfahren, wie es sich auf die Abwägung zwischen den verschiedenen NoSQL-Datenbanken in Hadoop auswirkt. Sie werden auch mehr über CAP-Konsistenz, Verfügbarkeit und Partitionstoleranz erfahren und wie diese unsere Wahl der Technologie für den Zugriff auf und die Bearbeitung von Daten in Hadoop beeinflussen. Schließlich erhalten Sie einen Einblick in andere aufkommende Cloud-basierte NoSQL-Lösungen.
Das ist alles enthalten
8 Videos2 Lektüren2 Aufgaben1 Diskussionsthema
Diese Bewertung ist ein benotetes Quiz, das auf den in dieser Woche behandelten Modulen basiert.
Das ist alles enthalten
1 Aufgabe
In diesem Modul werden Sie mit der beliebten Apache Spark-Plattform für die Verarbeitung von Big Data vertraut gemacht. Sie werden die Schlüsselkomponenten von Apache Spark kennenlernen, die erhebliche Vorteile beim verteilten Rechnen bieten. Sie werden auch mit den Resilient Distributed Datastores (RDD) und den Spark DataFrames vertraut gemacht. Darüber hinaus werden Sie mit Spark SQL und Spark Streaming vertraut gemacht.
Das ist alles enthalten
11 Videos4 Lektüren2 Aufgaben1 Diskussionsthema
Diese Bewertung ist ein benotetes Quiz, das auf dem in dieser Woche behandelten Modul basiert.
Das ist alles enthalten
1 Aufgabe
In diesem Modul lernen Sie MLlib kennen, das für Vorhersagen auf großen Datenmengen verwendet wird, die eine verteilte Verarbeitung erfordern. Sie werden an Regressions- und Klassifizierungsaufgaben für große Datensätze arbeiten. Anschließend wird eine praktische Übung mit Streaming-Daten aus der Twitter API durchgeführt. Dabei handelt es sich um eine prädiktive Streaming-Anwendung, die den Teilnehmern ein End-to-End-Szenario für Big Data zeigt.
Das ist alles enthalten
8 Videos3 Lektüren2 Aufgaben
Video zur Kursnachbereitung
Das ist alles enthalten
1 Video
Auf einen Abschluss hinarbeiten
Dieses Kurs ist Teil des/der folgenden Studiengangs/Studiengänge, die von O.P. Jindal Global Universityangeboten werden. Wenn Sie zugelassen werden und sich immatrikulieren, können Ihre abgeschlossenen Kurse auf Ihren Studienabschluss angerechnet werden und Ihre Fortschritte können mit Ihnen übertragen werden.¹
Dozent

Mehr von Datenanalyse entdecken
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Status: VorschauAlibaba Cloud Academy
Status: Vorschau
Warum entscheiden sich Menschen für Coursera für ihre Karriere?





Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Wenn Sie ein Zertifikat erwerben, erhalten Sie Zugang zu allen Kursmaterialien, einschließlich der benoteten Aufgaben. Nach Abschluss des Kurses wird Ihr elektronisches Zertifikat zu Ihrer Erfolgsseite hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen.
Ja. Für ausgewählte Lernprogramme können Sie eine finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Anmeldungsgebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.
Weitere Fragen
Finanzielle Unterstützung verfügbar,

