Mit Coursera Plus Zugang zu mehr als 10.000 Kursen freischalten

O.P. Jindal Global University

Big Data-Analytik

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Anfänger

Empfohlene Erfahrung

3 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Auf einen Abschluss hinarbeiten
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Anfänger

Empfohlene Erfahrung

3 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Auf einen Abschluss hinarbeiten

Was Sie lernen werden

  • Gewinnen Sie ein tiefes Verständnis der Hadoop- und Spark-Ökosysteme für die Verwaltung von Big Data. Machen Sie sich mit Tools wie Hive und Pig vertraut, um große Datenmengen abzufragen.

Kompetenzen, die Sie erwerben

  • Kategorie: Big Data
  • Kategorie: Analytics
  • Kategorie: SQL
  • Kategorie: Datenbanken
  • Kategorie: Angewandtes maschinelles Lernen
  • Kategorie: Apache Spark
  • Kategorie: Apache Hadoop
  • Kategorie: Data-Mining
  • Kategorie: Technologien zur Datenspeicherung
  • Kategorie: Verteiltes Rechnen
  • Kategorie: NoSQL
  • Kategorie: Abfragesprachen
  • Kategorie: Daten in Echtzeit
  • Kategorie: Datenverarbeitung
  • Kategorie: Apache Hive
  • Kategorie: Skriptsprachen

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

Juni 2025

Bewertungen

16 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

In diesem Kurs gibt es 11 Module

Willkommen zum Kurs Big Data Analytics! Am Ende dieses Kurses werden Sie ein Verständnis für die verschiedenen Technologien im Zusammenhang mit Hadoop und dem Spark-Ökosystem von Tools und Technologien entwickeln. Sie werden praktische Erfahrungen mit Hadoop-Kernkomponenten wie MapReduce und dem Hadoop Distributed File System (HDFS) sammeln. Sie werden lernen, Pig-Skripte und Hive-Abfragen zu schreiben und Daten zu extrahieren, die in Hadoop-Clustern gespeichert sind. Sie werden auch etwas über relationale (SQL) und nicht-relationale (NoSQL) Datenbanken erfahren und Szenarien diskutieren, in denen eine der beiden für die Datenspeicherung vorzuziehen ist. Sie werden auch einen Einblick in das Spark-Ökosystem erhalten, das die Ausführung von Aufträgen über Cluster hinweg sehr schnell macht und dadurch mehrere neue Anwendungen ermöglicht. Sie werden auch ein praktisches Beispiel für die Implementierung und Bereitstellung einer Anwendung für Maschinelles Lernen kennenlernen, die Streaming-Daten in der Cloud verarbeitet. Dies ist ein Kurs für Fortgeschrittene, der sich an Teilnehmer richtet, die bereits Erfahrung im Umgang mit Vorhersage-Tools und -Techniken haben, grundlegende Abfragen in Structured Query Language (SQL) schreiben können und mit der Programmierung in Python vertraut sind. Das Wissen, das Sie in diesem Kurs erwerben, wird Ihnen helfen, eine Karriere als Business-Analyst zu machen. Sie erlangen die Fähigkeit, Erkenntnisse aus Daten zu gewinnen, die sich durch eine hohe Geschwindigkeit, ein hohes Volumen und eine große Vielfalt auszeichnen. Daten mit solchen Merkmalen werden als Big Data bezeichnet und werden von Unternehmen zunehmend für Wettbewerbsvorteile und Entscheidungsfindung genutzt. In diesem Modul lernen Sie Big Data-Anwendungen und die verschiedenen Komponenten des Hadoop-Ökosystems kennen. Das Modul behandelt auch das MapReduce-Paradigma, das die verteilte Verarbeitung von Daten ermöglicht. Sie erhalten außerdem einen Einblick in das HDFS und dessen Verwendung zur Speicherung von Dateien. Die praktischen Beispiele werden mit der Hortonworks Data Platform Sandbox durchgeführt, die auf einem Windows/Mac-Computer mit mindestens 8 GB verfügbarem RAM installiert werden kann.

Das ist alles enthalten

13 Videos4 Lektüren2 Aufgaben1 Diskussionsthema

Diese Bewertung ist ein benotetes Quiz, das auf dem in dieser Woche behandelten Modul basiert.

Das ist alles enthalten

1 Aufgabe

In diesem Modul lernen Sie die Skriptsprache Hive und ihre Verwendung für das Mining von Daten aus Hadoop-Clustern kennen. Hive bietet einen SQL-Dialekt namens Hive Query Language (abgekürzt HiveQL oder einfach HQL) für die Abfrage von Daten, die in einem Hadoop-Cluster gespeichert sind. Hive eignet sich am besten für Data Warehouse-Anwendungen, bei denen relativ statische Daten analysiert werden, keine schnellen Antwortzeiten erforderlich sind und die Daten sich nicht schnell ändern. Im Vergleich zu anderen Hadoop-Sprachen und -Werkzeugen können Entwickler mit Hive SQL-basierte Anwendungen leichter auf Hadoop portieren. Wie alle weit verbreiteten SQL-Dialekte entspricht Hive nicht vollständig einer bestimmten Revision des ANSI-SQL-Standards. Er kommt vielleicht dem MySQL-Dialekt am nächsten, weist aber erhebliche Unterschiede auf. Hive unterstützt verschiedene Größen von Ganzzahl- und Fließkommatypen, einen Booleschen Typ und Zeichenfolgen beliebiger Länge. Zuletzt werden Sie einen realen Datensatz in die Ambari-Umgebung laden, um ihn mit HDFS und HQL zu analysieren. Sie werden den Prozess des Erstellens von Tabellen, des Ladens von Daten und deren Analyse mit Hilfe einer Hive Abfragesprache durchlaufen.

Das ist alles enthalten

9 Videos2 Lektüren2 Aufgaben1 Diskussionsthema

Diese Bewertung ist ein benotetes Quiz, das auf den in dieser Woche behandelten Modulen basiert

Das ist alles enthalten

1 Aufgabe

In diesem Modul lernen Sie die Skriptsprache Pig Latin kennen und erfahren, wie Sie sie zur Abfrage von Big Data auf Hadoop-Clustern einsetzen können. Sie lernen auch die verschiedenen Datentypen und Befehle kennen, die in der Sprache Pig Latin zur Verfügung stehen, und wie diese zur Definition und Manipulation von Daten im Hadoop-Ökosystem verwendet werden können. Darüber hinaus werden Sie an einem praktischen Beispiel eines öffentlich verfügbaren Datensatzes arbeiten, um Pig Latin-Skripte für die Datenanalyse auszuführen.

Das ist alles enthalten

7 Videos2 Lektüren2 Aufgaben

In diesem Modul werden Sie mit der Notwendigkeit von NoSQL Datenbanken vertraut gemacht. Sie werden auch HBase, eine NoSQL Datenbank, und ihre Rolle im Hadoop Ökosystem kennenlernen. Sie lernen das CAP-Theorem kennen und erfahren, wie es sich auf die Abwägung zwischen den verschiedenen NoSQL-Datenbanken in Hadoop auswirkt. Sie werden auch mehr über CAP-Konsistenz, Verfügbarkeit und Partitionstoleranz erfahren und wie diese unsere Wahl der Technologie für den Zugriff auf und die Bearbeitung von Daten in Hadoop beeinflussen. Schließlich erhalten Sie einen Einblick in andere aufkommende Cloud-basierte NoSQL-Lösungen.

Das ist alles enthalten

8 Videos2 Lektüren2 Aufgaben1 Diskussionsthema

Diese Bewertung ist ein benotetes Quiz, das auf den in dieser Woche behandelten Modulen basiert.

Das ist alles enthalten

1 Aufgabe

In diesem Modul werden Sie mit der beliebten Apache Spark-Plattform für die Verarbeitung von Big Data vertraut gemacht. Sie werden die Schlüsselkomponenten von Apache Spark kennenlernen, die erhebliche Vorteile beim verteilten Rechnen bieten. Sie werden auch mit den Resilient Distributed Datastores (RDD) und den Spark DataFrames vertraut gemacht. Darüber hinaus werden Sie mit Spark SQL und Spark Streaming vertraut gemacht.

Das ist alles enthalten

11 Videos4 Lektüren2 Aufgaben1 Diskussionsthema

Diese Bewertung ist ein benotetes Quiz, das auf dem in dieser Woche behandelten Modul basiert.

Das ist alles enthalten

1 Aufgabe

In diesem Modul lernen Sie MLlib kennen, das für Vorhersagen auf großen Datenmengen verwendet wird, die eine verteilte Verarbeitung erfordern. Sie werden an Regressions- und Klassifizierungsaufgaben für große Datensätze arbeiten. Anschließend wird eine praktische Übung mit Streaming-Daten aus der Twitter API durchgeführt. Dabei handelt es sich um eine prädiktive Streaming-Anwendung, die den Teilnehmern ein End-to-End-Szenario für Big Data zeigt.

Das ist alles enthalten

8 Videos3 Lektüren2 Aufgaben

Video zur Kursnachbereitung

Das ist alles enthalten

1 Video

Auf einen Abschluss hinarbeiten

Dieses Kurs ist Teil des/der folgenden Studiengangs/Studiengänge, die von O.P. Jindal Global Universityangeboten werden. Wenn Sie zugelassen werden und sich immatrikulieren, können Ihre abgeschlossenen Kurse auf Ihren Studienabschluss angerechnet werden und Ihre Fortschritte können mit Ihnen übertragen werden.¹

 

Dozent

Dr. Mohit Bhatnagar
O.P. Jindal Global University
5 Kurse3.333 Lernende

von

Mehr von Datenanalyse entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Coursera Plus

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen