Wann werde ich Zugang zu den Vorlesungen und Aufgaben haben?

Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.

Was bekomme ich, wenn ich mich für diese Specialization einschreibe?

Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.

Ist finanzielle Hilfe verfügbar?

Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.

Verlässlichkeit, Cloud-Computing und maschinelles Lernen

Verlässlichkeit, Cloud-Computing und maschinelles Lernen

Dieser Kurs ist Teil von Spezialisierung „Groß angelegte Datenbanksysteme“

Dozent: David Silberberg

Bei enthalten

Mehr erfahren

4 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

2 Wochen zu vervollständigen

unter 10 Stunden pro Woche

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

4 Module

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.

Stufe Mittel

Empfohlene Erfahrung

2 Wochen zu vervollständigen

unter 10 Stunden pro Woche

Flexibler Zeitplan

In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

Lernen Sie die Prinzipien der Transaktionsverwaltung kennen, einschließlich ACID-Eigenschaften, Gleichzeitigkeitskontrolle und Deadlock-Management-Techniken für verteilte Systeme.
Erforschen Sie Reliabilitätsprotokolle, Wiederherstellungsalgorithmen und Commit-Protokolle wie ARIES, die Datenkonsistenz und Haltbarkeit gewährleisten.
Verständnis für Cloud-Computing mit Hadoop, Nutzung von MapReduce für die Verarbeitung großer Datenmengen und Anwendung von Techniken des Maschinellen Lernens wie Clustering.

Kompetenzen, die Sie erwerben

Kategorie: Datenarchitektur
Kategorie: Verteiltes Rechnen
Kategorie: Cloud Computing
Kategorie: Datenverarbeitung
Kategorie: Angewandtes maschinelles Lernen
Kategorie: Skalierbarkeit
Kategorie: Data Warehousing
Kategorie: Maschinelles Lernen
Kategorie: Transaktionsverarbeitung
Kategorie: Integrität der Daten
Kategorie: Datenzugang
Kategorie: Datenbankarchitektur und -verwaltung
Kategorie: Große Daten

Werkzeuge, die Sie lernen werden

Kategorie: Klassifizierungsalgorithmen
Kategorie: Datenbank-Management-Systeme
Kategorie: Apache Hadoop
Kategorie: Datenbank-Systeme

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

8 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Weitere Informationen zu Coursera für Unternehmen

Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung „Groß angelegte Datenbanksysteme“

Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.

Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 4 Module

Der Kurs "Zuverlässigkeit, Cloud-Computing und maschinelles Lernen" befasst sich mit fortgeschrittenen Konzepten für verteilte Datenbanken, wobei der Schwerpunkt auf Transaktionsmanagement, Zuverlässigkeitsprotokollen und Data Warehousing liegt, während gleichzeitig ein tieferes Verständnis für Cloud-Computing und maschinelles Lernen vermittelt wird. Sie entwickeln ein solides Verständnis der Transaktionsprinzipien, der Methoden zur Steuerung der Gleichzeitigkeit und der Sicherstellung der Datenbankkonsistenz bei Ausfällen mithilfe von ACID-Eigenschaften und Protokollen wie ARIES. Der Kurs integriert auf einzigartige Weise Hadoop, MapReduce und Accumulo und bietet praktische Erfahrungen mit der Verarbeitung großer Datenmengen und mit Anwendungen des maschinellen Lernens wie kollaboratives Filtern, Clustering und Klassifizierung.

Durch die Beherrschung dieser fortgeschrittenen Themen erwerben Sie die notwendigen Fähigkeiten, um mit modernsten Technologien zu arbeiten, die in der Cloud-basierten Datenverarbeitung und skalierbaren maschinellen Lernanalysen eingesetzt werden. Mit praktischen Anwendungen sowohl im Bereich des Zuverlässigkeitsmanagements als auch des maschinellen Lernens bereitet Sie dieser Kurs darauf vor, komplexe Herausforderungen im Bereich des Datenmanagements zu bewältigen, so dass Sie für Karrieren in den Bereichen Cloud-Computing, verteilte Systeme und Datenwissenschaft gut gerüstet sind.

Moduldetails

In diesem Kurs werden fortgeschrittene Themen zu verteilten Datenbanken untersucht, wobei der Schwerpunkt auf Transaktionsmanagement, Reliabilitätsprotokollen und Data Warehousing liegt. In diesem Kurs werden außerdem die im letzten Kurs eingeführten MapReduce- und HDFS-Konzepte weiterentwickelt und auf groß angelegte Anwendungen für Analytik und Maschinelles Lernen in verteilten Systemen angewendet. Die Lernenden werden die wesentlichen Komponenten für die Aufrechterhaltung der Reliabilität von Datenbanken erforschen. Darüber hinaus werden sie tiefer in die Cloud-basierte Datenverarbeitung mit Hadoop eintauchen und grundlegende Fähigkeiten in der Analytik sowie in Anwendungen des Maschinellen Lernens unter Verwendung von kollaborativen Filtern, Clustering und Klassifizierungstechniken entwickeln.

Das ist alles enthalten

2 Lektüren

Dieses Modul befasst sich mit der Transaktionsverwaltung in verteilten Datenbanksystemen, wobei der Schwerpunkt auf Methoden der Gleichzeitigkeitskontrolle liegt. Sie lernen, ACID-Eigenschaften zu identifizieren, um die Konsistenz der Datenbank aufrechtzuerhalten, Transaktionspläne mit Operationen und partiellen Anordnungen zu entwickeln und verschiedene Algorithmen zur Gleichzeitigkeitskontrolle und Deadlock-Verwaltung zu implementieren, einschließlich zweiphasiger Sperren und zeitbasierter Techniken.

Das ist alles enthalten

11 Videos5 Lektüren3 Aufgaben

11 VideosInsgesamt 65 Minuten

Java-Beispiel6 Minuten
Formale Transaktionsdefinition8 Minuten
ACID-Eigenschaften13 Minuten
Architektur der verteilten Transaktionsverwaltung2 Minuten
Zwei-Phasen-Verriegelung8 Minuten
Verteiltes Two Phase Locking5 Minuten
Algorithmus zur Zeitstempelanordnung7 Minuten
Zeitstempelreihenfolge bei mehreren Versionen4 Minuten
Optimistische Gleichzeitigkeitskontrolle4 Minuten
Wartezeit-Diagramme4 Minuten
Deadlock-Vermeidung4 Minuten

5 LektürenInsgesamt 230 Minuten

Transaktionsmanagement und Gleichzeitigkeitskontrolle30 Minuten
Referenzen lesen60 Minuten
Referenzen lesen60 Minuten
Selbstreflexive Lektüre: Kontrolle der Gleichzeitigkeit in der Datenbankverwaltung40 Minuten
Selbstreflektierende Lektüre: Transaktionsmanagement und Kontrolle der Gleichzeitigkeit40 Minuten

3 AufgabenInsgesamt 90 Minuten

Transaktionsmanagement und Gleichzeitigkeitskontrolle60 Minuten
Verständnis der ACID-Eigenschaften in verteilten Datenbanken15 Minuten
Verständnis des Bestellalgorithmus15 Minuten

In diesem Modul werden Protokolle zur Reliabilität in verteilten Datenbanken untersucht, wobei der Schwerpunkt auf der Aufrechterhaltung der Konsistenz und Haltbarkeit bei Systemausfällen liegt. Die wichtigsten Protokolle zur Wiederherstellung und Reliabilität, einschließlich ARIES, Zwei-Phasen- und Drei-Phasen-Commit, werden behandelt. Darüber hinaus erhalten die Teilnehmer grundlegende Kenntnisse über die Prinzipien des Data Warehousing sowie eine Einführung in die Accumulo-Architektur. Dazu gehören grundlegende Accumulo-Funktionen und Sicherheitsmechanismen auf Zellebene, die für ein groß angelegtes verteiltes Datenmanagement unerlässlich sind.

Das ist alles enthalten

6 Videos7 Lektüren3 Aufgaben

6 VideosInsgesamt 59 Minuten

Ansätze für die Cache-Verwaltung8 Minuten
Beispiel-Transaktion11 Minuten
Analyse- und Redo-Phasen8 Minuten
Phase rückgängig machen7 Minuten
Protokolle für die Beendigung15 Minuten
3PC Timeout- und Terminierungsprotokolle11 Minuten

7 LektürenInsgesamt 315 Minuten

Accumulo Architektur und Programmierung60 Minuten
Reliabilitäts-Protokolle30 Minuten
Das Data Warehouse25 Minuten
Referenzen lesen60 Minuten
Referenzen lesen60 Minuten
Selbstreflexive Lektüre: Absturz des ARIES-Algorithmus während der Wiederherstellung40 Minuten
Selbstreflektierendes Lesen: Implementierung und Optimierung des Entfernens von Sichtbarkeitskriterien in Accumulo40 Minuten

3 AufgabenInsgesamt 90 Minuten

Zuverlässigkeits-Protokolle, Data Warehousing und Accumulo-Architektur60 Minuten
ARIES Recovery und Accumulo-Grundlagen15 Minuten
Reliabilität und Datenmanagement in Accumulo15 Minuten

Dieses Modul führt in die Grundprinzipien des Cloud-Computing ein, wobei der Schwerpunkt auf dem Hadoop-Ökosystem und seinem Nutzen für die Verarbeitung großer Datenmengen liegt. Mit dem Schwerpunkt auf dem MapReduce-Framework werden die Lernenden die Pseudocode-Entwicklung und -Architektur erkunden. Das Modul integriert auch grundlegende Konzepte des Maschinellen Lernens, insbesondere Algorithmen für Clustering, Klassifizierung und Kollaboratives Filtern mit Mahout und Accumulo. Mit diesen Techniken sind die Teilnehmer in der Lage, skalierbare Datenanalysen durchzuführen und Empfehlungssysteme in Hadoop zu erstellen, die für die Verwaltung und Analyse großer Datensätze geeignet sind.

Das ist alles enthalten

1 Video5 Lektüren2 Aufgaben

1 VideoInsgesamt 9 Minuten

Motivierende Probleme für MapReduce9 Minuten

5 LektürenInsgesamt 280 Minuten

Referenzen lesen120 Minuten
Selbstreflektierendes Lesen: MapReduce erforschen40 Minuten
Selbstständiges Lesen: Relationaler vs. Accumulo-Ansatz40 Minuten
Selbstreflektierendes Lesen: Verbesserung kollaborativer Filtertechniken40 Minuten
Selbstreflektierendes Lesen: Ansätze des Maschinellen Lernens verstehen40 Minuten