Lernen Sie die Prinzipien der Transaktionsverwaltung kennen, einschließlich ACID-Eigenschaften, Gleichzeitigkeitskontrolle und Deadlock-Management-Techniken für verteilte Systeme.
Erforschen Sie Reliabilitätsprotokolle, Wiederherstellungsalgorithmen und Commit-Protokolle wie ARIES, die Datenkonsistenz und Haltbarkeit gewährleisten.
Verständnis für Cloud-Computing mit Hadoop, Nutzung von MapReduce für die Verarbeitung großer Datenmengen und Anwendung von Techniken des Maschinellen Lernens wie Clustering.
Kompetenzen, die Sie erwerben
Kategorie: Datenarchitektur
Datenarchitektur
Kategorie: Verteiltes Rechnen
Verteiltes Rechnen
Kategorie: Cloud Computing
Cloud Computing
Kategorie: Datenverarbeitung
Datenverarbeitung
Kategorie: Angewandtes maschinelles Lernen
Angewandtes maschinelles Lernen
Kategorie: Skalierbarkeit
Skalierbarkeit
Kategorie: Data Warehousing
Data Warehousing
Kategorie: Maschinelles Lernen
Maschinelles Lernen
Kategorie: Transaktionsverarbeitung
Transaktionsverarbeitung
Kategorie: Integrität der Daten
Integrität der Daten
Kategorie: Datenzugang
Datenzugang
Kategorie: Datenbankarchitektur und -verwaltung
Datenbankarchitektur und -verwaltung
Kategorie: Große Daten
Große Daten
Werkzeuge, die Sie lernen werden
Kategorie: Klassifizierungsalgorithmen
Klassifizierungsalgorithmen
Kategorie: Datenbank-Management-Systeme
Datenbank-Management-Systeme
Kategorie: Apache Hadoop
Apache Hadoop
Kategorie: Datenbank-Systeme
Datenbank-Systeme
Wichtige Details
Zertifikat zur Vorlage
Zu Ihrem LinkedIn-Profil hinzufügen
Bewertungen
8 Aufgaben
Unterrichtet in Englisch
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat zur Vorlage
In diesem Kurs gibt es 4 Module
Der Kurs "Zuverlässigkeit, Cloud-Computing und maschinelles Lernen" befasst sich mit fortgeschrittenen Konzepten für verteilte Datenbanken, wobei der Schwerpunkt auf Transaktionsmanagement, Zuverlässigkeitsprotokollen und Data Warehousing liegt, während gleichzeitig ein tieferes Verständnis für Cloud-Computing und maschinelles Lernen vermittelt wird. Sie entwickeln ein solides Verständnis der Transaktionsprinzipien, der Methoden zur Steuerung der Gleichzeitigkeit und der Sicherstellung der Datenbankkonsistenz bei Ausfällen mithilfe von ACID-Eigenschaften und Protokollen wie ARIES. Der Kurs integriert auf einzigartige Weise Hadoop, MapReduce und Accumulo und bietet praktische Erfahrungen mit der Verarbeitung großer Datenmengen und mit Anwendungen des maschinellen Lernens wie kollaboratives Filtern, Clustering und Klassifizierung.
Durch die Beherrschung dieser fortgeschrittenen Themen erwerben Sie die notwendigen Fähigkeiten, um mit modernsten Technologien zu arbeiten, die in der Cloud-basierten Datenverarbeitung und skalierbaren maschinellen Lernanalysen eingesetzt werden. Mit praktischen Anwendungen sowohl im Bereich des Zuverlässigkeitsmanagements als auch des maschinellen Lernens bereitet Sie dieser Kurs darauf vor, komplexe Herausforderungen im Bereich des Datenmanagements zu bewältigen, so dass Sie für Karrieren in den Bereichen Cloud-Computing, verteilte Systeme und Datenwissenschaft gut gerüstet sind.
In diesem Kurs werden fortgeschrittene Themen zu verteilten Datenbanken untersucht, wobei der Schwerpunkt auf Transaktionsmanagement, Reliabilitätsprotokollen und Data Warehousing liegt. In diesem Kurs werden außerdem die im letzten Kurs eingeführten MapReduce- und HDFS-Konzepte weiterentwickelt und auf groß angelegte Anwendungen für Analytik und Maschinelles Lernen in verteilten Systemen angewendet. Die Lernenden werden die wesentlichen Komponenten für die Aufrechterhaltung der Reliabilität von Datenbanken erforschen. Darüber hinaus werden sie tiefer in die Cloud-basierte Datenverarbeitung mit Hadoop eintauchen und grundlegende Fähigkeiten in der Analytik sowie in Anwendungen des Maschinellen Lernens unter Verwendung von kollaborativen Filtern, Clustering und Klassifizierungstechniken entwickeln.
Das ist alles enthalten
2 Lektüren
Infos zu Modulinhalt anzeigen
2 Lektüren•Insgesamt 10 Minuten
Überblick über den Kurs•5 Minuten
Biografie des Lehrers - Dr. David Silberberg•5 Minuten
Transaktionsmanagement und Gleichzeitigkeitskontrolle
Modul 2•6 Stunden abzuschließen
Moduldetails
Dieses Modul befasst sich mit der Transaktionsverwaltung in verteilten Datenbanksystemen, wobei der Schwerpunkt auf Methoden der Gleichzeitigkeitskontrolle liegt. Sie lernen, ACID-Eigenschaften zu identifizieren, um die Konsistenz der Datenbank aufrechtzuerhalten, Transaktionspläne mit Operationen und partiellen Anordnungen zu entwickeln und verschiedene Algorithmen zur Gleichzeitigkeitskontrolle und Deadlock-Verwaltung zu implementieren, einschließlich zweiphasiger Sperren und zeitbasierter Techniken.
Das ist alles enthalten
11 Videos5 Lektüren3 Aufgaben
Infos zu Modulinhalt anzeigen
11 Videos•Insgesamt 65 Minuten
Java-Beispiel•6 Minuten
Formale Transaktionsdefinition•8 Minuten
ACID-Eigenschaften•13 Minuten
Architektur der verteilten Transaktionsverwaltung•2 Minuten
Zwei-Phasen-Verriegelung•8 Minuten
Verteiltes Two Phase Locking•5 Minuten
Algorithmus zur Zeitstempelanordnung•7 Minuten
Zeitstempelreihenfolge bei mehreren Versionen•4 Minuten
Transaktionsmanagement und Gleichzeitigkeitskontrolle•30 Minuten
Referenzen lesen•60 Minuten
Referenzen lesen•60 Minuten
Selbstreflexive Lektüre: Kontrolle der Gleichzeitigkeit in der Datenbankverwaltung•40 Minuten
Selbstreflektierende Lektüre: Transaktionsmanagement und Kontrolle der Gleichzeitigkeit•40 Minuten
3 Aufgaben•Insgesamt 90 Minuten
Transaktionsmanagement und Gleichzeitigkeitskontrolle•60 Minuten
Verständnis der ACID-Eigenschaften in verteilten Datenbanken•15 Minuten
Verständnis des Bestellalgorithmus•15 Minuten
Zuverlässigkeits-Protokolle, Data Warehousing und Accumulo-Architektur
Modul 3•8 Stunden abzuschließen
Moduldetails
In diesem Modul werden Protokolle zur Reliabilität in verteilten Datenbanken untersucht, wobei der Schwerpunkt auf der Aufrechterhaltung der Konsistenz und Haltbarkeit bei Systemausfällen liegt. Die wichtigsten Protokolle zur Wiederherstellung und Reliabilität, einschließlich ARIES, Zwei-Phasen- und Drei-Phasen-Commit, werden behandelt. Darüber hinaus erhalten die Teilnehmer grundlegende Kenntnisse über die Prinzipien des Data Warehousing sowie eine Einführung in die Accumulo-Architektur. Dazu gehören grundlegende Accumulo-Funktionen und Sicherheitsmechanismen auf Zellebene, die für ein groß angelegtes verteiltes Datenmanagement unerlässlich sind.
Das ist alles enthalten
6 Videos7 Lektüren3 Aufgaben
Infos zu Modulinhalt anzeigen
6 Videos•Insgesamt 59 Minuten
Ansätze für die Cache-Verwaltung•8 Minuten
Beispiel-Transaktion•11 Minuten
Analyse- und Redo-Phasen•8 Minuten
Phase rückgängig machen•7 Minuten
Protokolle für die Beendigung•15 Minuten
3PC Timeout- und Terminierungsprotokolle•11 Minuten
7 Lektüren•Insgesamt 315 Minuten
Accumulo Architektur und Programmierung•60 Minuten
Reliabilitäts-Protokolle•30 Minuten
Das Data Warehouse•25 Minuten
Referenzen lesen•60 Minuten
Referenzen lesen•60 Minuten
Selbstreflexive Lektüre: Absturz des ARIES-Algorithmus während der Wiederherstellung•40 Minuten
Selbstreflektierendes Lesen: Implementierung und Optimierung des Entfernens von Sichtbarkeitskriterien in Accumulo•40 Minuten
3 Aufgaben•Insgesamt 90 Minuten
Zuverlässigkeits-Protokolle, Data Warehousing und Accumulo-Architektur•60 Minuten
ARIES Recovery und Accumulo-Grundlagen•15 Minuten
Reliabilität und Datenmanagement in Accumulo•15 Minuten
Cloud-Computing, Hadoop-Ökosystem und Anwendungen für maschinelles Lernen
Modul 4•6 Stunden abzuschließen
Moduldetails
Dieses Modul führt in die Grundprinzipien des Cloud-Computing ein, wobei der Schwerpunkt auf dem Hadoop-Ökosystem und seinem Nutzen für die Verarbeitung großer Datenmengen liegt. Mit dem Schwerpunkt auf dem MapReduce-Framework werden die Lernenden die Pseudocode-Entwicklung und -Architektur erkunden. Das Modul integriert auch grundlegende Konzepte des Maschinellen Lernens, insbesondere Algorithmen für Clustering, Klassifizierung und Kollaboratives Filtern mit Mahout und Accumulo. Mit diesen Techniken sind die Teilnehmer in der Lage, skalierbare Datenanalysen durchzuführen und Empfehlungssysteme in Hadoop zu erstellen, die für die Verwaltung und Analyse großer Datensätze geeignet sind.
Die Aufgabe der Johns Hopkins University ist es, ihre Studenten auszubilden und ihre Fähigkeit zum lebenslangen Lernen zu fördern, unabhängige und originelle Forschung zu betreiben und der Welt den Nutzen von Entdeckungen zu bringen.
Wann werde ich Zugang zu den Vorlesungen und Aufgaben haben?
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Was bekomme ich, wenn ich mich für diese Specialization einschreibe?
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.
Ist finanzielle Hilfe verfügbar?
Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.