Dieser Kurs ist eine Einführung in die sequentielle Entscheidungsfindung und das Verstärkungslernen. Wir beginnen mit einer Diskussion der Nutzentheorie, um zu lernen, wie Präferenzen für die Entscheidungsfindung dargestellt und modelliert werden können. Wir modellieren zunächst einfache Entscheidungsprobleme als mehrarmige Bandit-Probleme und diskutieren verschiedene Ansätze zur Bewertung von Feedback. Anschließend modellieren wir Entscheidungsprobleme als endliche Markov-Entscheidungsprozesse (MDPs) und erörtern deren Lösungen durch dynamische Programmieralgorithmen. Wir gehen auf den Begriff der partiellen Beobachtbarkeit in realen Problemen ein, die durch POMDPs modelliert und dann durch Online-Planungsmethoden gelöst werden. Schließlich führen wir das Problem des Verstärkungslernens ein und diskutieren zwei Paradigmen: Monte-Carlo-Methoden und zeitliches Differenzlernen. Wir schließen den Kurs mit der Feststellung, dass die beiden Paradigmen auf einem Spektrum von n-schrittigen temporalen Differenzmethoden liegen. Die Betonung von Algorithmen und Beispielen wird ein wichtiger Bestandteil dieses Kurses sein.

Entscheidungsfindung und Reinforcement Learning
Sparen Sie mit 40% Rabatt auf 3 Monate Coursera Plus bei den Fähigkeiten, die Sie zum Strahlen bringen. Jetzt sparen

Entscheidungsfindung und Reinforcement Learning

Dozent: Tony Dear
4.573 bereits angemeldet
Bei enthalten
24 Bewertungen
Empfohlene Erfahrung
Was Sie lernen werden
Zuordnung zwischen qualitativen Präferenzen und geeigneten quantitativen Hilfsmitteln.
Modellieren Sie nicht-assoziative und assoziative sequentielle Entscheidungsprobleme mit mehrarmigen Bandit-Problemen bzw. Markov-Entscheidungsprozessen
Implementierung von Algorithmen zur dynamischen Programmierung, um optimale Strategien zu finden
Implementierung grundlegender Algorithmen zum Verstärkungslernen unter Verwendung von Monte-Carlo- und Zeitdifferenzmethoden
Kompetenzen, die Sie erwerben
- Kategorie: Künstliche Intelligenz und maschinelles Lernen (AI/ML)
- Kategorie: Statistische Methoden
- Kategorie: Methoden des maschinellen Lernens
- Kategorie: Entscheidungsintelligenz
- Kategorie: Reinforcement Learning
- Kategorie: Markov-Modell
- Kategorie: Algorithmen
- Kategorie: Stichproben (Statistik)
- Kategorie: Tiefes Lernen
- Kategorie: Angewandtes maschinelles Lernen
- Kategorie: Algorithmen für maschinelles Lernen
- Kategorie: Maschinelles Lernen
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
8 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

In diesem Kurs gibt es 8 Module
Dozent

Mehr von Algorithmen entdecken
Status: Kostenloser TestzeitraumUniversity of Alberta
Status: Kostenloser TestzeitraumNew York University
Status: VorschauSimplilearn
Status: Kostenloser TestzeitraumUniversity of Alberta
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Bewertungen von Lernenden
- 5 stars
66,66 %
- 4 stars
20,83 %
- 3 stars
0 %
- 2 stars
8,33 %
- 1 star
4,16 %
Zeigt 3 von 24 an
Geprüft am 20. Jan. 2024
Very good introductory and basic to Reinforcement Learning. But programming assignments need more careful compilation and more attention to detail!
Geprüft am 9. Juli 2023
Well-structured course that provides a great introduction to methodologies used in reinforcement learning. I am now eager to experiment more in my own time, to consolidate what I have learned.
Häufig gestellte Fragen
Weitere Fragen
Finanzielle Unterstützung verfügbar,




