"Die Feinabstimmung großer Sprachmodelle (Large Language Models, LLMs) ist unerlässlich, um sie auf spezifische Geschäftsanforderungen abzustimmen, die Genauigkeit zu verbessern und die Leistung zu optimieren. In der heutigen KI-gesteuerten Welt sind Unternehmen auf fein abgestimmte Modelle angewiesen, um präzise, umsetzbare Erkenntnisse zu generieren, die Innovation und Effizienz fördern. Dieser Kurs stattet angehende KI-Ingenieure mit den gefragten Fähigkeiten aus, die Arbeitgeber aktiv suchen. Sie werden fortgeschrittene Feinabstimmungstechniken für kausale LLMs erforschen, einschließlich Instruktionsabstimmung, Belohnungsmodellierung und direkte Präferenzoptimierung. Sie erfahren, wie LLMs als probabilistische Richtlinien für die Generierung von Antworten fungieren und wie sie mit Hilfe von Tools wie Hugging Face an menschliche Präferenzen angepasst werden können. Sie werden in die Belohnungsberechnung, das Verstärkungslernen aus menschlichem Feedback (RLHF), die proximale Policy-Optimierung (PPO), den PPO-Trainer und optimale Strategien für die direkte Präferenzoptimierung (DPO) eintauchen. Die praktischen Übungen in diesem Kurs vermitteln Ihnen praktische Erfahrungen mit der Abstimmung von Instruktionen, der Belohnungsmodellierung, der PPO und der DPO und geben Ihnen die Werkzeuge an die Hand, mit denen Sie LLMs für hochwirksame Anwendungen selbstbewusst feinabstimmen können. Erwerben Sie in nur zwei Wochen berufsreife generative KI-Fähigkeiten! Melden Sie sich noch heute an und bringen Sie Ihre Karriere in der KI voran!"

Generative AI Erweiterte Feinabstimmung für LLMs
Sparen Sie mit 40% Rabatt auf 3 Monate Coursera Plus bei den Fähigkeiten, die Sie zum Strahlen bringen. Jetzt sparen

Generative AI Erweiterte Feinabstimmung für LLMs
Dieser Kurs ist Teil mehrerer Programme.



Dozenten: Joseph Santarcangelo
22.850 bereits angemeldet
Bei enthalten
130 Bewertungen
Empfohlene Erfahrung
Was Sie lernen werden
Gefragt sind generative KI-Engineering-Fähigkeiten zur Feinabstimmung von LLMs, die von Arbeitgebern aktiv gesucht werden
Anweisungsabstimmung und Belohnungsmodellierung unter Verwendung von Hugging Face, sowie Verständnis von LLMs als Richtlinien und Anwendung von RLHF-Techniken
Direkte Präferenzoptimierung (DPO) mit Partitionsfunktion und Hugging Face, einschließlich der Definition optimaler Lösungen für DPO-Probleme
Proximale Politikoptimierung (PPO) mit Hugging Face zur Erstellung von Bewertungsfunktionen und Tokenisierung von Datensätzen für die Feinabstimmung
Kompetenzen, die Sie erwerben
- Kategorie: Modell-Optimierung
- Kategorie: Feinabstimmung
- Kategorie: Generative Modellarchitekturen
- Kategorie: Methoden des maschinellen Lernens
- Kategorie: Reinforcement Learning
- Kategorie: Modell Ausbildung
- Kategorie: Bewertung des Modells
- Kategorie: Modellierung großer Sprachen
Werkzeuge, die Sie lernen werden
- Kategorie: Generative KI
Wichtige Details

Zu Ihrem LinkedIn-Profil hinzufügen
5 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 2 Module
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
von
Mehr von Maschinelles Lernen entdecken
Status: Kostenloser TestzeitraumSimplilearn
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Bewertungen von Lernenden
- 5 stars
75 %
- 4 stars
8,33 %
- 3 stars
3,78 %
- 2 stars
4,54 %
- 1 star
8,33 %
Zeigt 3 von 130 an
Geprüft am 20. Aug. 2025
An excellent course with a wealth of high-quality material, featuring highly informative lessons such as DPO and PPO.
Geprüft am 10. März 2025
Great course, love the deep-rooted content. All my concepts are so clear now. Kudos!!
Geprüft am 29. Apr. 2026
Good course starts with origins of LLM and brings you up to date with DPO
Häufig gestellte Fragen
Weitere Fragen
Finanzielle Unterstützung verfügbar,





