" Le réglage fin des grands modèles de langage (LLM) est essentiel pour les aligner sur les besoins spécifiques de l'entreprise, améliorer la précision et optimiser les performances. Dans le monde actuel axé sur l'IA, les organisations s'appuient sur des modèles génératifs affinés pour générer des perspectives précises et exploitables qui favorisent l'innovation et l'efficacité. Ce cours équipe les aspirants ingénieurs en IA générative avec les compétences en demande que les employeurs recherchent activement. Vous explorerez des techniques avancées de réglage fin pour les LLM causaux, y compris le réglage des instructions, la modélisation des récompenses et l'optimisation des préférences directes. Apprenez comment les LLM agissent comme des politiques probabilistes pour générer des réponses et comment les aligner sur les préférences humaines à l'aide d'outils tels que Hugging Face. Vous plongerez dans le calcul des récompenses, l'apprentissage par renforcement à partir du feedback humain (RLHF), l'optimisation proximale des politiques (PPO), l'entraîneur PPO et les stratégies optimales pour l'optimisation directe des préférences (DPO). Les laboratoires pratiques du cours vous fourniront une expérience réelle avec le réglage des instructions, la modélisation des récompenses, le PPO et le DPO, vous donnant les outils pour affiner en toute confiance les LLM pour des applications à fort impact. Développez des compétences en IA générative prêtes à l'emploi en seulement deux semaines ! Inscrivez-vous dès aujourd'hui et faites progresser votre carrière dans l'IA !"

IA générative : mise au point avancée pour les LLM

IA générative : mise au point avancée pour les LLM
Ce cours fait partie de plusieurs programmes.



Instructeurs : Joseph Santarcangelo
22 502 déjà inscrits
Inclus avec
130 avis
Expérience recommandée
Ce que vous apprendrez
Compétences en ingénierie de l'IA générative en demande dans les LLM de mise au point que les employeurs recherchent activement
Réglage des instructions et modélisation des récompenses à l'aide de Hugging Face, ainsi que compréhension des LLM en tant que politiques et application des techniques RLHF
Optimisation directe des préférences (DPO) avec fonction de partition et Hugging Face, y compris la manière de définir les solutions optimales aux problèmes de DPO
Utilisation de l'optimisation proximale des politiques (PPO) avec Hugging Face pour construire des fonctions d'évaluation et tokeniser des ensembles de données pour un réglage fin
Compétences que vous acquerrez
- Catégorie : Évaluation du modèle
- Catégorie : Méthodes d'apprentissage automatique
- Catégorie : Architectures de modèles génératifs
- Catégorie : Modélisation des grandes langues
- Catégorie : Apprentissage par renforcement
- Catégorie : Modèle de formation
- Catégorie : Optimisation du modèle
- Catégorie : Mise au point
Outils que vous découvrirez
- Catégorie : IA générative
Détails à connaître

Ajouter à votre profil LinkedIn
5 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs

Offert par
En savoir plus sur Apprentissage automatique
Statut : Essai gratuitSimplilearn
Statut : Essai gratuit
Statut : Prévisualisation
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
74,80 %
- 4 stars
8,39 %
- 3 stars
3,81 %
- 2 stars
4,58 %
- 1 star
8,39 %
Affichage de 3 sur 130
Révisé le 20 août 2025
An excellent course with a wealth of high-quality material, featuring highly informative lessons such as DPO and PPO.
Révisé le 29 avr. 2026
Good course starts with origins of LLM and brings you up to date with DPO
Révisé le 10 mars 2025
Very Informative – Covers advanced fine-tuning techniques in a clear and structured way

Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Plus de questions
Aide financière disponible,


