"微调 Large Language Model(LLM)对于使其符合特定业务需求、提高准确性和优化性能至关重要。在当今 AI 驱动的世界中,企业依靠微调模型来生成精确、可操作的见解,从而推动创新和效率。本课程让有抱负的 Generative AI 工程师掌握雇主们积极寻求的紧缺技能。 您将探索因果 LLM 的高级微调技术,包括指令调整、奖励建模和直接偏好优化。了解 LLM 如何作为生成响应的概率策略,以及如何使用抱抱脸等工具使其与人类偏好保持一致。您将深入学习奖励计算、来自人类反馈的强化学习(RLHF)、近似策略优化(PPO)、PPO 训练器和直接偏好优化(DPO)的最佳策略。 课程中的实践实验室将提供指令调整、奖励建模、PPO 和 DPO 的实际经验,让您能够自信地微调 LLM,以实现具有重大影响的应用。 在短短两周内,掌握可胜任工作的 Generative AI 技能!今天就报名,推动您在 AI 领域的职业发展!"
通过 Coursera Plus 提高技能,仅需 239 美元/年(原价 399 美元)。立即节省

您将学到什么
雇主们正在积极寻求的生成 AI 工程技能的微调法学硕士
使用抱抱脸进行指令调整和奖励建模,以及将 LLM 理解为策略并应用 RLHF 技术
带分区函数和拥抱面的直接偏好优化(DPO),包括如何定义 DPO 问题的最优解
使用 Proximal Policy Optimization (PPO)与 Hugging Face 建立评分函数并对数据集进行 Tokening 微调
您将获得的技能
您将学习的工具
要了解的详细信息

可分享的证书
添加到您的领英档案
作业
5 项作业
授课语言:英语(English)
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
此课程作为 的一部分提供
在注册此课程时,您还需要选择一个特定的合作项目。
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有2个模块
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
提供方
人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'

Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'

Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'

Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'
学生评论
- 5 stars
73.60%
- 4 stars
8.80%
- 3 stars
4%
- 2 stars
4.80%
- 1 star
8.80%
显示 3/124 个
AV
已于 Mar 10, 2025审阅
Very Informative – Covers advanced fine-tuning techniques in a clear and structured way
MS
已于 Mar 10, 2025审阅
The course gave me a good understanding of fine-tuning LLMs. It made complex topics easy to learn.
GP
已于 Mar 10, 2025审阅
Great course, love the deep-rooted content. All my concepts are so clear now. Kudos!!











