Large language models (LLMs) are trained on human-generated text, but additional methods are needed to align an LLM with human values and preferences.


您将学到什么
Get a conceptual understanding of Reinforcement Learning from Human Feedback (RLHF), as well as the datasets needed for this technique.
Fine-tune the Llama 2 model using RLHF with the open source Google Cloud Pipeline Components Library.
Evaluate tuned model performance against the base model with evaluation methods.
您将练习的技能
要了解的详细信息
仅桌面可用
了解顶级公司的员工如何掌握热门技能

在不到 2 个小时的时间内学习、练习和应用为就业做好准备的技能
- 接受行业专家的培训
- 获得解决实训工作任务的实践经验

关于此项目
位教师

学习方式
基于实践项目的学习
按照分步说明完成与工作相关的任务来练习新技能。
无需下载或安装
在云环境中访问您所需的工具和资源。
仅在台式计算机上可用
此项目专为具有可靠互联网连接的笔记本电脑或台式计算机而设计,而不是移动设备。
人们为什么选择 Coursera 来帮助自己实现职业发展




学生评论
32 条评论
- 5 stars
71.87%
- 4 stars
25%
- 3 stars
3.12%
- 2 stars
0%
- 1 star
0%
显示 3/32 个
已于 Jun 18, 2025审阅
better to be expanded a bit, but overall, it is super course
已于 Jan 11, 2025审阅
Overall worth a shot. Not in depth but good overview
您可能还喜欢
- 状态:免费试用
University of Alberta
- 状态:免费
DeepLearning.AI
- 状态:免费
DeepLearning.AI
常见问题
在课程中,您将在交互式实践环境中按照一系列说明完成活动或场景。课程在真实云环境和各种产品的真实实例中完成,而不是在模拟或演示环境中完成。
购买课程后,您将获得完成该课程所需的一切信息,包括完成该课程所需的任意产品的临时访问权限。
虽然从技术上讲,您可以通过移动设备访问此课程,但我们强烈建议您仅在笔记本电脑或台式机上完成课程。