强化学习是机器学习的一个子领域,但也是自动决策和人工智能的通用形式主义。本课程将向您介绍统计学习技术,让代理明确采取行动并与世界互动。随着越来越多的公司对交互式代理和智能决策感兴趣,了解学习代理决策的重要性和挑战在今天至关重要。



了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有5个模块
欢迎来到强化学习基础》(Fundamentals of Reinforcement Learning)是阿尔伯塔大学(University of Alberta)、Onlea 和 Coursera 联合推出的四部分强化学习专业课程中的第一门课程。在本课前模块中,您将认识您的讲师,了解本课程的内容,并获得一份深入的路线图,帮助您尽可能顺利地完成本专业课程。
涵盖的内容
4个视频2篇阅读材料1个讨论话题
在本课程的第一周,您将学习如何理解顺序决策中的探索-开发权衡,实施估算行动值的增量算法,并比较不同探索算法的优缺点。在本周的分级评估中,您将实施并测试一个ε-贪婪代理。
涵盖的内容
8个视频3篇阅读材料1个作业1个编程作业1个讨论话题2个插件
当你遇到工业问题时,最重要的第一步就是将问题转化为马尔可夫决策过程(Markov Decision Process,MDP)。解决方案的质量在很大程度上取决于您如何做好这一转换工作。本周,您将学习马尔可夫决策过程的定义,了解目标导向行为以及如何从标量奖励最大化中获得目标导向行为,还将了解偶发任务和持续任务之间的区别。在本周的分级评估中,您将自己创建三个符合 MDP 框架的示例任务。
涵盖的内容
7个视频2篇阅读材料1个作业1次同伴评审1个讨论话题
将问题表述为 MDP 后,使用值函数寻找最优策略会更有效。本周你们将学习策略和价值函数的定义,以及贝尔曼方程,这是我们所有算法都将使用的关键技术。
涵盖的内容
9个视频3篇阅读材料2个作业1个讨论话题
本周,您将学习如何计算价值函数和最优策略,前提是您已经掌握了 MDP 模型。您将实施动态编程来计算价值函数和最优策略,并了解动态编程在工业应用和问题中的实用性。此外,您还将了解广义策略迭代(Generalized Policy Iteration),这是构建收益最大化算法的常用模板。在本周的分级评估中,您将在一个模拟工业控制问题中实施一个高效的动态编程代理。
涵盖的内容
10个视频3篇阅读材料1个作业1个编程作业1个讨论话题
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师


从 机器学习 浏览更多内容
- 状态:免费试用
University of Alberta
- 状态:预览
Columbia University
- 状态:免费试用
New York University
- 状态:免费试用
University of Alberta
人们为什么选择 Coursera 来帮助自己实现职业发展




学生评论
2,880 条评论
- 5 stars
81.67%
- 4 stars
14.40%
- 3 stars
2.63%
- 2 stars
0.41%
- 1 star
0.86%
显示 3/2880 个
已于 May 6, 2023审阅
Excellent course, with a very nice presentation style, both the professors are excellent in their presentations and the material is well researched and delivered. A very valuable course.
已于 Apr 11, 2024审阅
The concepts may sound confusing in the beginning, but as you go forward you find it interesting and understanding. I suggest you completely read the reading assignments before watching the videos.
已于 Apr 7, 2020审阅
This course is one of the best I've learned so far in coursera. The explanations are clear and concise enough. It took a while for me to understand Bellman equation but when I did, it felt amazing!
常见问题
要获取课程资料、作业和证书,您需要在注册课程时购买证书体验。 您可以尝试免费试听,或申请资助。课程可能提供 "完整课程,无证书"。通过该选项,您可以查看所有课程资料,提交必要的评估,并获得最终成绩。这也意味着您无法购买证书体验。
注册课程后,您就可以访问专项课程中的所有课程,完成作业后还可以获得证书。您的电子证书将添加到您的 "成就 "页面--在那里,您可以打印证书或将其添加到您的 LinkedIn 个人资料中。
是的。在特定的学习课程中,如果您付不起注册费,可以申请助学金或奖学金。如果您选择的学习课程有助学金或奖学金,您可以在说明页面找到申请链接。
更多问题
提供助学金,
¹ 本课程的部分作业采用 AI 评分。对于这些作业,将根据 Coursera 隐私声明使用您的数据。