在本课程中,您将学习应用于不同数据的各种有监督 ML 算法和预测任务。您将学习何时使用哪种模型、为什么以及如何改进模型性能。我们将介绍线性回归和逻辑回归、KNN、决策树和随机森林和提升等集合方法,以及 SVM 等核方法。 需要有编码或脚本知识。我们将在整个课程中广泛使用 Python。在本课程中,您需要有扎实的 Python 基础,或者有足够的使用其他编程语言编码的经验来快速掌握 Python。


了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有6个模块
本周,我们将打好监督机器学习的基础。数据清理和 EDA 似乎并不光彩,但这一过程对于指导您的实际数据项目至关重要。 您很可能以前听说过线性回归。在机器学习的热潮下,我们从这样一种标准的统计技术入手似乎有些出人意料。在《如何不犯错:数学思维的力量》一书中,乔丹-艾伦伯格将线性回归称为 "统计技术之于社会科学,就像螺丝刀之于家庭维修。无论什么任务,你都会用到它"(51)。线性回归是解决连续结果问题的绝佳起点。希望本周的学习能让你体会到,用这样一个简单的模型就能完成很多事情。
涵盖的内容
5个视频15篇阅读材料1个测验3个作业1个编程作业1次同伴评审2个讨论话题
本周我们将在上周的基础上,学习更复杂的线性回归模型。本周之后,您将能够创建包含多个解释变量和分类变量的线性模型。从数学和语法上讲,多元线性回归模型是我们上周学习的较简单线性回归模型的自然延伸。本周我们必须牢记的一个区别是,我们的数据空间现在是三维的,而不是二维的。在考虑如何创建有意义的可视化时,三维和二维之间的差异会产生影响。了解如何解释系数至关重要。机器学习涉及对模型进行战略性迭代和改进。在本周的实验和同行评议中,您将找出线性回归模型的弱点,并对其进行战略性改进。希望随着您在本课程专业化方面的进步,您能在这一迭代过程中越做越好。
涵盖的内容
4个视频5篇阅读材料1个测验1个编程作业1次同伴评审
尽管逻辑回归的名字可能会让人联想到其他方面,但本周我们将把注意力从回归任务转移到分类任务上。逻辑回归是广义线性模型的一种特殊情况。与线性回归一样,逻辑回归是一种广泛使用的统计工具,也是数据科学工具包的基础工具之一。分类任务在现实世界中有很多应用,包括金融和生物医学领域。在本周的实验中,您将看到这一经典算法如何帮助您预测著名的威斯康星乳腺癌数据集中的活检切片显示的是良性还是恶性肿块。我们还建议您在本周开始第 7 周课程的期末项目。本周,请找到一个项目数据集,开始执行 EDA 并定义您的问题。使用项目评分标准作为指导,不要害怕查看几个数据集,直到找到适合项目的数据集为止。
涵盖的内容
4个视频6篇阅读材料1个测验1个编程作业1次同伴评审
本周我们将学习非参数模型。决策树是一种监督学习模型,可用于回归或分类任务。在模块 2 中,我们学习了偏差与方差的权衡,在课程学习过程中,我们一直将这一权衡牢记于心。高度灵活的树状模型的好处是可以捕捉复杂的非线性关系。但是,它们容易出现过度拟合。本周和下周,我们将探索剪枝等策略,以避免基于树的模型过度拟合。在本周的实验中,您将为著名的 MNIST 数据集制作一个 KNN 分类器,然后使用决策树模型建立一个垃圾邮件分类器。 本周我们将再次领略简单易懂的模型的威力。继续完成最终项目一旦你确定了数据集和 EDA,就开始为你的主要监督学习任务制定初步方法。回顾课程材料、阅读研究论文、查看 GitHub 存储库和 Medium 文章,以了解您的主题并规划您的方法。
涵盖的内容
5个视频6篇阅读材料1个测验1个编程作业1次同伴评审
上周,我们学习了树模型。尽管树模型有很多优点,但它们也有一些难以克服的弱点。本周我们将学习集合方法,以克服树模型的过拟合倾向。在许多机器学习竞赛中,优胜者都会使用集合方法,汇总多个树模型的预测结果。本周您将首先学习随机森林和袋集,这是一种用训练数据的不同子集样本来训练相同算法的技术。然后,您将学习提升法(boosting),这是一种模型顺序训练的集合方法。您将了解两种基本的提升算法:AdaBoost 和梯度提升。本周,进行期末项目的主要分析。迭代并改进您的模型。比较不同的模型。进行超参数优化。有时,机器学习项目的这一部分会让人感觉枯燥乏味,但希望看到你的成绩有所提高。
涵盖的内容
4个视频5篇阅读材料1个测验1个编程作业1次同伴评审
本周我们将探讨另一个高级课题--支持向量机。不要被这个名字吓到。本周,我们将了解这种强大的监督学习模型。希望你们能对一些基本概念有直观的理解,比如硬边际和软边际的区别、内核技巧和超参数调整。下周,你将提交最终项目的三个交付成果:报告、视频演示和 GitHub 存储库链接。假设您的目标是在本周完成模型迭代、超参数优化等工作。在这种情况下,您可以在下周润色您的报告,确保您的 GitHub 存储库已为同行评审做好准备,并对您的工作进行出色的演示。
涵盖的内容
4个视频4篇阅读材料1个测验1个编程作业1次同伴评审
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
攻读学位
课程 是 University of Colorado Boulder提供的以下学位课程的一部分。如果您被录取并注册,您已完成的课程可计入您的学位学习,您的学习进度也可随之转移。
位教师

从 机器学习 浏览更多内容
- 状态:免费试用
University of Colorado Boulder
- 状态:免费试用
- 状态:免费试用
University of Colorado Boulder
- 状态:预览
Duke University
人们为什么选择 Coursera 来帮助自己实现职业发展




学生评论
82 条评论
- 5 stars
35.36%
- 4 stars
20.73%
- 3 stars
8.53%
- 2 stars
9.75%
- 1 star
25.60%
显示 3/82 个
已于 Nov 12, 2024审阅
Best free MOOC on Coursera for supervised learning.
已于 Apr 4, 2024审阅
Peer review requirements are too specific and contain some minor errors that can be confusing.
已于 May 20, 2022审阅
This was an excellent introductory course that allowed me to get into the world of Data Science and Machine Learning.
常见问题
在 Coursera 上,两个或两个以上的中大博尔德学位课程提供交叉列出的课程。例如,"动态编程、贪婪算法 "既是 CSCA 5414(MS-CS)课程,也是 DTSA 5503(MS-DS)课程。
- 交叉列出的课程不能获得一个以上版本的学分。
- 您可以通过查看课程的学生手册来确定交叉列出的课程。
- 您的成绩单将受到影响。在评估毕业要求时,交叉列出的课程被视为等同课程。但是,我们鼓励您选修本专业的交叉课程(如有),以确保您的中大成绩单反映出您直接在本系完成的大量课程。您从其他专业完成的任何课程都将以该专业的课程前缀(如 DTSA 与 CSCA)出现在您的中大成绩单上。
- 各专业对入学和毕业的最低成绩要求可能有所不同。例如,MS-DS 要求所有课程均达到 C 级或以上方可毕业(入学要求 GPA 达到 3.0),而 MS-CS 要求所有拓展课程均达到 B 级或以上,所有选修课程均达到 C 级或以上方可毕业(入学要求每门路径课程均达到 B 级或以上)。所有课程均要求学生在入学和毕业时保持 3.0 的累积 GPA。
是的。 在评估毕业要求时,交叉列出的课程被视为等同课程。您可以通过查看您所在专业的学生手册来确定交叉列出的课程。
您可以在任何开放注册期间升级并支付学费,以获得 << 本课程/本专业课程>> 的研究生级别的中大博尔德学分。由于 << 本课程/这些课程>> 在计算机科学硕士课程和数据科学硕士课程中交叉列出,因此您需要在升级之前确定您想从哪个课程中获得学分。
数据科学硕士(MS-DS)学分: 要升级到 << 本课程/这些课程>> 的数据科学(DTSA)学分版本,请使用 MS-DS 注册表。查看如何操作。
计算机科学硕士(MS-CS)学分: 要升级到<<此课程/这些课程>>的计入学分的计算机科学(CSCA)版本,请使用MS-CS注册表。查看如何操作。
如果您不确定哪个课程最适合您,请查看MS-CS和MS-DS课程网站,如果还有问题,请联系[email protected]或[email protected]。
更多问题
提供助学金,