University of Washington

机器学习分类

本课程是 机器学习 专项课程 的一部分

Emily Fox
Carlos Guestrin

位教师:Emily Fox

129,174 人已注册

包含在 Coursera Plus

深入了解一个主题并学习基础知识。
4.7

(3,736 条评论)

2 周 完成
在 10 小时 一周
灵活的计划
自行安排学习进度
95%
大多数学生喜欢此课程
深入了解一个主题并学习基础知识。
4.7

(3,736 条评论)

2 周 完成
在 10 小时 一周
灵活的计划
自行安排学习进度
95%
大多数学生喜欢此课程

要了解的详细信息

可分享的证书

添加到您的领英档案

作业

19 项作业

授课语言:英语(English)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

积累特定领域的专业知识

本课程是 机器学习 专项课程 专项课程的一部分
在注册此课程时,您还会同时注册此专项课程。
  • 向行业专家学习新概念
  • 获得对主题或工具的基础理解
  • 通过实践项目培养工作相关技能
  • 获得可共享的职业证书

该课程共有10个模块

分类是机器学习中应用最广泛的技术之一,其应用领域非常广泛,包括情感分析、广告定位、垃圾邮件检测、风险评估、医疗诊断和图像分类。通过本课程,您将熟悉分类中使用的基本模型和算法,以及一些核心机器学习概念。本课程并不涉及分类的所有方面,而是将重点放在一些核心技术上,这些技术在现实世界中被广泛应用,以获得最先进的性能。通过我们的实践方法,您将在多个实际任务中实现自己的算法,并深刻掌握在实践中成功使用这些方法所需的核心技术。本课程介绍概述了我们将涉及的主题以及我们假定您已掌握的背景知识和资源。

涵盖的内容

8个视频4篇阅读材料

线性分类器是最实用的分类方法之一。例如,在我们的情感分析案例研究中,线性分类器将一个系数与句子中每个单词的计数相关联。在本模块中,您将熟练掌握这种表示方法。您将重点学习一种特别有用的线性分类器--逻辑回归,它除了允许您预测一个类别外,还提供与预测相关的概率。这些概率非常有用,因为它们提供了预测的可信度。在本模块中,您还将能够从分类输入中构建特征,并处理具有两个以上类别的分类问题(多类问题)。您将在实际产品情感分析任务中检验这些技术的结果。

涵盖的内容

18个视频2篇阅读材料2个作业

在熟悉了线性分类器和逻辑回归后,您现在就可以深入研究并编写第一个分类学习算法。具体来说,您将使用梯度上升法从数据中学习分类器的系数。首先,您需要使用最大似然估计 (MLE) 方法为这些任务定义质量度量。您还将熟悉选择梯度上升步长的简单技术。本模块的选修高级部分将涵盖逻辑回归梯度的推导。 您将从头开始实现自己的逻辑回归学习算法,并用它来学习情感分析分类器。

涵盖的内容

18个视频2篇阅读材料2个作业

正如我们在回归课程中所看到的,过拟合也许是您在实际应用机器学习方法时将面临的最大挑战。在本模块中,您将发现这一挑战对于逻辑回归尤为重要,因为我们不仅有可能获得过于复杂的决策边界,而且您的分类器还可能对其预测的概率过于自信。在本模块中,您将详细研究分类中的过拟合问题,并从分类器输出的一些有趣可视化效果中获得广泛的实用见解。然后,您将在优化中添加正则化项,以减轻过拟合。您将研究 L2 正则化和 L1 正则化,前者用于惩罚大的系数值,后者用于获得系数的额外稀疏性。最后,您将修改梯度上升算法,以学习正则化逻辑回归分类器。您将从头开始实现自己的正则化逻辑回归分类器,并研究 L2 惩罚对真实世界情感分析数据的影响。

涵盖的内容

13个视频2篇阅读材料2个作业

决策树与线性分类器一样,是现实世界中应用最广泛的分类技术之一。这种方法非常直观、易于实施,并能提供可解释的预测结果。在本模块中,您将熟悉决策树的核心表示法。然后,您将设计一种简单的递归贪婪算法,从数据中学习决策树。最后,你将扩展这种方法以处理连续输入,这是实际问题的基本要求。在本模块中,你将研究金融领域的一个全新案例:预测与银行贷款相关的风险。您将在真实贷款数据上实现自己的决策树学习算法。

涵盖的内容

13个视频3篇阅读材料3个作业

在所有机器学习技术中,决策树是最容易出现过度拟合的技术之一。在实际应用中,如果不采用缓解这一难题的方法,就不可能实现。在本模块中,您将通过各种可视化和调查,研究决策树为何会出现严重的过拟合问题。利用奥卡姆剃刀的原理,你将通过学习更简单的决策树来缓解过拟合问题。首先,您将设计算法,在决策树变得过于复杂之前停止学习过程。在可选的部分中,您将设计一种非常实用的方法,学习过于复杂的树,然后通过修剪将其简化。您将在实际贷款数据集上研究这些技术对减轻过度拟合的影响。

涵盖的内容

8个视频2篇阅读材料2个作业

现实世界中的机器学习问题充满了缺失数据。也就是说,有些输入往往无法观测到所有数据点。这一挑战非常严峻,在大多数情况下都会发生,需要谨慎处理才能获得出色的性能。而机器学习课程中很少讨论这个问题。在本模块中,您将直面数据缺失的挑战。您将从将缺失数据集转换为干净数据集的两种最基本技术开始,即跳过缺失值和输入缺失值。在高级部分,您还将设计一种决策树学习算法的修改版,将有关缺失数据的决策直接构建到模型中。您还将在实际数据实施中探索这些技术。

涵盖的内容

6个视频1篇阅读材料1个作业

机器学习中最令人兴奋的理论问题之一是,简单的分类器能否组合成一个高精度的集合。这个问题导致了提升技术的发展,它是当今机器学习领域最重要、最实用的技术之一。这种简单的方法可以提高任何分类器的准确性,并在实践中得到广泛应用,例如,在 Kaggle 机器学习竞赛中获胜的团队中有一半以上都使用了这种方法。在本模块中,你将首先定义集合分类器,即多个模型对最佳预测进行投票。然后,您将探索一种名为 AdaBoost 的增强算法,它为增强分类器提供了一种很好的方法。通过可视化,您将熟悉这种技术的许多实际方面。您将从头开始创建自己的 AdaBoost 实现,并使用它在真实数据上提升贷款风险预测器的性能。

涵盖的内容

13个视频3篇阅读材料3个作业

在许多实际环境中,准确率或误差并不是分类的最佳质量指标。您将探究一个案例研究,该案例研究极大地凸显了这一问题:使用情感分析在餐厅网站上显示正面评论。您将定义两个指标:精确度和召回率,而不是准确度,这两个指标在实际应用中被广泛用于衡量分类器的质量。您将探索如何利用分类器输出的概率来权衡精确度和召回率,并利用精确度-召回率曲线深入了解这一范围。在动手实施过程中,您将在真实世界的情感分析数据上使用学习到的分类器计算这些指标。

涵盖的内容

8个视频2篇阅读材料2个作业

随着互联网的出现、社交媒体的发展以及传感器在世界范围内的普及,我们的机器学习算法必须处理的数据量在过去十年中大幅增长。这种效应有时被称为 "大数据"。因此,我们的学习算法必须扩展到越来越大的数据集。在本模块中,你将开发一种对梯度上升的小修改,称为随机梯度,它能显著加快我们算法的运行时间。这个简单的修改可以大大提高扩展速度,但会降低算法的稳定性,在实际应用中也会更加困难。在本模块中,您将研究使随机梯度可行所需的实用技术,从而获得可扩展至海量数据集的学习算法。您还将讨论一种新的机器学习问题,即在线学习,在这种情况下,数据流会随着时间的推移不断涌入,我们必须在数据到达时学习系数。这项任务也可以用随机梯度法来解决。您将从头开始为逻辑回归实现自己的随机梯度上升算法,并在情感分析数据上对其进行评估。

涵盖的内容

16个视频2篇阅读材料2个作业

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

授课教师评分
4.7 (153个评价)
Emily Fox
University of Washington
6 门课程493,225 名学生
Carlos Guestrin
University of Washington
8 门课程494,012 名学生

提供方

从 机器学习 浏览更多内容

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'
Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'
Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'
Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'

学生评论

4.7

3,736 条评论

  • 5 stars

    76.76%

  • 4 stars

    18.60%

  • 3 stars

    3.05%

  • 2 stars

    0.61%

  • 1 star

    0.96%

显示 3/3736 个

KL
5

已于 Jun 23, 2017审阅

SM
5

已于 Jun 14, 2020审阅

RB
5

已于 Oct 19, 2020审阅

Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题