从未标明的数据中发现隐藏模式是机器学习中最有用的领域之一。在您的数据科学工具包中添加这项紧俏技能的基础知识。在本课程中,我们将学习用于降维、聚类和学习潜在特征的特定无监督学习方法。我们还将重点关注推荐系统等现实世界中的应用,并提供产品推荐算法的实践案例。 需要具备编码或脚本知识。我们将在整个课程中广泛使用 Python。需要具备大学水平的数学技能,包括微积分和线性代数。建议但不要求选修该专业的第一门课程:机器学习导论:监督学习。


了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有4个模块
现在,您已经在监督学习方面打下了坚实的基础,我们将把注意力转移到从未标明的数据中发掘隐藏结构上来。我们将从介绍无监督学习开始。在这门课程中,模型不再有标签可供学习。它们需要从观测数据本身来理解数据。本周我们将深入学习主成分分析(PCA),这是一种基础性的降维技术。刚开始学习这个主题时,可能会觉得不太容易。毫无疑问,这部分内容涉及到一些数学知识。不过,PCA 可以从概念上掌握,也许比预想的更容易。在 "监督学习 "课程中,我们曾与 "维度诅咒 "作斗争。本周,我们将了解 PCA 如何减少维数并改进分类/回归任务。您将通过阅读、小测验和 Jupyter 笔记本实验/Peer Review 来实现 PCA 算法。
涵盖的内容
3个视频13篇阅读材料3个作业1次同伴评审2个讨论话题1个非评分实验室
本周,我们将学习聚类,这是最常用的无监督学习方法之一。上周,我们使用 PCA 找到了数据的低维表示。而聚类则是在观测数据中找到子群。我们可以获得对数据结构有意义的直观认识,或者使用 "聚类-然后预测 "这样的程序。聚类有多种应用,从营销客户细分和广告、识别相似电影/音乐,到基因组学研究和疾病亚型发现。我们将主要关注 K 均值聚类和分层聚类,并考虑两者的优缺点以及距离或联系等指标的选择。本周我们将进行阅读、小测验和 Jupyter 笔记本实验/同行评议。
涵盖的内容
2个视频2篇阅读材料1个作业1次同伴评审1个讨论话题1个非评分实验室
本周我们将学习 "推荐系统"。Netflix、亚马逊和 YouTube 等网站都会提供个性化的电影、商品或视频推荐。本周,我们将探讨推荐引擎预测用户喜好的策略。我们将考虑流行度、基于内容和协同过滤的方法,以及使用哪些相似度指标。在使用推荐系统的过程中,我们会遇到一些挑战,比如操作的时间复杂性和数据稀疏。本周的数学内容相对较多。您将在测验中学习不同的相似度量计算。请为本周的 Jupyter 笔记本实验留出时间,并考虑高效的实现方法。本周的同行评议部分很短。
涵盖的内容
4个视频1篇阅读材料1个作业1个编程作业1次同伴评审
我们已经是最后一周的教材了!准备好迎接又一个密集的数学周吧。上周,我们学习了推荐系统。我们使用了邻接法(Neighborhood Method of Collaborative Filtering),利用了相似性度量。潜因模型,包括流行的矩阵因式分解(MF),也可用于协同过滤。1999 年在《自然》杂志上发表的一篇文章让非负矩阵因式分解大受欢迎。矩阵因式分解有很多应用,包括图像分析、文本挖掘/主题建模、推荐系统、音频信号分离、分析化学和基因表达分析。本周,我们的重点是奇异值分解、非负矩阵因式分解和逼近方法。本周,我们将进行阅读、测验和利用矩阵因式分解对新闻文章进行分类的 Kaggle 小项目。
涵盖的内容
5个视频1篇阅读材料1个作业1次同伴评审
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
攻读学位
课程 是 University of Colorado Boulder提供的以下学位课程的一部分。如果您被录取并注册,您已完成的课程可计入您的学位学习,您的学习进度也可随之转移。
位教师

从 机器学习 浏览更多内容
- 状态:免费试用
- 状态:免费试用
University of Colorado Boulder
- 状态:免费试用
University of Colorado Boulder
- 状态:免费试用
人们为什么选择 Coursera 来帮助自己实现职业发展




常见问题
在 Coursera 上,两个或两个以上的中大博尔德学位课程提供交叉列出的课程。例如,"动态编程、贪婪算法 "既是 CSCA 5414(MS-CS)课程,也是 DTSA 5503(MS-DS)课程。
- 交叉列出的课程不能获得一个以上版本的学分。
- 您可以通过查看课程的学生手册来确定交叉列出的课程。
- 您的成绩单将受到影响。在评估毕业要求时,交叉列出的课程被视为等同课程。但是,我们鼓励您选修本专业的交叉课程(如有),以确保您的中大成绩单反映出您直接在本系完成的大量课程。您从其他专业完成的任何课程都将以该专业的课程前缀(如 DTSA 与 CSCA)出现在您的中大成绩单上。
- 各专业对入学和毕业的最低成绩要求可能有所不同。例如,MS-DS 要求所有课程均达到 C 级或以上方可毕业(入学要求 GPA 达到 3.0),而 MS-CS 要求所有拓展课程均达到 B 级或以上,所有选修课程均达到 C 级或以上方可毕业(入学要求每门路径课程均达到 B 级或以上)。所有课程均要求学生在入学和毕业时保持 3.0 的累积 GPA。
是的。 在评估毕业要求时,交叉列出的课程被视为等同课程。您可以通过查看您所在专业的学生手册来确定交叉列出的课程。
您可以在任何开放注册期间升级并支付学费,以获得 << 本课程/本专业课程>> 的研究生级别的中大博尔德学分。由于 << 本课程/这些课程>> 在计算机科学硕士课程和数据科学硕士课程中交叉列出,因此您需要在升级之前确定您想从哪个课程中获得学分。
数据科学硕士(MS-DS)学分: 要升级到 << 本课程/这些课程>> 的数据科学(DTSA)学分版本,请使用 MS-DS 注册表。查看如何操作。
计算机科学硕士(MS-CS)学分: 要升级到<<此课程/这些课程>>的计入学分的计算机科学(CSCA)版本,请使用MS-CS注册表。查看如何操作。
如果您不确定哪个课程最适合您,请查看MS-CS和MS-DS课程网站,如果还有问题,请联系[email protected]或[email protected]。
更多问题
提供助学金,