Wesleyan University
数据分析机器学习
Wesleyan University

数据分析机器学习

本课程是 数据分析与解释 专项课程 的一部分

Jen Rose
Lisa Dierker

位教师:Jen Rose

46,543 人已注册

包含在 Coursera Plus

深入了解一个主题并学习基础知识。
4.2

(325 条评论)

1 周 完成
在 10 小时 一周
灵活的计划
自行安排学习进度
95%
大多数学生喜欢此课程
深入了解一个主题并学习基础知识。
4.2

(325 条评论)

1 周 完成
在 10 小时 一周
灵活的计划
自行安排学习进度
95%
大多数学生喜欢此课程

要了解的详细信息

可分享的证书

添加到您的领英档案

授课语言:英语(English)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

积累特定领域的专业知识

本课程是 数据分析与解释 专项课程 专项课程的一部分
在注册此课程时,您还会同时注册此专项课程。
  • 向行业专家学习新概念
  • 获得对主题或工具的基础理解
  • 通过实践项目培养工作相关技能
  • 获得可共享的职业证书

该课程共有4个模块

决策树是一种数据挖掘算法,可以从大量变量中选出对预测待解释的目标变量或响应变量最重要的变量及其交互作用。决策树通过反复应用一系列简单的规则或标准,在数据中创建分段或分组,从而选择出最能预测目标变量的变量组合。

涵盖的内容

7个视频15篇阅读材料1次同伴评审

随机森林是一种数据挖掘算法,可以从大量变量中挑选出对确定要解释的目标变量或响应变量最重要的变量。与决策树不同,随机森林的结果可以很好地概括新数据。

涵盖的内容

4个视频4篇阅读材料1次同伴评审

套索回归分析是线性回归模型的一种收缩和变量选择方法。套索回归的目标是获得对定量响应变量预测误差最小的预测因子子集。套索回归是通过对模型参数施加限制,使某些变量的回归系数向零收缩来实现这一目标的。在缩小过程后,回归系数等于零的变量将被排除在模型之外。回归系数不为零的变量与响应变量的关联性最强。解释变量可以是定量变量,也可以是分类变量或两者兼而有之。在本课中,您将应用并解释套索回归分析。您还将积累使用 k 倍交叉验证选择最佳拟合模型的经验,并获得对模型测试误差率的更准确估计。 要测试套索回归模型,您需要从数据集中确定一个定量响应变量(如果还没有这样做),并选择一些额外的定量和分类预测(即解释)变量,以建立一个更大的预测变量库。 如果有更多的预测变量可供测试,就能最大限度地丰富套索回归分析的经验。请记住,套索回归是一种机器学习方法,因此您对其他预测因子的选择并不一定要依赖于研究假设或理论。抓住机会,尝试一些新变量。lasso 回归分析将帮助您确定哪些预测因子最重要。还需注意的是,如果您使用的数据集相对较小,则无需将数据分成训练数据集和测试数据集。您采用的交叉验证方法就是为了在观测数据数量有限的情况下消除分割数据的需要而设计的。

涵盖的内容

5个视频3篇阅读材料1次同伴评审

聚类分析是一种无监督的机器学习方法,它将数据集中的观测值划分为一组较小的聚类,其中每个观测值只属于一个聚类。聚类分析的目标是根据多个变量的相似性将观测值分组或聚类。聚类变量应主要是定量变量,但也可包括二元变量。在本节课中,我们将向您展示如何使用 k-means 聚类分析来识别数据集中的观察结果聚类。您将获得解释聚类分析结果的经验,使用图表方法帮助您确定需要解释的聚类数量,并检查聚类变量的手段以评估聚类概况。最后,您将有机会通过检查聚类分析中未包含的变量在聚类间的差异来验证您的聚类解决方案。 您可以使用与过去几周相同的变量作为聚类变量。如果之前的解释变量大多或全部是分类变量,则应从数据集中找出一些额外的定量聚类变量。理想情况下,大部分聚类变量都是定量变量,但也可以包括一些二进制变量。此外,您还需要从数据集中确定一个不包含在聚类分析中的定量或二元响应变量。您将使用这一变量来验证您的聚类,方法是使用统计方法(如方差分析或卡方分析)评估您的聚类在这一响应变量上是否存在显著差异。还请注意,如果您使用的是相对较小的数据集,则无需将数据分成训练数据集和测试数据集。

涵盖的内容

6个视频3篇阅读材料1次同伴评审

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

授课教师评分
4.3 (17个评价)
Jen Rose
Wesleyan University
4 门课程94,472 名学生

提供方

从 机器学习 浏览更多内容

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'
Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'
Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'
Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'

学生评论

4.2

325 条评论

  • 5 stars

    56.61%

  • 4 stars

    25.53%

  • 3 stars

    7.69%

  • 2 stars

    4%

  • 1 star

    6.15%

显示 3/325 个

BC
5

已于 Oct 4, 2016审阅

MS
4

已于 Mar 21, 2016审阅

MK
4

已于 Apr 26, 2020审阅

Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题