为了进行有效的数据分析,数据永远不会以你需要的状态到达。数据需要重新塑造、重新排列和重新格式化,以便可视化或输入机器学习算法。本课程旨在解决数据整理问题,以便您能够控制数据并对其进行有效分析。数据处理的关键目标是将非整洁数据转换为整洁数据。 本课程涵盖了在 R 中处理整洁和非整洁数据的许多关键细节,例如从宽格式转换为长格式、使用 dplyr 软件包处理表格、了解不同的 R 数据类型、使用正则表达式处理文本数据,以及进行基本的探索性数据分析。投入时间学习这些数据处理技术将使您的分析更高效、更可重复,也更容易为您的数据科学团队所理解。 在本专业中,我们假定您熟悉 R 编程语言。如果您还不熟悉 R 语言,我们建议您先完成 R 语言编程,然后再回来完成本课程。

在 Tidyverse 中管理数据
本课程是 用 R 语言学习数据科学的 Tidyverse 技能 专项课程 的一部分
访问权限由 New York State Department of Labor 提供
2,329 人已注册
您将学到什么
应用 Tidyverse 函数将非整洁数据转换为整洁数据
进行基本的探索性数据分析
对文本数据进行分析
要了解的详细信息

添加到您的领英档案
7 项作业
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有6个模块
为了进行有效的数据分析,数据永远不会以你需要的状态到达。数据需要重新塑造、重新排列和重新格式化,以便可视化或输入机器学习算法。本模块将讨论如何处理数据,以便控制数据并对其进行有效分析。数据整理的关键目标是将不整齐的数据转化为整齐的数据。
涵盖的内容
19篇阅读材料2个作业
在 R 中,分类数据是作为因子处理的。顾名思义,分类数据是有限的,因为它们有一定数量的可能取值。例如,一个日历年有 12 个月。在月份变量中,每个观测值只能取这 12 个值中的一个。因此,由于可能取值的数量有限,月份就是一个分类变量。在本课的其余部分中,分类数据将被称为因子,它们经常出现在数据中。学习如何有效地处理这类变量将大有裨益。
涵盖的内容
14篇阅读材料2个作业
在数据科学项目中,处理文本数据越来越常见。通常需要对文本进行处理,以清理杂乱的数据集,并从文本输入中创建数值测量。此外,文本本身往往就是数据,本模块涵盖了从文本中提取信息的工具。
涵盖的内容
13篇阅读材料2个作业
探索性分析的目的是检查或探索数据,发现以前不知道的关系。探索性分析探索不同测量指标之间的关系,但并不确认这种关系是因果关系,即一个变量导致另一个变量。你可能听说过 "相关并不意味着因果 "这句话,而探索性分析正是这句话的根源所在。在探索性分析中观察到两个变量之间的关系,并不意味着其中一个变量一定会导致另一个变量。
涵盖的内容
2篇阅读材料
现在,我们将使用案例研究示例演示如何导入数据。在完成案例研究的步骤时,您可以使用自己电脑上的 RStudio 或为每个案例研究提供的 Coursera 实验室空间。
涵盖的内容
11篇阅读材料2个非评分实验室
在本项目中,您将利用消费者金融保护局(CFPB)的消费者投诉数据,通过 tidyverse 练习数据探索和数据处理。
涵盖的内容
1篇阅读材料1个作业
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师


人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
68.75%
- 4 stars
18.75%
- 3 stars
9.37%
- 2 stars
3.12%
- 1 star
0%
显示 3/32 个
已于 Apr 24, 2021审阅
Excellent course! I've learned so many useful R techniques/codes!
已于 Apr 18, 2022审阅
Great course to get yourself acquanted with data wrangling in Tidyverse.
从 数据科学 浏览更多内容

University of Colorado Boulder

Johns Hopkins University

Duke University

University of Colorado Boulder



