本课程介绍一套强大的数据科学工具,即 Tidyverse。Tidyverse 彻底改变了数据科学家的工作方式,几乎改变了他们工作的方方面面。我们将介绍 "整洁数据 "这一简单的概念,以及这一概念如何用于组织数据以进行分析和建模。我们还将介绍如何将非整洁数据转化为整洁数据、数据科学项目生命周期以及可用于执行数据科学项目的 Tidyverse R 软件包生态系统。


您将学到什么
区分整洁数据和非整洁数据
说明如何将非整洁数据转化为整洁数据
描述 Tidyverse 软件包生态系统
组织和启动数据科学项目
要了解的详细信息
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有6个模块
在讨论 R 如何让整洁数据的处理变得简单之前,我们首先要确定我们知道什么是整洁数据。整洁的数据集在设计上更易于操作、建模和可视化,因为我们将在本课程中讨论的整洁数据原则为数据提供了一个总体框架和一套一致的规则。事实上,哈德利-威克姆(Hadley Wickham)有一句名言:"整洁的数据集都是相似的,但每个混乱的数据集都有自己的混乱之处"。利用一致的整洁数据格式,可以构建在此框架内运行良好的工具,最终简化数据整理、可视化和分析过程。从格式已经整洁的数据开始,或者在项目开始时花时间将数据转换成整洁的格式,数据科学项目的其余步骤将变得更加容易。
涵盖的内容
6篇阅读材料2个作业
讨论什么是整洁的数据以及它们看起来像什么很重要,因为在世界上,大多数数据都是不整洁的。如果你不是输入数据的人,而是别人交给你的数据来做项目,那么这些数据往往是不整齐的。不整齐的数据通常被简称为混乱数据。为了轻松处理这些数据,您必须将它们转换成整洁的数据格式。这意味着你必须充分认识到不整齐的数据,并了解如何将数据转换成整齐的格式。下面这些在混乱数据集中常见的问题同样来自 Hadley Wickham 有关整洁数据的论文 (http://vita.had.co.nz/papers/tidy-data.pdf)。在简要回顾了每个常见问题之后,我们将看看几个混乱的数据集。最后,我们将讨论整理不整洁数据的概念,但还不会进行实际操作。实践即将到来!
涵盖的内容
3篇阅读材料1个作业
有了对整洁数据以及整洁数据如何融入数据科学生命周期的扎实了解,我们将花一点时间向你介绍我们将在整个专业课程中教授和使用的 tidyverse 和与 tidyverse 相关的软件包。这些软件包共同构成了我们所说的 tidyverse 生态系统。本课程其余部分的目的不是让你了解如何使用每个软件包(这即将到来!),而是帮助你熟悉哪些软件包适合数据科学生命周期的哪个部分。 请注意,下面的官方 tidyverse 软件包是粗体的。所有其他软件包都与 tidyverse 相连,这意味着它们遵循与官方软件包相同的约定,并能在数据分析的 tidy 框架和结构中很好地工作。
涵盖的内容
5篇阅读材料
数据科学项目千差万别,因此很难给出组织项目的通用规则。不过,有几种组织项目的方法通常很有用。尤其是,几乎所有项目都需要处理各种文件--数据文件、代码文件、输出文件等。本节将介绍文件的工作原理,以及如何组织和定制项目。
涵盖的内容
6篇阅读材料2个作业
在整个专业课程中,我们将使用 "开放案例研究 "中的大量案例来演示课程中介绍的概念。一般来说,我们会在整个专业课程中使用相同的案例研究,这样可以保持连续性,让你在使用有趣的数据时专注于所教授的概念和技能(而不是上下文)。这些案例研究旨在解决一个公共卫生问题,并且全部使用真实数据。
涵盖的内容
2篇阅读材料2个非评分实验室
通过该项目,您可以创建一个新项目,并整理未来数据分析所需的文件。
涵盖的内容
1次同伴评审
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师



从 数据分析 浏览更多内容
- 状态:免费试用
Johns Hopkins University
- 状态:免费试用
Johns Hopkins University
- 状态:免费试用
University of Colorado Boulder
- 状态:免费试用
University of Colorado Boulder
人们为什么选择 Coursera 来帮助自己实现职业发展




学生评论
52 条评论
- 5 stars
73.07%
- 4 stars
13.46%
- 3 stars
3.84%
- 2 stars
1.92%
- 1 star
7.69%
显示 3/52 个
已于 Apr 17, 2024审阅
The course is a breeze to follow because it aligns seamlessly with the book. As such, rather than watching videos, you get to read the book; it's really a convenient approach.
已于 Oct 1, 2021审阅
Good overview of the Tidyverse and nice introduction.
已于 Oct 30, 2022审阅
Covers really important concepts and procedures for managing data science projects. Very helpful.
常见问题
要获取课程资料、作业和证书,您需要在注册课程时购买证书体验。 您可以尝试免费试听,或申请资助。课程可能提供 "完整课程,无证书"。通过该选项,您可以查看所有课程资料,提交必要的评估,并获得最终成绩。这也意味着您无法购买证书体验。
注册课程后,您就可以访问专项课程中的所有课程,完成作业后还可以获得证书。您的电子证书将添加到您的 "成就 "页面--在那里,您可以打印证书或将其添加到您的 LinkedIn 个人资料中。
是的。在特定的学习课程中,如果您付不起注册费,可以申请助学金或奖学金。如果您选择的学习课程有助学金或奖学金,您可以在说明页面找到申请链接。
更多问题
提供助学金,
¹ 本课程的部分作业采用 AI 评分。对于这些作业,将根据 Coursera 隐私声明使用您的数据。