本专业面向熟悉 R 编程语言并希望使用 Tidyverse 系列软件包进行数据科学研究的数据科学家。通过 5 门课程,您将了解如何使用强大的 Tidyverse 框架导入、管理、可视化和建模数据。Tidyverse 软件包为数据科学提供了一种简单而强大的方法,可以从最基本的分析扩展到海量数据部署。本课程涵盖数据科学项目的整个生命周期,并为每个阶段介绍特定的整理工具。
应用的学习项目
学员将在每门课程结束时参与一个项目。通过每个项目,学员将从头开始构建和组织一个数据科学项目,从各种数据格式中导入和处理数据,将非整洁数据整理成整洁数据,使用 ggplot2 可视化数据,并构建机器学习预测模型。