R 编程语言专为数据分析而设计。R 是一把钥匙,可以打开您想用数据解决的问题与实现目标所需的答案之间的大门。 本课程从问题开始,然后引导您通过数据回答问题。首先,您将学习准备(或处理)分析数据的重要技术。然后,您将学习如何通过探索性数据分析更好地了解您的数据,帮助您总结数据并识别变量之间的相关关系,从而获得洞察力。数据分析准备就绪后,您将学习如何开发模型并评估和调整其性能。按照这个流程,您可以确保您的数据分析符合您设定的标准,并对结果充满信心。
您将扮演一名数据分析师,分析航空公司的出发和到达数据,预测航班延误情况,从而积累实践经验。使用航空公司报告承运人准点率数据集,您将练习读取数据文件、预处理数据、创建模型、改进模型和评估模型,最终选择最佳模型。
观看视频,完成实验,并为您的作品集添砖加瓦。祝你好运! 注:本课程的前提条件是具备基本的 R 编程技能。例如,请确保您已完成 IBM 的《数据科学 R 编程入门》等课程。
所有数据分析都始于您需要解决的问题,而了解您的数据以及您可以回答的问题类型则是其中的关键环节。R 编程语言提供了进行强大数据分析所需的所有工具,是数据与要解决的实际问题之间的桥梁。
在本模块中,你将回顾可以用 R 语言解决的一类问题,以及构成分析基础的底层数据。您还将了解用于数据分析的 R 软件包,这些软件包提供了一套您在日常数据分析中可能会用到的强大工具。最后,您将了解如何导入数据并从数据集中获得基本见解。
涵盖的内容
6个视频1篇阅读材料2个作业1个应用程序项目1个插件
显示有关单元内容的信息
6个视频•总计24分钟
使用 R 进行数据分析入门•3分钟
问题所在•4分钟
了解数据•4分钟
数据科学 R 软件包•5分钟
在 R 中导入和导出数据•6分钟
开始使用 R 分析数据•3分钟
1篇阅读材料•总计10分钟
摘要和要点•10分钟
2个作业•总计20分钟
实践测验•10分钟
分级测验•10分钟
1个应用程序项目•总计60分钟
实践实验室 1:数据分析入门•60分钟
1个插件•总计15分钟
小抄:dplyr 函数•15分钟
数据整理
第 2 单元•小时 后完成
单元详情
数据整理或数据预处理是实现准确、完整数据分析的第一步。这一过程将原始数据转换成一种可以轻松分类或映射到其他数据的格式,在它们之间建立可预测的关系,并使您更容易建立所需的模型来回答有关数据的问题。
本模块将介绍如何使用 R 进行数据预处理,然后为您提供所需的工具来识别和处理数据集中的缺失值、转换数据格式以使其与您可能想要比较的其他数据保持一致、对数据进行归一化处理、通过数据分档创建信息类别,以及将分类变量转换为可用于基于数值分析的定量值。