使用 Python 分析数据是有抱负的数据科学家和分析师的关键技能!本课程将带您从导入和清理数据的基础知识,到构建和评估预测模型。您将学习如何从各种来源收集数据、整理和格式化数据、执行探索性数据分析 (EDA) 以及创建有效的 Visualization。随着学习的深入,您将建立线性、多元和多项式 Regression 模型,构建数据管道,并完善模型以提高准确性。

使用 Python 进行数据分析
本课程是多个项目的一部分。

位教师:Joseph Santarcangelo
604,756 人已注册
包含在 中
您将学到什么
构建 Python 程序,通过处理缺失值、格式不一致、归一化和分选等问题,清理和准备数据以进行分析
使用 Pandas、NumPy 和 SciPy 等库,通过探索性数据分析 (EDA) 分析现实世界的数据集,从而发现模式和见解
应用数据操作技术,使用数据框架来组织、总结和解释数据分布、相关性分析和数据管道
使用 Scikit-learn 开发和评估回归模型,并使用这些模型生成预测和支持数据驱动的决策 Making
您将获得的技能
- 类别:模型评估
- 类别:数据导入/导出
- 类别:数据操作
- 类别:Matplotlib
- 类别:预测建模
- 类别:数据可视化
- 类别:探索性数据分析
- 类别:NumPy
- 类别:数据转换
- 类别:数据分析
- 类别:数据清理
- 类别:统计分析
- 类别:数据科学
- 类别:Scikit-learn (机器学习库)
- 类别:回归分析
- 类别:数据驱动的决策制定
- 类别:数据预处理
- 类别:Pandas(Python 软件包)
- 类别:Python 程序设计
要了解的详细信息
积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有6个模块
在本 Modulation 中,您将学习如何理解和准备数据集、使用基本 Python 软件包以及导入和导出数据进行分析,从而掌握基于 Python 的数据分析的基础技能。您将获得使用 Pandas、NumPy 和 SQLite 等工具的实践经验,开始分析真实世界的数据集,包括笔记本电脑定价数据集。此外,您还将获得一份小抄,作为整个学习过程中的便利参考。
涵盖的内容
6个视频1篇阅读材料2个作业2个应用程序项目2个插件
在本 Modulation 中,您将学习清理、转换和准备用于分析的数据的技术,从而提高使用 Python 处理数据的技能。您将使用真实世界的数据集来处理缺失值、格式化和规范化数据、二值化数值以及转换 Corical Data 变量。通过指导实验,您将在笔记本电脑和二手车定价数据集上应用这些技能。在整个学习过程中,您还将收到一份小抄作为快速参考。
涵盖的内容
6个视频1篇阅读材料2个作业2个应用程序项目1个插件
在本 Modulation 中,您将掌握使用 Python 进行探索性数据分析 (EDA) 的基本技能。您将学习对数据执行计算,以计算基本的描述性统计信息,如均值、中位数、模式和 Quartile 值,并利用这些信息更好地理解数据的 Distribution。您将学习如何对数据进行分组以更好地 Visualization 模式,使用皮尔逊相关法比较两个连续的数值变量,以及应用 Chi-Square Test 评估分类变量之间的关联并解释结果。此外,您还将获得一份小抄,作为常用 EDA 功能和方法的快速参考。
涵盖的内容
5个视频1篇阅读材料2个作业2个应用程序项目3个插件
在本模块中,您将探索使用 Python 进行数据分析的模型开发基础。您将学习如何构建、可视化和评估不同类型的 Regression 模型,包括简单线性、多重线性和多项式回归模型,以及简化工作流程的管道。您还将使用关键指标和可视化工具(如 Kernel 密度估计 (KDE) 图)解释模型性能。实践实验室将通过二手车和笔记本电脑定价等实用数据集强化您的学习。此外,小抄将作为构建和评估预测模型的快速参考。
涵盖的内容
6个视频1篇阅读材料2个作业2个应用程序项目2个插件
在本 Module 中,您将通过学习如何评估、调整和选择模型以获得最佳性能来完善自己的预测建模技能。您将探索过拟合、欠拟合和使用 Grid Search 进行 Hyperparameter 调整等概念。您还将学习使用脊回归来规范化和减少标准误差,以防止回归模型过度拟合。通过动手实验,您将把这些技术应用于真实数据集,从而建立稳健、可泛化的模型。本书还附有小抄,指导您选择正确的工具和指标来优化模型。
涵盖的内容
4个视频1篇阅读材料2个作业2个应用程序项目2个插件
在这个最后模块中,您将应用完整的数据分析 Workflow,从导入和清理数据到在真实世界数据集上构建和评估模型。您将完成一个实践练习项目和一个基于保险成本和房屋定价相关数据集的期末项目。在结业项目中,您将在一家投资住宅物业的房地产投资信托公司担任数据分析师。您将使用一个包含房价和各种房产 Feature 详细信息的数据集,您的任务是分析数据并预测住房市场价值。这些项目旨在巩固您的技能,为应对真实世界的数据分析挑战做好准备。此外,您还将提交一份最终项目笔记本供评估。您提交的材料将得到 AI 评分。最后,您将通过期末考试展示对关键数据分析概念的理解和应用。
涵盖的内容
5篇阅读材料1个作业1次同伴评审3个应用程序项目2个插件
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师

提供方

人们为什么选择 Coursera 来帮助自己实现职业发展




学生评论
19,524 条评论
- 5 stars
76.37%
- 4 stars
18.21%
- 3 stars
3.66%
- 2 stars
0.92%
- 1 star
0.80%
显示 3/19524 个
已于 Apr 16, 2023审阅
Thanks for course! I met some errors, described them in your forms. I liked every models, but the final assignment was not interesting. I think it can be done better, with decisions and conclusions.
已于 Jul 16, 2020审阅
Although good to learn the know-how of basic data analysis techniques, the quizzes are predictable and you don't end up coding as much as you should. A good starter course to wet your feet in DA!
已于 Nov 11, 2021审阅
Good Course. Very good overview of Python libs -Pandas, Numpy, Matplotlib, Scipy, Scikitlearn and Seaborn. I really enjoyed learning about them and seeing the usage. Highly recommended course.
常见问题
要获取课程资料、作业和证书,您需要在注册课程时购买证书体验。 您可以尝试免费试听,或申请资助。课程可能提供 "完整课程,无证书"。通过该选项,您可以查看所有课程资料,提交必要的评估,并获得最终成绩。这也意味着您无法购买证书体验。
注册课程后,您就可以访问证书中的所有课程,并在完成作业后获得证书。您的电子证书将被添加到您的 "成就 "页面--在那里,您可以打印证书或将其添加到您的 LinkedIn 个人资料中。
¹ 本课程的部分作业采用 AI 评分。对于这些作业,将根据 Coursera 隐私声明使用您的数据。


