IBM
使用 Python 进行数据分析
IBM

使用 Python 进行数据分析

本课程是多个项目的一部分。

586,832 人已注册

包含在 Coursera Plus

深入了解一个主题并学习基础知识。
4.7

(19,377 条评论)

中级 等级

推荐体验

灵活的计划
2 周 在 10 小时 一周
自行安排学习进度
94%
大多数学生喜欢此课程
深入了解一个主题并学习基础知识。
4.7

(19,377 条评论)

中级 等级

推荐体验

灵活的计划
2 周 在 10 小时 一周
自行安排学习进度
94%
大多数学生喜欢此课程

您将学到什么

  • 构建 Python 程序,通过处理缺失值、格式不一致、归一化和分选等问题,清理和准备数据以进行分析

  • 使用 Pandas、NumPy 和 SciPy 等库,通过探索性数据分析 (EDA) 分析现实世界的数据集,从而发现模式和见解

  • 应用数据操作技术,使用数据框架来组织、总结和解释数据分布、相关性分析和数据管道

  • 使用 Scikit-learn 开发和评估回归模型,并使用这些模型生成预测和支持数据驱动的决策 Making

要了解的详细信息

可分享的证书

添加到您的领英档案

授课语言:英语(English)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

积累特定领域的专业知识

此课程作为 的一部分提供
在注册此课程时,您还需要选择一个特定的合作项目。
  • 向行业专家学习新概念
  • 获得对主题或工具的基础理解
  • 通过实践项目培养工作相关技能
  • 获得可共享的职业证书

该课程共有6个模块

在本 Modulation 中,您将学习如何理解和准备数据集、使用基本 Python 软件包以及导入和导出数据进行分析,从而掌握基于 Python 的数据分析的基础技能。您将获得使用 Pandas、NumPy 和 SQLite 等工具的实践经验,开始分析真实世界的数据集,包括笔记本电脑定价数据集。此外,您还将获得一份小抄,作为整个学习过程中的便利参考。

涵盖的内容

6个视频1篇阅读材料2个作业2个应用程序项目3个插件

在本 Modulation 中,您将学习清理、转换和准备用于分析的数据的技术,从而提高使用 Python 处理数据的技能。您将使用真实世界的数据集来处理缺失值、格式化和规范化数据、二值化数值以及转换 Corical Data 变量。通过指导实验,您将在笔记本电脑和二手车定价数据集上应用这些技能。在整个学习过程中,您还将收到一份小抄作为快速参考。

涵盖的内容

6个视频1篇阅读材料2个作业2个应用程序项目1个插件

在本 Modulation 中,您将掌握使用 Python 进行探索性数据分析 (EDA) 的基本技能。您将学习对数据执行计算,以计算基本的描述性统计信息,如均值、中位数、模式和 Quartile 值,并利用这些信息更好地理解数据的 Distribution。您将学习如何对数据进行分组以更好地 Visualization 模式,使用皮尔逊相关法比较两个连续的数值变量,以及应用 Chi-Square Test 评估分类变量之间的关联并解释结果。此外,您还将获得一份小抄,作为常用 EDA 功能和方法的快速参考。

涵盖的内容

5个视频1篇阅读材料2个作业2个应用程序项目3个插件

在本模块中,您将探索使用 Python 进行数据分析的模型开发基础。您将学习如何构建、可视化和评估不同类型的 Regression 模型,包括简单线性、多重线性和多项式回归模型,以及简化工作流程的管道。您还将使用关键指标和可视化工具(如 Kernel 密度估计 (KDE) 图)解释模型性能。实践实验室将通过二手车和笔记本电脑定价等实用数据集强化您的学习。此外,小抄将作为构建和评估预测模型的快速参考。

涵盖的内容

6个视频1篇阅读材料2个作业2个应用程序项目2个插件

在本 Module 中,您将通过学习如何评估、调整和选择模型以获得最佳性能来完善自己的预测建模技能。您将探索过拟合、欠拟合和使用 Grid Search 进行 Hyperparameter 调整等概念。您还将学习使用脊回归来规范化和减少标准误差,以防止回归模型过度拟合。通过动手实验,您将把这些技术应用于真实数据集,从而建立稳健、可泛化的模型。本书还附有小抄,指导您选择正确的工具和指标来优化模型。

涵盖的内容

4个视频1篇阅读材料2个作业2个应用程序项目2个插件

在这个最后模块中,您将应用完整的数据分析 Workflow,从导入和清理数据到在真实世界数据集上构建和评估模型。您将基于与保险成本和房屋定价相关的数据集,完成一个动手实践项目和一个经过 Peer-to-Peer 评审的结业项目。在结业项目中,您将在一家投资住宅物业的房地产投资信托公司担任数据分析师。您将使用一个包含房价和各种房产 Feature 详细信息的数据集,您的任务是分析数据并预测住房市场价值。这些项目旨在巩固您的技能,为应对真实世界的数据分析挑战做好准备。最后,您将通过期末考试展示对关键数据分析概念的理解和应用。

涵盖的内容

5篇阅读材料1个作业1次同伴评审2个应用程序项目1个插件

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

授课教师评分
4.6 (3,233个评价)
Joseph Santarcangelo
IBM
36 门课程2,171,524 名学生

提供方

IBM

从 数据分析 浏览更多内容

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'
Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'
Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'
Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'

学生评论

4.7

19,377 条评论

  • 5 stars

    76.34%

  • 4 stars

    18.25%

  • 3 stars

    3.65%

  • 2 stars

    0.93%

  • 1 star

    0.80%

显示 3/19377 个

LM
4

已于 Mar 9, 2020审阅

VS
5

已于 Jan 30, 2022审阅

AA
5

已于 Dec 8, 2021审阅

Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题

¹ 本课程的部分作业采用 AI 评分。对于这些作业,将根据 Coursera 隐私声明使用您的数据。