本课程将向学员介绍 python 编程环境的基础知识,包括基本的 python 编程技术,如 lambdas、读取和处理 csv 文件以及 numpy 库。课程将介绍使用流行的 python pandas 数据科学库进行数据操作和清理的技术,并介绍将 Series 和 DataFrame 抽象为数据分析的核心数据结构,以及如何有效使用分组、合并和透视表等函数的教程。课程结束时,学生将能够获取表格数据、清理数据、操作数据并运行基本的推理统计分析。

Python 中的数据科学导论
本课程是 借助 Python 应用数据科学 专项课程 的一部分
访问权限由 New York State Department of Labor 提供
854,842 人已注册
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有4个模块
在本 Module 中,您将了解数据科学领域,复习数据科学家常用的 Python 功能和 Feature,并学习 Coursera Jupyter Notebook 的讲座内容。所有关于评分、先决条件和期望的课程信息都在课程大纲上,你可以在我们的课程资源页面上找到更多关于 Jupyter Notebook 的信息。
涵盖的内容
20个视频4篇阅读材料3个作业1个编程作业2个非评分实验室1个插件
在课程的这一 Module 中,您将学习 Python 用于数据 Cleaning 和处理的最重要工具包之一 -- Pandas 的基础知识。您将学习如何将数据读入 DataFrame 结构,如何查询这些结构,以及此类结构的索引细节。
涵盖的内容
13个视频1篇阅读材料3个作业1个编程作业1个非评分实验室
在本 Modulation 中,您将加深对 Python Pandas 库的理解,学习如何合并 DataFrames、生成汇总表、将数据分组为逻辑片段以及处理日期。我们还将刷新你对数据分析 Scale 的理解,并讨论创建分析指标的问题。本周结束时,我们将布置一项更重要的编程任务。
涵盖的内容
12个视频1篇阅读材料2个作业1个编程作业1个非评分实验室
在本课程的最后一个 Module 中,您将学习各种统计技术,如 Distribution、Sampling Distribution 和 T-tests 等。本周的最后,我们将讨论科学和第四范式的兴起--数据驱动的发现。
涵盖的内容
2个视频6篇阅读材料1个作业1个编程作业1个非评分实验室
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
66.34%
- 4 stars
24.24%
- 3 stars
5.36%
- 2 stars
1.92%
- 1 star
2.12%
显示 3/27271 个
已于 Jul 26, 2020审阅
Quizzes were very challenging and interesting. I learned alot. The main drawback in this course is that the materials are insufficient to answer the assignments.And some questions were not so clear.
已于 Feb 19, 2017审阅
This course was fast paced but the material was interesting and not to complex. I can only recommend this course to anyone interested in Data Science and who already has a basic knowledge of Python.
已于 Jun 17, 2018审阅
I thought this was course was good, and was fairly challenging for an online-only course. I thought the lectures could have been a little longer to ensure proper coverage of materials and functions.







