数据分析应用统计学

本课程是 DeepLearning.AI 数据分析技术专业证书的一部分

位教师：Sean Barnes

顶尖授课教师

访问权限由 Coursera Learning Team 提供

8,072 人已注册

4个模块

深入了解一个主题并学习基础知识。

60 条评论

初级等级

推荐体验

灵活的计划

4 周在 10 小时一周

自行安排学习进度

98%

大多数学生喜欢此课程

4个模块

深入了解一个主题并学习基础知识。

60 条评论

初级等级

推荐体验

灵活的计划

4 周在 10 小时一周

自行安排学习进度

98%

大多数学生喜欢此课程

您将获得的技能

要了解的详细信息

可分享的证书

添加到您的领英档案

作业

22 项作业

授课语言：英语（English）

了解顶级公司的员工如何掌握热门技能

了解关于 Coursera for Business 的更多信息

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

积累数据分析领域的专业知识

本课程是 DeepLearning.AI 数据分析技术专业证书专项课程的一部分

在注册此课程时，您还会同时注册此专业证书。

向行业专家学习新概念
获得对主题或工具的基础理解
通过实践项目培养工作相关技能
通过 DeepLearning.AI 获得可共享的职业证书

该课程共有4个模块

在本课程中，您将学习到作为数据分析师职业生涯基础的基本统计概念、分析和 Visualization。无论您是统计新手还是希望重温技能，本课程都将让您掌握从数据中提取有意义见解的强大技术。课程结束后，您将更有信心和能力在数据分析师的职业生涯中实施严格的统计分析！

在第一个 Modulation 中，您将探索能够进行严格 Data Analysis 的统计学基本构件。课程结束时，您将能够定义 Populations、sample 和 sampling 方法；使用中心倾向、Variable 和 skewness 度量来描述数据集的特征；使用相关性来理解特征之间的关系；以及使用细分来揭示数据中不同群体的洞察力。您将把这些概念应用到真实世界的场景中：分析电影评分和随时间推移的持续时间、解释客户行为和探索医疗保健结果。在第二个 Modulation 中，您将学习关键概率规则和概念，如条件概率和独立性，所有这些都与您作为数据分析师会遇到的真实世界案例相关。然后，您将探索概率分布，包括离散分布和连续分布。您将了解二项分布和正态分布等重要分布，以及它们如何为现实世界的现象建模。您还将了解如何使用 Sampling Distribution 样本数据来了解 Population 的分布，以及如何回答常见的业务问题，如某些结果或结果范围有多常见？最后，您将亲身体验模拟技术。您将看到如何按照特定 Distribution 生成随机数据，从而为复杂情况建模并为决策提供依据。在模块 3 和 4 中，您将学习基于样本数据得出人口结论的强大技术。这是您第一次接触推断统计。您将从构建置信区间开始，这是一种以一定程度的确定性来估计均值和比例等 Population 参数的方法。您将学习如何构建和解释均值和比例的置信区间。您还将了解这种强大的技术如何帮助您在研究许多商业问题时管理固有的不确定性。接下来，您将进行假设检验，这是统计推断的基石，可以帮助您确定观察到的差异反映的是随机变化还是真实差异。您将了解如何提出假设、计算测试统计量和解释 P-value 以做出数据驱动的决策。在整个课程中，您将使用 Large Language Model 作为描述性和推断性统计的思维伙伴。您将看到 AI 如何帮助提出假设、解释结果，甚至为这些统计执行计算和创建可视化。

本 Modulation 介绍用于探索、总结和分析数据的核心统计概念和技术。学习者将从研究 Sampling 方法、最佳实践和潜在 Bias 开始。他们还将了解如何使用 GenAI 来排查电子表格公式和错误，以加强其解析工作流程。此外，他们还将应用中心倾向、Variable 和偏度度量来解释数据分布，并使用直方图、箱形图和柱形图将见解 Visualization。最后，该 Modulation 将展示如何使用电子表格进行相关性分析和数据分割。

涵盖的内容

27个视频8篇阅读材料7个作业1个非评分实验室

27个视频总计101分钟

欢迎参加本课程5分钟
本课程中的生成 AI2分钟
单元 1 引言1分钟
Population and sampling（人口与采样5分钟
确定 Population3分钟
概率 Sampling5分钟
非概率 Sampling 样本3分钟
Bias 的类型5分钟
直方图4分钟
演示：绘制分布图4分钟
中心倾向、变量和偏度2分钟
中心倾向：平均值和模式4分钟
中心倾向：中位数3分钟
演示：中心倾向4分钟
可变性：范围和四分位数间范围3分钟
变量：方差和标准偏差5分钟
偏度3分钟
为什么使用这些措施？2分钟
演示：可变性和偏度3分钟
方框图4分钟
演示：电子表格公式和错误的 LLM6分钟
相关性5分钟
相关性和因果关系3分钟
演示：电子表格中的相关性和散点图5分钟
什么是细分？3分钟
演示： xlookup4分钟
演示：数据透视表5分钟

8篇阅读材料总计198分钟

加入 DeepLearning.AI 论坛，提出问题、获得支持或分享奇思妙想！2分钟
实践中的 Bias15分钟
实践实验室：使用数据进行 DJ - 第 1 部分30分钟
实践实验室：使用数据进行 DJ - 第 2 部分30分钟
关于本课程的 LLM 实验室10分钟
实践实验室：使用数据进行 DJ - 第 3 部分30分钟
分级实验室：森林防火80分钟
Module 1 讲座笔记1分钟

7个作业总计110分钟

第 1 课测验10分钟
第二课测验10分钟
第 3 课测验10分钟
第 4 课测验10分钟
第 5 课测验10分钟
第一单元测验30分钟
分级实验室：森林防火见解测验30分钟

1个非评分实验室总计30分钟

实践实验室：使用 LLM 查找电子表格公式和错误30分钟

本模块涵盖基本概率概念及其在数据分析和决策中的应用。学员将探索用于量化不确定性的概率规则、分布和主要统计原理。他们将区分不同类型的事件，比较离散和连续分布，并将正态分布应用于现实世界的数据集。该模块还介绍了模拟技术，包括随机变量生成，以模拟不确定性并支持数据驱动决策。

涵盖的内容

22个视频12篇阅读材料5个作业1个非评分实验室

22个视频总计91分钟

单元 2 引言1分钟
随机性和不确定性3分钟
Probability 和加法法则4分钟
乘法和补法规则5分钟
条件概率3分钟
独立4分钟
随机变量5分钟
估算3分钟
从样本分布到总体分布5分钟
伯努利分布4分钟
二项分布6分钟
累积分布函数3分钟
随机抽样 - 离散型4分钟
演示：电子表格模拟 - 离散6分钟
演示：LLM 模拟 - 离散3分钟
连续概率分布4分钟
正态分布6分钟
标准正态分布5分钟
随机抽样 - 正常3分钟
演示：电子表格模拟 - 正常4分钟
演示：LLM 模拟 - 正常4分钟
利用分布做出决策5分钟

12篇阅读材料总计401分钟

掷硬币和掷骰子15分钟
Probability 词汇表10分钟
实践实验室：利用数据跟踪进行 DJ - 第 1 部分80分钟
模拟实践10分钟
Distribution 概率分布词汇表10分钟
实践实验室：利用数据跟踪进行 DJ - 第 2 部分80分钟
了解 Z-Score10分钟
其他分配情况15分钟
连续概率分布词汇10分钟
实践实验室：利用数据跟踪进行 DJ - 第 3 部分80分钟
分级实验室：森林防火后续行动80分钟
Module 2 讲座笔记1分钟

5个作业总计90分钟

第 1 课测验10分钟
第二课测验10分钟
第 3 课测验10分钟
第二单元测验30分钟
分级实验室：森林防火后续见解测验30分钟

1个非评分实验室总计80分钟

实践实验室：使用 LLM 进行模拟80分钟

涵盖的内容

14个视频5篇阅读材料5个作业1个非评分实验室

14个视频总计59分钟

单元 3 引言1分钟
推理统计4分钟
点和区间估算3分钟
取样分布与中心极限定理6分钟
演示：置信区间在行动2分钟
置信区间5分钟
置信区间机制6分钟
了解误差范围7分钟
演示：均值的置信区间4分钟
比例的 Confidence Interval4分钟
演示：比例的置信区间4分钟
法学硕士的口译4分钟
用 LLM 模拟随机抽样5分钟
使用 LLM 进行推理和可视化4分钟

5篇阅读材料总计156分钟

中心极限定理15分钟
实践实验室：人类睡眠模式与压力 - 第 1 部分30分钟
实践实验室：人类睡眠模式与压力 - 第 2 部分30分钟
分级实验室钻石价格80分钟
Module 3 讲座笔记1分钟

5个作业总计80分钟

第 1 课测验10分钟
第二课测验5分钟
第 3 课测验5分钟
第 3 单元测验30分钟
分级实验室：钻石价格洞察测验30分钟

1个非评分实验室总计80分钟

实践实验室：使用 LLM 计算置信区间80分钟

涵盖的内容

18个视频7篇阅读材料5个作业1个非评分实验室

18个视频总计79分钟

单元 4 引言1分钟
演示：假设检验实际操作4分钟
假设检验：平均值6分钟
假设4分钟
确定假设和检验类型4分钟
计算检验统计量3分钟
确定显著性水平和拒绝区域6分钟
计算 p 值5分钟
演示：均值假设检验6分钟
假设检验错误5分钟
t 分布6分钟
比例假设检验6分钟
演示：比例假设检验4分钟
两项抽样测试6分钟
其他假设检验4分钟
法学硕士的口译4分钟
使用 LLM 进行推理5分钟
下一步工作1分钟

7篇阅读材料总计341分钟

实践实验室：人类睡眠模式与压力--第 3 部分80分钟
解释统计推论15分钟
实践实验室：人类睡眠模式与压力--第 4 部分80分钟
分级实验室钻石价格80分钟
Module 4 讲座笔记1分钟
毕业设计：预防心脏病80分钟
致谢5分钟

5个作业总计110分钟

第 1 课测验15分钟
第二课测验5分钟
第 4 单元测验30分钟
分级实验室：钻石价格洞察测验30分钟
顶点：心脏病预防知识问答30分钟

1个非评分实验室总计80分钟

实践实验室：使用 LLM 进行假设检验80分钟

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

授课教师评分

(25个评价)

顶尖授课教师

Sean Barnes

DeepLearning.AI

5 门课程46,269 名学生

提供方

DeepLearning.AI

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

自 2018开始学习的学生

''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情，我就可以学习。'

Jennifer J.

自 2020开始学习的学生

''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'

Larry W.

自 2021开始学习的学生

''如果我的大学不提供我需要的主题课程，Coursera 便是最好的去处之一。'

Chaitanya A.

''学习不仅仅是在工作中做的更好：它远不止于此。Coursera 让我无限制地学习。'

学生评论

5 stars
91.66%
4 stars
6.66%
3 stars
1.66%
2 stars
0%
1 star
0%

显示 3/60 个

已于 Oct 24, 2025审阅

I have tried several different sources for central limit theorem, confidence intervals, hypothesis testing etc. and in this course it is perfectly explained.

已于 Oct 11, 2025审阅

The best course on foundations of data analytics. Sean Barnes is the best instructor.

已于 Aug 23, 2025审阅

Delivery of the lectures is excellent and very practical, gained a lot of insights on statistical analysis which has been my dream.

查看更多评论