在本课程中,您将学习到作为数据分析师职业生涯基础的基本统计概念、分析和 Visualization。 无论您是统计新手还是希望重温技能,本课程都将让您掌握从数据中提取有意义见解的强大技术。课程结束后,您将更有信心和能力在数据分析师的职业生涯中实施严格的统计分析!
在第一个 Modulation 中,您将探索能够进行严格 Data Analysis 的统计学基本构件。课程结束时,您将能够定义 Populations、sample 和 sampling 方法;使用中心倾向、Variable 和 skewness 度量来描述数据集的特征;使用相关性来理解特征之间的关系;以及使用细分来揭示数据中不同群体的洞察力。您将把这些概念应用到真实世界的场景中:分析电影评分和随时间推移的持续时间、解释客户行为和探索医疗保健结果。 在第二个 Modulation 中,您将学习关键概率规则和概念,如条件概率和独立性,所有这些都与您作为数据分析师会遇到的真实世界案例相关。然后,您将探索概率分布,包括离散分布和连续分布。您将了解二项分布和正态分布等重要分布,以及它们如何为现实世界的现象建模。您还将了解如何使用 Sampling Distribution 样本数据来了解 Population 的分布,以及如何回答常见的业务问题,如某些结果或结果范围有多常见?最后,您将亲身体验模拟技术。您将看到如何按照特定 Distribution 生成随机数据,从而为复杂情况建模并为决策提供依据。 在模块 3 和 4 中,您将学习基于样本数据得出人口结论的强大技术。这是您第一次接触推断统计。您将从构建置信区间开始,这是一种以一定程度的确定性来估计均值和比例等 Population 参数的方法。您将学习如何构建和解释均值和比例的置信区间。您还将了解这种强大的技术如何帮助您在研究许多商业问题时管理固有的不确定性。接下来,您将进行假设检验,这是统计推断的基石,可以帮助您确定观察到的差异反映的是随机变化还是真实差异。您将了解如何提出假设、计算测试统计量和解释 P-value 以做出数据驱动的决策。在整个课程中,您将使用 Large Language Model 作为描述性和推断性统计的思维伙伴。您将看到 AI 如何帮助提出假设、解释结果,甚至为这些统计执行计算和创建可视化。












