本系列课程的目的是向有抱负的数据科学家或新数据科学家传授计算统计的基础知识,以便进行推理。这并不是一门教授统计学和概率论基础知识的综合课程,也不包括基于零假设显著性检验 (NHST) 的频数统计技术。它所涵盖的内容有
贝叶斯统计和概率的基础知识
了解贝叶斯推断及其工作原理
在 Python 中执行贝叶斯推断所需的最基本工具集和知识体系,即由 NumPy、Pandas、Scipy、Matplotlib、Seaborn 和 Plot.ly 组成的 PyData 堆栈
基于 Python 的可扩展贝叶斯推理框架,即 PyMC3
考虑到这一目标,课程内容分为以下三个主要部分(课程)。
贝叶斯统计简介 - 学员将从课程 1 开始学习概率、贝叶斯建模和推断的基础知识。
蒙特卡罗方法介绍 - 随后将在课程 2 中进行一系列讲座,介绍在无法进行精确计算时如何进行近似推断。
用于贝叶斯建模和推理的 PyMC3 - 将介绍 PyMC3 及其在现实世界中的应用。
讲座将通过 Jupyter 笔记本进行,与会者应与笔记本进行互动。
应用的学习项目
用 Python 实现分布,用 Matplotlib 或 Seaborn 进行静态可视化,用 Plot.ly 进行交互可视化。
用 Python 实现蒙特卡罗采样算法。
学习 PyMC3 用于各种贝叶斯建模的基础知识,包括线性回归、层次回归、分类、稳健模型和模型质量评估。
使用 PyMC3 对 COVID-19 的疾病动力学进行建模,并从实际数据中推断 SIR 模型的参数。














