Python 是机器学习的核心技能,本课程将为您提供有效应用 Python 的工具。您将学习关键的 ML 概念,使用 Scikit-learn 建立模型,并获得使用 Jupyter Notebook 的实践经验。


您将学到什么
解释机器学习中涉及的关键概念、工具和角色,包括监督和非监督学习技术。
使用 Python 和 Scikit-learn 应用核心机器学习算法,如 Regression、分类、Cluster 和降维。
使用适当的指标、验证策略和优化技术评估模型性能。
通过动手实验室、项目和实际评估,在真实数据集上构建和评估端到端 Machine Learning 解决方案。
要了解的详细信息

添加到您的领英档案
15 项作业
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 通过 IBM 获得可共享的职业证书

该课程共有6个模块
在本 Module 中,您将探索机器学习的基础概念,为使用 Python 进行实践建模做好准备。您将解释 Python 和 Scikit-learn 在机器学习中的相关性,总结 IBM AI 工程认证路径,并对常见的学习算法类型进行分类。您将概述机器学习模型生命周期的各个阶段,并描述机器学习工程师典型的一天是什么样的。您还将比较 AI 领域的关键角色,识别广泛使用的 Open Source 工具,并学习使用 Scikit-learn 构建和评估简单模型。
涵盖的内容
8个视频2篇阅读材料2个作业1个插件
在本 Modulation 中,您将探索机器学习中使用的两种基本回归技术--线性回归和 Logistic 回归。您将解释回归在预测结果中的作用,描述简单线性回归和多重线性回归之间的区别,并使用 Scikit-learn 在实际数据中应用这两种回归。您还将解读多项式和非线性回归模型如何捕捉复杂的模式。该 Modulation 将介绍 Logistic Regression 这种分类方法,并指导您有效地训练和测试分类模型。为支持您的学习,您将收到一份 "小抄":线性回归和 Logistic 回归》,其中总结了关键概念、公式和 Use Cases。
涵盖的内容
6个视频1篇阅读材料3个作业3个应用程序项目1个插件
在本 Modulation 中,您将构建和评估一系列有监督的机器学习模型,以解决分类和 Regression 问题。首先,您将介绍分类 Model 如何预测 Categorical Data 结果,并使用真实世界的数据实施多类分类策略。然后,您将探索决策树如何进行预测,并将其应用于分类和回归任务。该 Modulation 还包括使用支持向量机 (SVM) 进行欺诈检测,应用 K-Nearest Neighbors (KNN) 进行客户分类,以及训练 Random Forest 和 XGBoighbost 等集合模型以提高准确性和效率。您将区分模型性能中的 Bias 和 Variance,并探索集合方法如何帮助平衡这种权衡。为了支持您的学习,您将收到一份小册子:建立监督学习模型》,其中包含关键术语、模型类型和 Evaluation 提示。
涵盖的内容
6个视频1篇阅读材料3个作业6个应用程序项目1个插件
在本 Modulation 中,您将学习无监督学习技术如何在不使用标记响应的情况下发现数据中的隐藏模式。您将描述 Clustering 概念,并将 K-means 应用到实际的客户细分任务中。您还将比较 DBSCAN 和 HDBSCAN 模型,以识别空间数据中的密集 Cluster。除了 Cluster 之外,您还将探索降维作为简化高维数据集的工具。您将应用 PCA 来发现关键成分,并使用 t-SNE 和 UMAP 等高级技术来实现 Data Structure 的可视化。为了支持您的学习,您将收到一份小册子:建立无监督学习模型》,重点介绍核心方法、实际 Cases 和比较指南。
涵盖的内容
5个视频1篇阅读材料3个作业4个应用程序项目1个插件
在本 Modulation 中,您将学习如何使用行业标准的评估和验证技术来评估机器学习模型的有效性。您将解释关键的 Classification 和 Regression 指标,使用真实世界的数据评估 Model,并使用混淆矩阵和 Feature 重要性图表等工具解释结果。您将探索如何评估无监督学习中的 Cluster 质量,并应用交叉验证来减少过拟合。该 Modulation 还将介绍 Regularization 方法,以提高模型泛化能力并降低特征复杂度。最后,您将构建完整的 Machine Learning Pipeline,并使用 GridSearchCV 对其进行优化,同时识别数据 Leakage 等常见陷阱。为了支持您的学习,您将收到一份小册子:Evaluating and Validating Machine Learning Models》,内容涵盖关键指标、技术和模型调整策略。
涵盖的内容
6个视频1篇阅读材料3个作业5个应用程序项目1个插件
在最后这个 Modulation 模块中,您将应用并展示在整个课程中获得的全部技能。您将从使用泰坦尼克数据集的实践项目开始,使用管道、交叉验证和超参数调整来构建和优化分类模型。然后,您将利用历史天气数据开发一个降雨预测分类器,从而完成最终项目。这包括数据 Cleaning、Feature Engineering、模型构建和性能评估。课程结束时,您将参加一次分级期末考试,测试您对所有六个 Modulation 知识的掌握情况。该 Modulation 为您提供了在实践和理论环境中展示所学知识的机会。
涵盖的内容
1个视频3篇阅读材料1个作业3个应用程序项目
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
提供方
从 机器学习 浏览更多内容
- 状态:免费试用
- 状态:免费试用
Arizona State University
- 状态:免费试用
人们为什么选择 Coursera 来帮助自己实现职业发展




学生评论
17,859 条评论
- 5 stars
75.90%
- 4 stars
18.63%
- 3 stars
3.44%
- 2 stars
0.99%
- 1 star
1.02%
显示 3/17859 个
已于 May 25, 2020审阅
Labs were incredibly useful as a practical learning tool which therefore helped in the final assignment! I wouldn't have done well in the final assignment without it together with the lecture videos!
已于 Oct 8, 2020审阅
I'm extremely excited with what I have learnt so far. As a newbie in Machine Learning, the exposure gained will serve as the much needed foundation to delve into its application to real life problems.
已于 Aug 28, 2019审阅
Very informative course, showing mostly how to use many different Machine Learning techniques. Although mathematical details are not discussed much, the intuition of the methods are discussed.
常见问题
Python 在机器学习领域的流行源于它的简单性、可读性以及 TensorFlow、PyTorch 和 scikit-learn 等丰富的库,这些库简化了复杂的 ML 任务。其活跃的社区以及与其他语言和工具的轻松集成也使 Python 成为 ML 的理想选择。
Machine Learning 工程师使用 Python 开发算法、预处理数据、训练模型和分析结果。借助 Python 丰富的库和框架,他们可以试验各种模型、优化性能并高效地部署应用程序。
Python 提供广泛的 ML 库,对初学者友好,对 Data Visualization 和 Model Interpretation 有很好的支持。它还支持 Rapid Prototyping,与 C++ 或 Java 等其他语言相比,更容易测试和完善模型。
更多问题
提供助学金,