Python 是机器学习的核心技能,本课程将为您提供有效应用 Python 的工具。您将学习关键的 ML 概念,使用 Scikit-learn 建立模型,并获得使用 Jupyter Notebook 的实践经验。

使用 Python 进行机器学习
本课程是多个项目的一部分。
访问权限由 New York State Department of Labor 提供
655,738 人已注册
您将学到什么
解释机器学习中涉及的关键概念、工具和角色,包括监督和非监督学习技术。
使用 Python 和 Scikit-learn 应用核心机器学习算法,如 Regression、分类、Cluster 和降维。
使用适当的指标、验证策略和优化技术评估模型性能。
通过动手实验室、项目和实际评估,在真实数据集上构建和评估端到端 Machine Learning 解决方案。
要了解的详细信息

添加到您的领英档案
15 项作业
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 通过 IBM 获得可共享的职业证书

该课程共有6个模块
在本 Module 中,您将探索机器学习的基础概念,为使用 Python 进行实践建模做好准备。您将解释 Python 和 Scikit-learn 在机器学习中的相关性,总结 IBM AI 工程认证路径,并对常见的学习算法类型进行分类。您将概述机器学习模型生命周期的各个阶段,并描述机器学习工程师典型的一天是什么样的。您还将比较 AI 领域的关键角色,识别广泛使用的 Open Source 工具,并学习使用 Scikit-learn 构建和评估简单模型。
涵盖的内容
8个视频2篇阅读材料2个作业1个插件
在本 Modulation 中,您将探索机器学习中使用的两种基本回归技术--线性回归和 Logistic 回归。您将解释回归在预测结果中的作用,描述简单线性回归和多重线性回归之间的区别,并使用 Scikit-learn 在实际数据中应用这两种回归。您还将解读多项式和非线性回归模型如何捕捉复杂的模式。该 Modulation 将介绍 Logistic Regression 这种分类方法,并指导您有效地训练和测试分类模型。为支持您的学习,您将收到一份 "小抄":线性回归和 Logistic 回归》,其中总结了关键概念、公式和 Use Cases。
涵盖的内容
6个视频1篇阅读材料3个作业3个应用程序项目1个插件
在本 Modulation 中,您将构建和评估一系列有监督的机器学习模型,以解决分类和 Regression 问题。首先,您将介绍分类 Model 如何预测 Categorical Data 结果,并使用真实世界的数据实施多类分类策略。然后,您将探索决策树如何进行预测,并将其应用于分类和回归任务。该 Modulation 还包括使用支持向量机 (SVM) 进行欺诈检测,应用 K-Nearest Neighbors (KNN) 进行客户分类,以及训练 Random Forest 和 XGBoighbost 等集合模型以提高准确性和效率。您将区分模型性能中的 Bias 和 Variance,并探索集合方法如何帮助平衡这种权衡。为了支持您的学习,您将收到一份小册子:建立监督学习模型》,其中包含关键术语、模型类型和 Evaluation 提示。
涵盖的内容
6个视频2篇阅读材料3个作业6个应用程序项目1个插件
在本 Modulation 中,您将学习无监督学习技术如何在不使用标记响应的情况下发现数据中的隐藏模式。您将描述 Clustering 概念,并将 K-means 应用到实际的客户细分任务中。您还将比较 DBSCAN 和 HDBSCAN 模型,以识别空间数据中的密集 Cluster。除了 Cluster 之外,您还将探索降维作为简化高维数据集的工具。您将应用 PCA 来发现关键成分,并使用 t-SNE 和 UMAP 等高级技术来实现 Data Structure 的可视化。为了支持您的学习,您将收到一份小册子:建立无监督学习模型》,重点介绍核心方法、实际 Cases 和比较指南。
涵盖的内容
5个视频1篇阅读材料3个作业4个应用程序项目1个插件
在本 Modulation 中,您将学习如何使用行业标准的评估和验证技术来评估机器学习模型的有效性。您将解释关键的 Classification 和 Regression 指标,使用真实世界的数据评估 Model,并使用混淆矩阵和 Feature 重要性图表等工具解释结果。您将探索如何评估无监督学习中的 Cluster 质量,并应用交叉验证来减少过拟合。该 Modulation 还将介绍 Regularization 方法,以提高模型泛化能力并降低特征复杂度。最后,您将构建完整的 Machine Learning Pipeline,并使用 GridSearchCV 对其进行优化,同时识别数据 Leakage 等常见陷阱。为了支持您的学习,您将收到一份小册子:Evaluating and Validating Machine Learning Models》,内容涵盖关键指标、技术和模型调整策略。
涵盖的内容
6个视频1篇阅读材料3个作业5个应用程序项目1个插件
在最后这个 Modulation 模块中,您将应用并展示在整个课程中获得的全部技能。您将从使用泰坦尼克数据集的实践项目开始,使用管道、交叉验证和超参数调整来构建和优化分类模型。然后,您将利用历史天气数据开发一个降雨预测分类器,从而完成最终项目。这包括数据 Cleaning、Feature Engineering、模型构建和性能评估。课程结束时,您将参加一次分级期末考试,测试您对所有六个 Modulation 知识的掌握情况。该 Modulation 为您提供了在实践和理论环境中展示所学知识的机会。
涵盖的内容
1个视频3篇阅读材料1个作业3个应用程序项目
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师



提供方
人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
75.95%
- 4 stars
18.59%
- 3 stars
3.44%
- 2 stars
0.99%
- 1 star
1.01%
显示 3/18273 个
已于 Aug 31, 2020审阅
This is an amazing course. specially for those with little knowledge with python. This course has helped with the basic understanding of Machine learning and usage of python as a data scientist.
已于 Dec 13, 2022审阅
Thank you Coursera & IBM for offering such a wonderful career-oriented course. Thank you very much Dr SAEED AGHABOZORGI and Dr Joseph Santarcangelo for providing the amazing learning Journey.
已于 Oct 8, 2020审阅
I'm extremely excited with what I have learnt so far. As a newbie in Machine Learning, the exposure gained will serve as the much needed foundation to delve into its application to real life problems.
从 数据科学 浏览更多内容

O.P. Jindal Global University

Arizona State University




