使用 Python 进行机器学习

使用 Python 进行机器学习

本课程是多个项目的一部分。

位教师：Joseph Santarcangelo

访问权限由 New York State Department of Labor 提供

671,867 人已注册

6个模块

深入了解一个主题并学习基础知识。

18,342 条评论

中级等级

推荐体验

灵活的计划

2 周在 10 小时一周

自行安排学习进度

94%

大多数学生喜欢此课程

6个模块

深入了解一个主题并学习基础知识。

18,342 条评论

中级等级

推荐体验

灵活的计划

2 周在 10 小时一周

自行安排学习进度

94%

大多数学生喜欢此课程

您将学到什么

解释机器学习中涉及的关键概念、工具和角色，包括监督和非监督学习技术。
使用 Python 和 Scikit-learn 应用核心机器学习算法，如 Regression、分类、Cluster 和降维。
使用适当的指标、验证策略和优化技术评估模型性能。
通过动手实验室、项目和实际评估，在真实数据集上构建和评估端到端 Machine Learning 解决方案。

您将获得的技能

您将学习的工具

要了解的详细信息

可分享的证书

添加到您的领英档案

作业

17 项作业

授课语言：英语（English）

了解顶级公司的员工如何掌握热门技能

了解关于 Coursera for Business 的更多信息

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

积累特定领域的专业知识

此课程作为的一部分提供

在注册此课程时，您还需要选择一个特定的合作项目。

向行业专家学习新概念
获得对主题或工具的基础理解
通过实践项目培养工作相关技能
通过 IBM 获得可共享的职业证书

该课程共有6个模块

Python 是机器学习的核心技能，本课程将为您提供有效应用 Python 的工具。您将学习关键的 ML 概念，使用 Scikit-learn 建立模型，并获得使用 Jupyter Notebook 的实践经验。

从线性回归、多重线性回归、多项式回归和 Logistic 回归等回归技术开始。然后进入监督模型，如决策树、K-Nearest Neighbors 和 Support Vector Machine。您还将探索无监督学习，包括使用 PCA、t-SNE 和 UnMAP 进行聚类方法和降维。通过实际实验，您将练习模型 Evaluation、交叉验证、Regularization 和管道优化。关于降雨预测的期末项目和全课程考试将帮助您应用和巩固技能。现在就报名，开始自信地使用 Python 构建机器学习模型。

在本 Module 中，您将探索机器学习的基础概念，为使用 Python 进行实践建模做好准备。您将解释 Python 和 Scikit-learn 在机器学习中的相关性，总结 IBM AI 工程认证路径，并对常见的学习算法类型进行分类。您将概述机器学习模型生命周期的各个阶段，并描述机器学习工程师典型的一天是什么样的。您还将比较 AI 领域的关键角色，识别广泛使用的 Open Source 工具，并学习使用 Scikit-learn 构建和评估简单模型。

涵盖的内容

8个视频3篇阅读材料4个作业

8个视频总计52分钟

课程介绍3分钟
IBM AI 工程 PC 概览8分钟
机器学习概述8分钟
机器学习模型生命周期2分钟
机器学习工程师的一天8分钟
数据科学家 vs AI 工程师11分钟
机器学习工具9分钟
Scikit-learn 机器学习生态系统5分钟

3篇阅读材料总计20分钟

课程概览5分钟
完成课程的有用提示10分钟
模块 1 摘要和要点5分钟

4个作业总计57分钟

练习测验：探索机器学习概念12分钟
实践测验：了解 ML 工程与人工智能的区别12分钟
实践测验：ML 的基本工具和生态系统12分钟
分级测验：机器学习入门21分钟

在本 Modulation 中，您将探索机器学习中使用的两种基本回归技术--线性回归和 Logistic 回归。您将解释回归在预测结果中的作用，描述简单线性回归和多重线性回归之间的区别，并使用 Scikit-learn 在实际数据中应用这两种回归。您还将解读多项式和非线性回归模型如何捕捉复杂的模式。该 Modulation 将介绍 Logistic Regression 这种分类方法，并指导您有效地训练和测试分类模型。为支持您的学习，您将收到一份 "小抄"：线性回归和 Logistic 回归》，其中总结了关键概念、公式和 Use Cases。

涵盖的内容

6个视频2篇阅读材料3个作业3个应用程序项目

6个视频总计38分钟

回归简介4分钟
简单线性回归简介5分钟
多元线性回归简介8分钟
多项式和非线性回归7分钟
逻辑回归简介7分钟
训练逻辑回归模型6分钟

2篇阅读材料总计15分钟

Module 2 总结和要点5分钟
小抄：Linear Regression 和 Logistic Regression10分钟

3个作业总计41分钟

练习测验：线性回归10分钟
练习测验：Logistic Regression10分钟
分级测验：线性回归和 Logistic 回归21分钟

3个应用程序项目总计60分钟

实验室：简单线性回归15分钟
实验室：多元线性回归15分钟
实验室逻辑回归30分钟

在本 Modulation 中，您将构建和评估一系列有监督的机器学习模型，以解决分类和 Regression 问题。首先，您将介绍分类 Model 如何预测 Categorical Data 结果，并使用真实世界的数据实施多类分类策略。然后，您将探索决策树如何进行预测，并将其应用于分类和回归任务。该 Modulation 还包括使用支持向量机 (SVM) 进行欺诈检测，应用 K-Nearest Neighbors (KNN) 进行客户分类，以及训练 Random Forest 和 XGBoighbost 等集合模型以提高准确性和效率。您将区分模型性能中的 Bias 和 Variance，并探索集合方法如何帮助平衡这种权衡。为了支持您的学习，您将收到一份小册子：建立监督学习模型》，其中包含关键术语、模型类型和 Evaluation 提示。

涵盖的内容

6个视频3篇阅读材料3个作业6个应用程序项目

6个视频总计39分钟

分类6分钟
决策树7分钟
回归树6分钟
使用 SVM 进行监督学习7分钟
利用 KNN 进行监督学习6分钟
Bias、Variance 和集合模型6分钟

3篇阅读材料总计23分钟

勘误表：Regression Tree 视频3分钟
Module 3 总结和要点5分钟
小抄：构建监督学习模型15分钟

3个作业总计41分钟

练习测验：分类与回归10分钟
练习测验：其他监督学习模型10分钟
分级测验：构建监督学习模型21分钟

6个应用程序项目总计160分钟

实验室多类分类30分钟
实验室决策树25分钟
实验室回归树30分钟
实验室利用决策树和 SVM 进行信用卡欺诈检测30分钟
实验室K-Nearest Neighbors 分类器25分钟
实验室Random Forest 和 XGBoost20分钟

在本 Modulation 中，您将学习无监督学习技术如何在不使用标记响应的情况下发现数据中的隐藏模式。您将描述 Clustering 概念，并将 K-means 应用到实际的客户细分任务中。您还将比较 DBSCAN 和 HDBSCAN 模型，以识别空间数据中的密集 Cluster。除了 Cluster 之外，您还将探索降维作为简化高维数据集的工具。您将应用 PCA 来发现关键成分，并使用 t-SNE 和 UMAP 等高级技术来实现 Data Structure 的可视化。为了支持您的学习，您将收到一份小册子：建立无监督学习模型》，重点介绍核心方法、实际 Cases 和比较指南。

涵盖的内容

5个视频2篇阅读材料3个作业4个应用程序项目

5个视频总计31分钟

Cluster 策略和实际应用7分钟
K-means 和更多关于 K-means 的信息7分钟
DBSCAN 和 HDBSCAN 集群7分钟
聚类、降维与特征工程5分钟
降维算法5分钟

2篇阅读材料总计20分钟

Module 4 总结和要点5分钟
小抄：构建无监督学习模型15分钟

3个作业总计41分钟

练习测验：聚类10分钟
实践测验：降维与 Feature Engineering10分钟
分级测验：构建无监督学习模型21分钟

4个应用程序项目总计115分钟

实验室K-means25分钟
实验室比较 DBSCAN 和 HDBSCAN30分钟
实验室主成分分析 (PCA) 的应用30分钟
实验室：t-SNE 和 UMAP30分钟

在本 Modulation 中，您将学习如何使用行业标准的评估和验证技术来评估机器学习模型的有效性。您将解释关键的 Classification 和 Regression 指标，使用真实世界的数据评估 Model，并使用混淆矩阵和 Feature 重要性图表等工具解释结果。您将探索如何评估无监督学习中的 Cluster 质量，并应用交叉验证来减少过拟合。该 Modulation 还将介绍 Regularization 方法，以提高模型泛化能力并降低特征复杂度。最后，您将构建完整的 Machine Learning Pipeline，并使用 GridSearchCV 对其进行优化，同时识别数据 Leakage 等常见陷阱。为了支持您的学习，您将收到一份小册子：Evaluating and Validating Machine Learning Models》，内容涵盖关键指标、技术和模型调整策略。

涵盖的内容

6个视频2篇阅读材料3个作业5个应用程序项目

6个视频总计39分钟

分类指标和评估技术6分钟
Regression 指标和评估技术5分钟
评估无监督学习模型：Heuristic 和技术7分钟
交叉验证和高级模型验证技术6分钟
回归和分类中的 Regularization7分钟
数据泄漏和其他陷阱7分钟

2篇阅读材料总计20分钟

模块 5 总结和要点5分钟
小抄：评估和验证 Machine Learning 模型15分钟

3个作业总计41分钟

练习测验：评估机器学习模型10分钟
实践测验：确保模型通用性的最佳做法10分钟
分级测验：评估和验证机器学习模型21分钟

5个应用程序项目总计160分钟

实验室：评估分类模型25分钟
实验室评估 Random Forest 性能30分钟
实验室评估 K-means 聚类法30分钟
实验室：线性回归中的 Regularization30分钟
实验室机器学习管道和 GridSearchCV45分钟

在最后这个 Modulation 模块中，您将应用并展示在整个课程中获得的全部技能。您将从使用泰坦尼克数据集的实践项目开始，使用管道、交叉验证和超参数调整来构建和优化分类模型。然后，您将利用历史天气数据开发一个降雨预测分类器，从而完成最终项目。这包括数据 Cleaning、Feature Engineering、模型构建和性能评估。课程结束时，您将参加一次分级期末考试，测试您对所有六个 Modulation 知识的掌握情况。该 Modulation 为您提供了在实践和理论环境中展示所学知识的机会。

涵盖的内容

1个视频3篇阅读材料1个作业3个应用程序项目

1个视频总计7分钟

课程总结7分钟

3篇阅读材料总计13分钟

最终项目方案2分钟
祝贺和下一步行动6分钟
课程团队的感谢5分钟

1个作业总计45分钟

期末考试45分钟

3个应用程序项目总计150分钟

实践项目：泰坦尼克号生存预测30分钟
最终项目构建降雨预测分类器60分钟
最终项目提交和评估60分钟

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

授课教师评分

(3,486个评价)

Joseph Santarcangelo

IBM

37 门课程2,424,852 名学生

Jeff Grossman

IBM

3 门课程739,655 名学生

SAEED AGHABOZORGI

IBM

4 门课程675,754 名学生

提供方

IBM

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

自 2018开始学习的学生

''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情，我就可以学习。'

Jennifer J.

自 2020开始学习的学生

''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'

Larry W.

自 2021开始学习的学生

''如果我的大学不提供我需要的主题课程，Coursera 便是最好的去处之一。'

Chaitanya A.

''学习不仅仅是在工作中做的更好：它远不止于此。Coursera 让我无限制地学习。'

学生评论

5 stars
75.94%
4 stars
18.60%
3 stars
3.43%
2 stars
0.99%
1 star
1.01%

显示 3/18342 个

已于 Dec 31, 2019审阅

could be split in two courses to be given enough focus. it was very condensed and needed more time and explanation in each section. The instructor was very good but more details would have been nice

已于 Aug 28, 2019审阅

Very informative course, showing mostly how to use many different Machine Learning techniques. Although mathematical details are not discussed much, the intuition of the methods are discussed.

已于 Jun 24, 2020审阅

This course walks us through the fundamentals of machine learning methods. The capstone project is very useful for those who have previous knowledge of machine learning and Python programming.

查看更多评论