谁应该参加这个课程？

本课程专为希望掌握基于 Python 的机器学习从数据准备、Data Modeling 开发到 Evaluation 和 Optimization 的基础技能的有志之士和当前机器学习从业人员设计。

我什么时候能看到讲座和作业？

要获取课程资料、作业和证书，您需要在注册课程时购买证书体验。您可以尝试免费试听，或申请资助。课程可能提供 "完整课程，无证书"。通过该选项，您可以查看所有课程资料，提交必要的评估，并获得最终成绩。这也意味着您无法购买证书体验。

订阅此证书能得到什么？

注册课程后，您就可以访问证书中的所有课程，并在完成作业后获得证书。您的电子证书将被添加到您的 "成就 "页面--在那里，您可以打印证书或将其添加到您的 LinkedIn 个人资料中。

使用 Python 进行机器学习

抓住节省的机会！购买 Coursera Plus 3 个月课程可享受40% 的折扣，并可完全访问数千门课程。

使用 Python 进行机器学习

Q: 我什么时候能看到讲座和作业？

要获取课程资料、作业和证书，您需要在注册课程时购买证书体验。 您可以尝试免费试听，或申请资助。课程可能提供 "完整课程，无证书"。通过该选项，您可以查看所有课程资料，提交必要的评估，并获得最终成绩。这也意味着您无法购买证书体验。

本课程是多个项目的一部分。

位教师：Joseph Santarcangelo

660,272 人已注册

包含在中

了解更多

6个模块

深入了解一个主题并学习基础知识。

18,291 条评论

中级等级

推荐体验

灵活的计划

2 周在 10 小时一周

自行安排学习进度

94%

大多数学生喜欢此课程

6个模块

深入了解一个主题并学习基础知识。

18,291 条评论

中级等级

推荐体验

灵活的计划

2 周在 10 小时一周

自行安排学习进度

94%

大多数学生喜欢此课程

您将学到什么

解释机器学习中涉及的关键概念、工具和角色，包括监督和非监督学习技术。
使用 Python 和 Scikit-learn 应用核心机器学习算法，如 Regression、分类、Cluster 和降维。
使用适当的指标、验证策略和优化技术评估模型性能。
通过动手实验室、项目和实际评估，在真实数据集上构建和评估端到端 Machine Learning 解决方案。

您将获得的技能

您将学习的工具

要了解的详细信息

可分享的证书

添加到您的领英档案

作业

15 项作业

授课语言：英语（English）

了解顶级公司的员工如何掌握热门技能

了解关于 Coursera for Business 的更多信息

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

积累特定领域的专业知识

此课程作为的一部分提供

在注册此课程时，您还需要选择一个特定的合作项目。

向行业专家学习新概念
获得对主题或工具的基础理解
通过实践项目培养工作相关技能
通过 IBM 获得可共享的职业证书

该课程共有6个模块

Python 是机器学习的核心技能，本课程将为您提供有效应用 Python 的工具。您将学习关键的 ML 概念，使用 Scikit-learn 建立模型，并获得使用 Jupyter Notebook 的实践经验。

从线性回归、多重线性回归、多项式回归和 Logistic 回归等回归技术开始。然后进入监督模型，如决策树、K-Nearest Neighbors 和 Support Vector Machine。您还将探索无监督学习，包括使用 PCA、t-SNE 和 UnMAP 进行聚类方法和降维。通过实际实验，您将练习模型 Evaluation、交叉验证、Regularization 和管道优化。关于降雨预测的期末项目和全课程考试将帮助您应用和巩固技能。现在就报名，开始自信地使用 Python 构建机器学习模型。

在本 Module 中，您将探索机器学习的基础概念，为使用 Python 进行实践建模做好准备。您将解释 Python 和 Scikit-learn 在机器学习中的相关性，总结 IBM AI 工程认证路径，并对常见的学习算法类型进行分类。您将概述机器学习模型生命周期的各个阶段，并描述机器学习工程师典型的一天是什么样的。您还将比较 AI 领域的关键角色，识别广泛使用的 Open Source 工具，并学习使用 Scikit-learn 构建和评估简单模型。

涵盖的内容

8个视频2篇阅读材料2个作业1个插件

8个视频总计52分钟

课程介绍 3分钟
IBM AI 工程 PC 概览 8分钟
机器学习概述 8分钟
机器学习模型生命周期 2分钟
机器学习工程师的一天 8分钟
数据科学家 vs AI 工程师 11分钟
机器学习工具 9分钟
Scikit-learn 机器学习生态系统 5分钟

2篇阅读材料总计10分钟

课程概览 5分钟
模块 1 摘要和要点 5分钟

2个作业总计31分钟

分级测验：机器学习入门 21分钟
练习测验：机器学习入门 10分钟

1个插件总计10分钟

阅读完成课程的有用提示 10分钟

在本 Modulation 中，您将探索机器学习中使用的两种基本回归技术--线性回归和 Logistic 回归。您将解释回归在预测结果中的作用，描述简单线性回归和多重线性回归之间的区别，并使用 Scikit-learn 在实际数据中应用这两种回归。您还将解读多项式和非线性回归模型如何捕捉复杂的模式。该 Modulation 将介绍 Logistic Regression 这种分类方法，并指导您有效地训练和测试分类模型。为支持您的学习，您将收到一份 "小抄"：线性回归和 Logistic 回归》，其中总结了关键概念、公式和 Use Cases。

涵盖的内容

6个视频1篇阅读材料3个作业3个应用程序项目1个插件

6个视频总计38分钟

回归简介 4分钟
简单线性回归简介 5分钟
多元线性回归简介 8分钟
多项式和非线性回归 7分钟
逻辑回归简介 7分钟
训练逻辑回归模型 6分钟

1篇阅读材料总计5分钟

Module 2 总结和要点 5分钟

3个作业总计41分钟

分级测验：线性回归和 Logistic 回归 21分钟
练习测验：线性回归 10分钟
练习测验：Logistic Regression 10分钟

3个应用程序项目总计60分钟

实验室：简单线性回归 15分钟
实验室：多元线性回归 15分钟
实验室逻辑回归 30分钟

1个插件总计15分钟

小抄：Linear Regression 和 Logistic Regression 15分钟

在本 Modulation 中，您将构建和评估一系列有监督的机器学习模型，以解决分类和 Regression 问题。首先，您将介绍分类 Model 如何预测 Categorical Data 结果，并使用真实世界的数据实施多类分类策略。然后，您将探索决策树如何进行预测，并将其应用于分类和回归任务。该 Modulation 还包括使用支持向量机 (SVM) 进行欺诈检测，应用 K-Nearest Neighbors (KNN) 进行客户分类，以及训练 Random Forest 和 XGBoighbost 等集合模型以提高准确性和效率。您将区分模型性能中的 Bias 和 Variance，并探索集合方法如何帮助平衡这种权衡。为了支持您的学习，您将收到一份小册子：建立监督学习模型》，其中包含关键术语、模型类型和 Evaluation 提示。

涵盖的内容

6个视频2篇阅读材料3个作业6个应用程序项目1个插件

6个视频总计39分钟

分类 6分钟
决策树 7分钟
回归树 6分钟
使用 SVM 进行监督学习 7分钟
利用 KNN 进行监督学习 6分钟
Bias、Variance 和集合模型 6分钟

2篇阅读材料总计8分钟

勘误表：Regression Tree 视频 3分钟
Module 3 总结和要点 5分钟

3个作业总计41分钟

分级测验：构建监督学习模型 21分钟
练习测验：分类与回归 10分钟
练习测验：其他监督学习模型 10分钟

6个应用程序项目总计160分钟

实验室多类分类 30分钟
实验室决策树 25分钟
实验室回归树 30分钟
实验室利用决策树和 SVM 进行信用卡欺诈检测 30分钟
实验室K-Nearest Neighbors 分类器 25分钟
实验室Random Forest 和 XGBoost 20分钟

1个插件总计15分钟

小抄：构建监督学习模型 15分钟

在本 Modulation 中，您将学习无监督学习技术如何在不使用标记响应的情况下发现数据中的隐藏模式。您将描述 Clustering 概念，并将 K-means 应用到实际的客户细分任务中。您还将比较 DBSCAN 和 HDBSCAN 模型，以识别空间数据中的密集 Cluster。除了 Cluster 之外，您还将探索降维作为简化高维数据集的工具。您将应用 PCA 来发现关键成分，并使用 t-SNE 和 UMAP 等高级技术来实现 Data Structure 的可视化。为了支持您的学习，您将收到一份小册子：建立无监督学习模型》，重点介绍核心方法、实际 Cases 和比较指南。

涵盖的内容

5个视频1篇阅读材料3个作业4个应用程序项目1个插件

5个视频总计31分钟

Cluster 策略和实际应用 7分钟
K-means 和更多关于 K-means 的信息 7分钟
DBSCAN 和 HDBSCAN 集群 7分钟
聚类、降维与特征工程 5分钟
降维算法 5分钟

1篇阅读材料总计5分钟

Module 4 总结和要点 5分钟

3个作业总计41分钟

分级测验：构建无监督学习模型 21分钟
练习测验：聚类 10分钟
实践测验：降维与 Feature Engineering 10分钟

4个应用程序项目总计115分钟

实验室K-means 25分钟
实验室比较 DBSCAN 和 HDBSCAN 30分钟
实验室主成分分析 (PCA) 的应用 30分钟
实验室：t-SNE 和 UMAP 30分钟

1个插件总计15分钟

小抄：构建无监督学习模型 15分钟

在本 Modulation 中，您将学习如何使用行业标准的评估和验证技术来评估机器学习模型的有效性。您将解释关键的 Classification 和 Regression 指标，使用真实世界的数据评估 Model，并使用混淆矩阵和 Feature 重要性图表等工具解释结果。您将探索如何评估无监督学习中的 Cluster 质量，并应用交叉验证来减少过拟合。该 Modulation 还将介绍 Regularization 方法，以提高模型泛化能力并降低特征复杂度。最后，您将构建完整的 Machine Learning Pipeline，并使用 GridSearchCV 对其进行优化，同时识别数据 Leakage 等常见陷阱。为了支持您的学习，您将收到一份小册子：Evaluating and Validating Machine Learning Models》，内容涵盖关键指标、技术和模型调整策略。

涵盖的内容

6个视频1篇阅读材料3个作业5个应用程序项目1个插件

6个视频总计39分钟

分类指标和评估技术 6分钟
Regression 指标和评估技术 5分钟
评估无监督学习模型：Heuristic 和技术 7分钟
交叉验证和高级模型验证技术 6分钟
回归和分类中的 Regularization 7分钟
数据泄漏和其他陷阱 7分钟

1篇阅读材料总计5分钟

模块 5 总结和要点 5分钟

3个作业总计41分钟

分级测验：评估和验证机器学习模型 21分钟
练习测验：评估机器学习模型 10分钟
实践测验：确保模型通用性的最佳做法 10分钟

5个应用程序项目总计160分钟

实验室：评估分类模型 25分钟
实验室评估 Random Forest 性能 30分钟
实验室评估 K-means 聚类法 30分钟
实验室：线性回归中的 Regularization 30分钟
实验室机器学习管道和 GridSearchCV 45分钟

1个插件总计15分钟

小抄：评估和验证 Machine Learning 模型 15分钟

在最后这个 Modulation 模块中，您将应用并展示在整个课程中获得的全部技能。您将从使用泰坦尼克数据集的实践项目开始，使用管道、交叉验证和超参数调整来构建和优化分类模型。然后，您将利用历史天气数据开发一个降雨预测分类器，从而完成最终项目。这包括数据 Cleaning、Feature Engineering、模型构建和性能评估。课程结束时，您将参加一次分级期末考试，测试您对所有六个 Modulation 知识的掌握情况。该 Modulation 为您提供了在实践和理论环境中展示所学知识的机会。

涵盖的内容

1个视频3篇阅读材料1个作业3个应用程序项目

1个视频总计7分钟

课程总结 7分钟

3篇阅读材料总计13分钟

最终项目方案 2分钟
祝贺和下一步行动 6分钟
课程团队的感谢 5分钟

1个作业总计45分钟

期末考试 45分钟

3个应用程序项目总计150分钟

实践项目：泰坦尼克号生存预测 30分钟
最终项目构建降雨预测分类器 60分钟
最终项目提交和评估 60分钟

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

授课教师评分

(3,471个评价)

Joseph Santarcangelo

IBM

37 门课程 2,376,871 名学生

Jeff Grossman

IBM

3 门课程 727,108 名学生

SAEED AGHABOZORGI

IBM

4 门课程 664,159 名学生

提供方

IBM

从机器学习浏览更多内容

状态：免费试用
Edureka
Applied Machine Learning with Python
课程
状态：预览
O.P. Jindal Global University
Machine Learning
课程
状态：免费试用
Arizona State University
Introduction to Machine Learning with Python
课程
状态：免费试用
Packt
Foundations of Data Science and Machine Learning with Python
课程

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

自 2018开始学习的学生

''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情，我就可以学习。'

Jennifer J.

自 2020开始学习的学生

''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'

Larry W.

自 2021开始学习的学生

''如果我的大学不提供我需要的主题课程，Coursera 便是最好的去处之一。'

Chaitanya A.

''学习不仅仅是在工作中做的更好：它远不止于此。Coursera 让我无限制地学习。'

学生评论

5 stars
75.93%
4 stars
18.61%
3 stars
3.43%
2 stars
0.99%
1 star
1.01%

显示 3/18291 个

已于 Dec 31, 2019审阅

could be split in two courses to be given enough focus. it was very condensed and needed more time and explanation in each section. The instructor was very good but more details would have been nice

已于 Dec 5, 2018审阅

I am happy to have this online education, I drop out my nuclear engineering degree, I am happy to learn practical things with future... I work for IBM also...but I want to become a data scientis

已于 Jun 3, 2020审阅

In peer graded assignments, if someone is grading any peer below passing criteria then it must be compulsory to let the learner know his mistakes or shortcomings because of which he does not graded.

查看更多评论