Python 中的应用机器学习

Python 中的应用机器学习

本课程是借助 Python 应用数据科学专项课程的一部分

位教师：Kevyn Collins-Thompson

访问权限由 New York State Department of Labor 提供

328,206 人已注册

4个模块

深入了解一个主题并学习基础知识。

8,775 条评论

中级等级

需要一些相关经验

灵活的计划

3 周在 10 小时一周

自行安排学习进度

92%

大多数学生喜欢此课程

4个模块

深入了解一个主题并学习基础知识。

8,775 条评论

中级等级

需要一些相关经验

灵活的计划

3 周在 10 小时一周

自行安排学习进度

92%

大多数学生喜欢此课程

您将学到什么

说明机器学习与描述性统计有何不同
创建和评估数据集群
解释创建预测模型的不同方法
构建满足分析需求的功能

您将获得的技能

您将学习的工具

要了解的详细信息

可分享的证书

添加到您的领英档案

作业

5 项作业

授课语言：英语（English）

了解顶级公司的员工如何掌握热门技能

了解关于 Coursera for Business 的更多信息

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

积累特定领域的专业知识

本课程是借助 Python 应用数据科学专项课程专项课程的一部分

在注册此课程时，您还会同时注册此专项课程。

向行业专家学习新概念
获得对主题或工具的基础理解
通过实践项目培养工作相关技能
获得可共享的职业证书

该课程共有4个模块

本课程将向学习者介绍应用机器学习，更侧重于技术和方法，而不是这些方法背后的统计学。课程将首先讨论机器学习与描述性统计有何不同，并通过教程介绍 scikit learn 工具包。课程将讨论数据的维度问题，并讨论对数据进行聚类以及评估这些聚类的任务。课程将介绍创建预测模型的监督方法，学员将能够应用 scikit learn 预测建模方法，同时了解与数据通用性相关的过程问题（如交叉验证、过拟合）。课程最后将介绍更高级的技术，如构建集合和预测模型的实际限制。课程结束时，学生将能够识别有监督（分类）和无监督（聚类）技术之间的区别，识别他们需要针对特定数据集和需求应用哪种技术，设计特征以满足该需求，并编写 python 代码以进行分析。

本模块介绍了机器学习的基本概念、任务和工作流程，使用基于 K 近邻法的分类问题示例，并使用 scikit-learn 库实现。

涵盖的内容

7个视频4篇阅读材料1个作业1个编程作业1个非评分实验室

7个视频总计75分钟

导言11分钟
有什么新消息？1分钟
机器学习的关键概念14分钟
用于机器学习的 Python 工具5分钟
机器学习问题示例12分钟
检查数据9分钟
K 最近邻分类24分钟

4篇阅读材料总计60分钟

教学大纲10分钟
帮助我们更多了解您！10分钟
审核学员须知：作业提交10分钟
扎卡里-利普顿算法偏见的基础（可选）30分钟

1个作业总计20分钟

第 1 单元测验20分钟

1个编程作业总计180分钟

作业 1180分钟

1个非评分实验室总计60分钟

模块 1 笔记本60分钟

本模块将深入探讨分类和回归的各种监督学习方法，学习模型复杂性与泛化性能之间的联系、适当特征缩放的重要性，以及如何通过应用正则化等技术控制模型复杂性以避免过度拟合。除了 k 最近邻之外，本周还将介绍线性回归（最小二乘、脊、拉索和多项式回归）、逻辑回归、支持向量机、使用交叉验证进行模型评估以及决策树。

涵盖的内容

13个视频2篇阅读材料2个作业1个编程作业2个非评分实验室

13个视频总计190分钟

监督机器学习入门17分钟
过拟合和欠拟合12分钟
监督学习：数据集5分钟
K-Nearest Neighbors：分类和回归13分钟
线性回归最小二乘18分钟
线性回归：岭回归、拉索回归和多项式回归27分钟
逻辑回归13分钟
线性分类器支持向量机14分钟
多级分类7分钟
核化支持向量机19分钟
交叉验证12分钟
决策树20分钟
单热编码（可选）14分钟

2篇阅读材料总计20分钟

关于机器学习的一些实用知识10分钟
埃德-勇自闭症基因测试遭驳斥（可选）10分钟

2个作业总计40分钟

第二单元测验30分钟
作业 2 - 跟进10分钟

1个编程作业总计180分钟

作业 2180分钟

2个非评分实验室总计120分钟

模块 2 笔记本60分钟
分类器可视化游戏空间60分钟

本模块包括评估和模型选择方法，您可以使用这些方法来帮助理解和优化机器学习模型的性能。

涵盖的内容

8个视频2篇阅读材料1个作业1个编程作业1个非评分实验室

8个视频总计113分钟

模型评估与选择22分钟
混淆矩阵和基本评估指标14分钟
分类器决策函数7分钟
精确度-召回率和 ROC 曲线8分钟
多类评估10分钟
回归评估6分钟
模型选择：针对不同的评估指标优化分类器13分钟
模型校准（可选）31分钟

2篇阅读材料总计20分钟

网络受控实验实用指南》（可选）10分钟
作业 3 的说明10分钟

1个作业总计28分钟

第 3 单元测验28分钟

1个编程作业总计180分钟

作业 3180分钟

1个非评分实验室总计60分钟

单元 3 笔记本60分钟

本模块涵盖更高级的监督学习方法，包括树集合（随机森林、梯度提升树）和神经网络（可选深度学习摘要）。您还将了解机器学习中的关键问题--数据泄露，以及如何检测和避免数据泄露。

涵盖的内容

10个视频13篇阅读材料1个作业1个编程作业2个非评分实验室

10个视频总计103分钟

Naive Bayes 分类器8分钟
随机森林12分钟
梯度提升决策树6分钟
神经网络19分钟
深度学习（可选）14分钟
数据泄漏13分钟
导言5分钟
降维与 Manifold Learning10分钟
聚类15分钟
结论3分钟

13篇阅读材料总计123分钟

神经网络轻松学（选修）10分钟
玩转神经网络：TensorFlow Playground（可选）10分钟
深度学习简述：核心概念（可选）10分钟
利用深度学习协助病理学家检测癌症（可选）10分钟
泄漏的背叛（可选）10分钟
数据挖掘中的泄漏：制定、检测和避免（选修）10分钟
数据泄漏示例：ICML 2013 鲸鱼挑战赛（可选）10分钟
机器学习规则：机器学习工程最佳实践（可选）10分钟
如何有效使用 t-SNE10分钟
机器如何理解大数据：聚类算法简介10分钟
课后调查10分钟
通过密歇根在线继续学习10分钟
招生组关于减免学费的提醒3分钟

1个作业总计20分钟

第 4 单元测验20分钟

1个编程作业总计180分钟

作业 4180分钟

2个非评分实验室总计120分钟

模块 4 笔记本60分钟
无监督学习笔记本60分钟

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

授课教师评分

(925个评价)

Kevyn Collins-Thompson

University of Michigan

4 门课程329,853 名学生

提供方

University of Michigan

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

自 2018开始学习的学生

''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情，我就可以学习。'

Jennifer J.

自 2020开始学习的学生

''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'

Larry W.

自 2021开始学习的学生

''如果我的大学不提供我需要的主题课程，Coursera 便是最好的去处之一。'

Chaitanya A.

''学习不仅仅是在工作中做的更好：它远不止于此。Coursera 让我无限制地学习。'

学生评论

5 stars
71.91%
4 stars
20.78%
3 stars
4.79%
2 stars
1.20%
1 star
1.29%

显示 3/8775 个

已于 Aug 19, 2018审阅

Concise and clear presentation of the material with the majority of time focused around using TDD to learn and practice concepts through developing solutions to open ended coding challenges.

已于 Jun 9, 2020审阅

The course was really interesting to go through. All the related assignments whether be Quizzes or the Hands-On really test the knowledge. Kudos to the mentor for teaching us in in such a lucid way.

已于 Nov 26, 2020审阅

great experience and learning lots of technique to apply on real world data, and get important and insightful information from raw data. motivated to proceed further in this domain and course as well.

查看更多评论