本课程将向学习者介绍应用机器学习,更侧重于技术和方法,而不是这些方法背后的统计学。课程将首先讨论机器学习与描述性统计有何不同,并通过教程介绍 scikit learn 工具包。课程将讨论数据的维度问题,并讨论对数据进行聚类以及评估这些聚类的任务。课程将介绍创建预测模型的监督方法,学员将能够应用 scikit learn 预测建模方法,同时了解与数据通用性相关的过程问题(如交叉验证、过拟合)。课程最后将介绍更高级的技术,如构建集合和预测模型的实际限制。课程结束时,学生将能够识别有监督(分类)和无监督(聚类)技术之间的区别,识别他们需要针对特定数据集和需求应用哪种技术,设计特征以满足该需求,并编写 python 代码以进行分析。

Python 中的应用机器学习
本课程是 借助 Python 应用数据科学 专项课程 的一部分
访问权限由 New York State Department of Labor 提供
327,092 人已注册
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有4个模块
本模块介绍了机器学习的基本概念、任务和工作流程,使用基于 K 近邻法的分类问题示例,并使用 scikit-learn 库实现。
涵盖的内容
7个视频4篇阅读材料1个作业1个编程作业1个非评分实验室
本模块将深入探讨分类和回归的各种监督学习方法,学习模型复杂性与泛化性能之间的联系、适当特征缩放的重要性,以及如何通过应用正则化等技术控制模型复杂性以避免过度拟合。 除了 k 最近邻之外,本周还将介绍线性回归(最小二乘、脊、拉索和多项式回归)、逻辑回归、支持向量机、使用交叉验证进行模型评估以及决策树。
涵盖的内容
13个视频2篇阅读材料2个作业1个编程作业2个非评分实验室
本模块包括评估和模型选择方法,您可以使用这些方法来帮助理解和优化机器学习模型的性能。
涵盖的内容
8个视频2篇阅读材料1个作业1个编程作业1个非评分实验室
本模块涵盖更高级的监督学习方法,包括树集合(随机森林、梯度提升树)和神经网络(可选深度学习摘要)。 您还将了解机器学习中的关键问题--数据泄露,以及如何检测和避免数据泄露。
涵盖的内容
10个视频13篇阅读材料1个作业1个编程作业2个非评分实验室
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
71.89%
- 4 stars
20.79%
- 3 stars
4.79%
- 2 stars
1.20%
- 1 star
1.29%
显示 3/8770 个
已于 Oct 22, 2020审阅
EXTREMELY USEFUL AND GOOD COURSE, CONGRATULATIONS TO ALL THE PEOPLE INVOLVE.Honestly, I never thought I could learn so much in an online course, excited for the rest of the specialization
已于 Aug 19, 2018审阅
Concise and clear presentation of the material with the majority of time focused around using TDD to learn and practice concepts through developing solutions to open ended coding challenges.
已于 Nov 26, 2020审阅
great experience and learning lots of technique to apply on real world data, and get important and insightful information from raw data. motivated to proceed further in this domain and course as well.
从 数据科学 浏览更多内容

University of Michigan

O.P. Jindal Global University





