本课程将涵盖挖掘和分析文本数据的主要技术,以发现有趣的模式、提取有用的知识并支持决策制定,重点是统计方法,这些方法一般可应用于任何自然语言的任意文本数据,无需或只需极少的人力。
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有7个模块
您将熟悉课程、同学和我们的学习环境。迎新会还将帮助您掌握课程所需的技术技能。
涵盖的内容
2个视频5篇阅读材料2个作业1个插件
在本模块中,您将学习整体课程设计、作为各种文本挖掘应用基础的自然语言处理技术和文本表示法概述,以及词关联挖掘,尤其侧重于挖掘词关联的两种基本形式之一(即范式关系)。
涵盖的内容
9个视频1篇阅读材料2个作业
在本模块中,您将学习更多关于词语关联挖掘的知识,尤其侧重于挖掘词语关联的另一种基本形式(即句法关系),并开始学习主题分析,侧重于从文本中挖掘一个主题的技术。
涵盖的内容
10个视频1篇阅读材料2个作业
在本模块中,您将深入学习主题分析,包括混合物模型及其工作原理、期望最大化(EM)算法及其如何用于估计混合物模型的参数、基本主题模型、概率潜语义分析(PLSA)以及潜德里希勒分配(LDA)如何扩展 PLSA。
涵盖的内容
10个视频2篇阅读材料2个作业1个编程作业
在本模块中,您将学习文本聚类,包括基本概念、主要聚类技术(包括概率方法和基于相似性的方法)以及如何评估文本聚类。您还将开始学习文本分类,这与文本聚类相关,但使用的是预定义的类别,可视为预定义的聚类。
涵盖的内容
9个视频1篇阅读材料2个作业
在本模块中,您将继续学习文本分类的各种方法,包括在判别分类器下分类的多种方法,还将学习情感分析和观点挖掘,包括详细介绍情感分类的一种特殊技术(即序数回归)。
涵盖的内容
7个视频1篇阅读材料2个作业
在本模块中,您将继续学习情感分析和意见挖掘,重点是潜在方面评级分析 (LARA),还将学习文本和非文本数据的联合挖掘技术,包括用于分析文本中与时间、地点、作者和数据来源等各种上下文信息相关联的主题的上下文文本挖掘技术。您还将看到整个课程的摘要。
涵盖的内容
8个视频1篇阅读材料2个作业1个插件
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
68.52%
- 4 stars
20.21%
- 3 stars
7.59%
- 2 stars
2.03%
- 1 star
1.62%
显示 3/737 个
已于 Jun 24, 2017审阅
very theoretical. very insightful too. finally got a glimpse how the features that I took for granted took shape ... thanks to the instructor, I love the textbook as well ~
已于 Jul 22, 2017审阅
The workflow is clear and the professor speaks to the students directly about all aspects without skimming the material.
已于 Jun 6, 2017审阅
The content was very useful, and the preparation of the course denoted much care and preparation by the teacher. I would love to see some modern topics like word embeddings covered in the course!
从 数据科学 浏览更多内容

Yonsei University

O.P. Jindal Global University

University of Illinois Urbana-Champaign

University of Michigan




