本课程将向学员介绍文本挖掘和文本处理基础知识。课程从了解 python 如何处理文本、对机器和人类来说文本的结构以及处理文本的 nltk 框架概述开始。第二周的重点是常见的操作需求,包括正则表达式(搜索文本)、清理文本和准备文本供机器学习流程使用。第三周将对文本应用基本的自然语言处理方法,并演示如何完成文本分类。最后一周将探索更高级的方法,用于检测文档中的主题并根据相似性对其进行分组(主题建模)。

您将学到什么
了解 Python 如何处理文本
应用基本的自然语言处理方法
编写按主题分组文件的代码
描述用于操作文本的 nltk 框架
您将获得的技能
要了解的详细信息

添加到您的领英档案
7 项作业
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有4个模块
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
54.79%
- 4 stars
24.94%
- 3 stars
12.18%
- 2 stars
4.57%
- 1 star
3.50%
显示 3/3824 个
已于 Jul 19, 2019审阅
Course is great except for the auto grader issues. Please look into the issue. I would like to take this opportunity and thank Prof V. G. Vinod Vydiswaran and all those who helped me to complete it.
已于 Dec 27, 2020审阅
It is a great course with challenging assignments, I wish the syllabus is a little more deeper specially on the LDA part. But overall a good course that one can look for!
已于 May 3, 2019审阅
Lectures are very good with a perfect explanation. More than lectures I liked the assignment questions. They are worth doing. You will get to know the basic foundation of text mining. :-)
从 数据科学 浏览更多内容

University of Michigan

University of Michigan

University of Illinois Urbana-Champaign



