本课程将向学员介绍文本挖掘和文本处理基础知识。课程从了解 python 如何处理文本、对机器和人类来说文本的结构以及处理文本的 nltk 框架概述开始。第二周的重点是常见的操作需求,包括正则表达式(搜索文本)、清理文本和准备文本供机器学习流程使用。第三周将对文本应用基本的自然语言处理方法,并演示如何完成文本分类。最后一周将探索更高级的方法,用于检测文档中的主题并根据相似性对其进行分组(主题建模)。

您将学到什么
了解 Python 如何处理文本
应用基本的自然语言处理方法
编写按主题分组文件的代码
描述用于操作文本的 nltk 框架
您将获得的技能
要了解的详细信息

添加到您的领英档案
7 项作业
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有4个模块
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
54.79%
- 4 stars
24.94%
- 3 stars
12.18%
- 2 stars
4.57%
- 1 star
3.50%
显示 3/3824 个
已于 Jul 19, 2019审阅
Course is great except for the auto grader issues. Please look into the issue. I would like to take this opportunity and thank Prof V. G. Vinod Vydiswaran and all those who helped me to complete it.
已于 Aug 1, 2019审阅
Excellent course for someone like me who is ambitious and aspires to gain knowledge on new things. The videos can be made bit more elaborate, seems to be rushing towards the end.
已于 Jun 22, 2020审阅
Everything was awesome, assignment 2 was my favorite in a long while in this specialization series. Week 4 was a little weak, and felt rushed. Overall, I enjoyed this course 4 of the 5.
从 数据科学 浏览更多内容

University of Michigan

University of Michigan

University of Illinois Urbana-Champaign



