世界和互联网充满了文本信息。我们使用文本查询搜索信息,我们阅读网站、书籍和电子邮件。从计算机科学的角度来看,所有这些都是字符串。为了理解这些信息并提高搜索效率,搜索引擎使用了许多字符串算法。此外,新兴的个性化医疗领域也使用许多搜索算法来查找人类基因组中的致病突变。在本在线课程中,您将学习到关键的模式匹配概念:尝试、后缀树、后缀数组,甚至 Burrows-Wheeler 变换。
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有4个模块
如何在线性时间内搜索字符串中的最长重复?1973 年,彼得-韦纳(Peter Weiner)基于模式匹配中的关键数据结构--后缀树,提出了一个惊人的解决方案。 计算机科学家们对他的算法赞不绝口,并将其称为年度算法。 在本课中,我们将探索模式匹配的一些关键思想,通过一系列的试验和错误,我们将找到后缀树。
涵盖的内容
6个视频5篇阅读材料1个作业1个编程作业
虽然使用后缀树进行精确模式匹配速度很快,但如何使用后缀树进行近似模式匹配还不清楚。 1994 年,Michael Burrows 和 David Wheeler 发明了一种巧妙的文本压缩算法,即现在的 Burrows-Wheeler Transform。他们对基因组学一无所知,也无法想象 15 年后他们的算法会成为生物学家搜索基因组突变的主力。但是,文本压缩与模式匹配有什么关系呢?在这一课中,你将了解到算法的命运往往难以预测--它的应用可能出现在与发明者最初计划毫不相干的领域。
涵盖的内容
5个视频4篇阅读材料1个作业1个编程作业
恭喜你,现在你已经学会了关键的模式匹配概念:尝试、后缀树、后缀数组,甚至 Burrows-Wheeler 变换!然而,帕维尔提到的一些结果仍然令人费解:例如,我们如何能在 O(|Text|) 时间内完成精确模式匹配,而不是像天真的蛮力算法那样在 O(|Text|*|Pattern|) 时间内完成精确模式匹配?根据人类基因组匹配 1000 个核苷酸的模式怎么可能和匹配 3 个核苷酸的模式一样快?此外,尽管 Pavel 展示了如何在给定后缀树的情况下快速构建后缀数组,但他并没有揭示构建后缀树的快速算法背后的奥妙!在本模块中,Miсhael 将解决 Pavel 试图向你隐瞒的一些算法难题:)例如精确模式匹配的 Knuth-Morris-Pratt 算法,以及后缀树和后缀数组构建的更高效算法。
涵盖的内容
8个视频2篇阅读材料1个作业
在本模块中,我们将继续研究字符串算法的算法挑战。您将学习后缀数组构造的 O(n log n) 算法,以及从后缀数组构造后缀树的线性时间算法。您还将在本课程的最后一个编程作业中实现这些算法和 Knuth-Morris-Pratt 算法。
涵盖的内容
16个视频3篇阅读材料1个作业1个编程作业
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
67.43%
- 4 stars
21%
- 3 stars
7.52%
- 2 stars
2.29%
- 1 star
1.74%
显示 3/1090 个
已于 May 6, 2018审阅
Excelentes algoritmos, nunca había pensado lo complicado que era hacer pattern matching eficientemente en términos de tiempo de procesamiento y memoria.
已于 Aug 15, 2016审阅
Really good quality information and examples (includes reasoning). It includes some of the latest developments in this area.
已于 Sep 2, 2016审阅
Course Content is good. Instructors are not that much active to give answers for the raised questions compared to earlier courses.
从 计算机科学 浏览更多内容

Johns Hopkins University

Google

University of California San Diego

Princeton University









