数据挖掘专业针对符合明确定义模式的结构化数据和以自然语言文本形式存在的非结构化数据,教授数据挖掘技术。具体课程主题包括模式发现、聚类、文本检索、文本挖掘和分析以及数据可视化。毕业设计的任务是利用 Yelp 上的餐厅评论数据集解决现实世界中的数据挖掘难题。
本专业的课程 2 - 5 构成了在线数据科学计算机科学硕士学位课程的授课部分。您可以在专业课程开始之前或之后申请学位课程。
数据挖掘专业针对符合明确定义模式的结构化数据和以自然语言文本形式存在的非结构化数据,教授数据挖掘技术。具体课程主题包括模式发现、聚类、文本检索、文本挖掘和分析以及数据可视化。毕业设计的任务是利用 Yelp 上的餐厅评论数据集解决现实世界中的数据挖掘难题。
本专业的课程 2 - 5 构成了在线数据科学计算机科学硕士学位课程的授课部分。您可以在专业课程开始之前或之后申请学位课程。
添加到您的领英档案
数据挖掘专业针对符合明确定义模式的结构化数据和以自然语言文本形式存在的非结构化数据,教授数据挖掘技术。具体课程主题包括模式发现、聚类、文本检索、文本挖掘和分析以及数据可视化。毕业设计的任务是利用 Yelp 上的餐厅评论数据集解决现实世界中的数据挖掘难题。
本专业的课程 2 - 5 构成了在线数据科学计算机科学硕士学位课程的授课部分。您可以在专业课程开始之前或之后申请学位课程。
本课程将教您如何对数据进行更有效的 Visualization。您不仅可以深入了解数据,还可以学习如何更好地向他人传达这种见解。您将学习新的数据显示方式,应用一些设计和人类认知的基本原则,选择最有效的方式来显示不同类型的数据。本课程不仅教您如何使用 Tableau 等流行的应用程序连接到数据仓库以提取相关数据并将其可视化,还教您 Tableau 的工作原理,这样您就可以使用相同的技术自行使用任何可视化系统制作有效的数据可视化效果。
近年来,包括网页、新闻文章、科学文献、电子邮件、企业文档以及博客文章、论坛帖子、产品评论和推文等社交媒体在内的自然语言文本数据急剧增长。文本数据的独特之处在于,它们通常由人类直接生成,而不是由计算机系统或传感器生成,因此,除了我们在文本中编码的许多其他类型的知识之外,它们对于发现有关人们的观点和偏好的知识尤其有价值。
本课程将介绍搜索引擎技术,该技术在任何涉及文本数据的数据挖掘应用中都发挥着重要作用,原因有二。首先,虽然对于任何特定问题来说,原始数据可能很大,但相关数据往往是数据中相对较小的子集,而搜索引擎是在大量文本集合中快速发现相关文本数据小子集的重要工具。其次,需要搜索引擎来帮助分析人员解释在数据中发现的任何模式,让他们能够检查相关的原始文本数据,以理解任何发现的模式。您将学习文本检索的基本概念、原理和主要技术,这是搜索引擎的基础科学。
本课程将涵盖挖掘和分析文本数据的主要技术,以发现有趣的模式、提取有用的知识并支持决策制定,重点是统计方法,这些方法一般可应用于任何自然语言的任意文本数据,无需或只需极少的人力。
对文本数据进行详细分析需要理解自然语言文本,众所周知,这对计算机来说是一项艰巨的任务。然而,许多统计方法已经证明可以很好地对文本数据进行 "浅层 "但稳健的分析,以发现模式和知识。您将学习文本挖掘的基本概念、原理和主要算法及其潜在应用。
学习数据挖掘的一般概念以及基本方法和应用。然后深入研究数据挖掘的一个子领域:模式发现。深入学习数据挖掘中模式发现的概念、方法和应用。我们还将介绍数据驱动的短语挖掘方法以及模式发现的一些有趣应用。本课程让您有机会学习在海量事务数据上实践和参与可扩展模式发现方法的技能和内容,讨论模式评估措施,研究挖掘各种模式、序列模式和子图模式的方法。
了解聚类分析的基本概念,然后学习一系列典型的聚类方法、算法和应用。其中包括 k-means 等划分方法、BIRCH 等分层方法和 DBSCAN/OPTICS 等基于密度的方法。此外,还将学习聚类验证和聚类质量评估的方法。最后,查看聚类分析的应用实例。
注意:在开始本课程之前,您应该完成本专业的所有其他课程。 本数据挖掘专业的项目课程为期六周,您可以应用本专业前几门课程(包括模式发现、聚类、文本检索、文本挖掘和可视化)中所学到的数据挖掘算法和技术来解决现实世界中有趣的数据挖掘挑战。具体来说,您将处理来自 Yelp 的餐厅评论数据集,并利用从前面课程中学到的所有知识和技能来挖掘该数据集,从而发现有趣而有用的知识。项目设计强调1)模拟真实工作环境中数据挖掘人员的工作流程;2)整合多门课程中涉及的不同挖掘技术;3)尝试不同的解决问题的方法,加深对技术的理解;4)允许您创造性地提出和探索自己的想法。
该项目的目标是分析和挖掘大型 Yelp 评论数据集,以发现有用的知识,帮助人们做出餐饮决策。该项目将包括以下成果: 1.意见可视化:探索评论内容并将其可视化,以了解人们在这些评论中说了些什么。2. 菜系地图构建:挖掘数据集,了解不同类型菜系的景观及其相似性。3. 发现菜系的流行菜式:挖掘数据集,发现特定菜系的常见/流行菜式。推荐餐厅,帮助人们决定去哪里就餐:挖掘数据集,为特定菜肴的餐厅排名,并预测餐厅的卫生状况。 从用户的角度来看,菜肴地图可以帮助他们了解有哪些菜肴,并看到各种菜肴及其关系的全貌。一旦他们决定尝试哪种菜系,他们就会有兴趣了解该菜系的流行菜式,并决定吃什么菜。最后,他们需要选择一家餐馆。因此,根据特定菜肴推荐餐厅将非常有用。此外,预测餐厅的卫生状况也很有帮助。 通过完成这些任务,您将获得数据挖掘典型工作流程的经验,包括数据预处理、数据探索、数据分析、分析方法改进和结果展示。您将有机会将不同课程中的多种算法结合起来,完成一项相对复杂的挖掘任务,并尝试用不同的方法解决问题,以了解解决问题的最佳方法。我们会建议具体的方法,但也非常鼓励你们探索自己的想法,因为开放式探索是该项目的设计目标。 您需要就每项任务提交一份简要报告,供同行评分。最后还需要提交一份综合报告,该报告将由同行评分。
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
学习 University of Illinois Urbana-Champaign 的这个 专项课程,您可以预览相关学位课程计划中的主题、材料和授课教师,以便您确定该主题或大学是否适合您。
学习 University of Illinois Urbana-Champaign 的这个 专项课程,您可以预览相关学位课程计划中的主题、材料和授课教师,以便您确定该主题或大学是否适合您。
University of Illinois Urbana-Champaign
学位 · 1 – 3 years
伊利诺伊大学厄巴纳-香槟分校在研究、教学和公众参与方面处于世界领先地位,以其广泛的课程、卓越的学术成就以及国际知名的教师和校友而闻名于世。伊利诺伊大学通过创造知识、培养学生成为有影响力的人才以及为关键的社会需求寻找解决方案来服务于世界。
根据您的日程安排,完成学习的时间可能会有很大差异。大多数学员可以在 4-5 个月内完成专业课程。
专业课程中的每门课程都按计划定期开课,大约每月开课一次。如果您第一次没有完成课程,您可以很容易地转入下一次课程,您已完成的作业和成绩将继续有效。
熟练使用多种编程语言进行计算机编程
具备概率和统计学的基本知识
建议按照概述的顺序学习专业课程。在 "顶点项目 "中,您将有机会综合所有课程的学习内容,并在最终项目中应用您的综合技能。
Coursera 中的 MCS 课程本身不授予伊利诺伊大学学分。每门课程都有增强学分部分。如果您将 MCS Coursera 课程与伊利诺伊大学平台上提供的增强学分部分结合起来,就可以获得学分。有些大学可能会接受专业证书作为学分。请向您所在的院校咨询以了解更多信息。
完成数据挖掘专业课程后,您将:(1) 了解数据挖掘、信息检索、文本分析和可视化中模式发现和聚类的基本概念;(2) 了解挖掘结构化和非结构化文本数据的主要算法;(3) 能够应用所学算法解决现实世界中的数据挖掘问题。
本课程完全在线,因此无需亲自到教室上课。您可以随时随地通过网络或移动设备访问讲座、阅读和作业。
可以!要开始学习,请单击您感兴趣的课程卡并注册。您可以注册并完成课程,以获得可共享的证书。当您订阅属于专项课程的课程时,您将自动订阅完整的专项课程。访问您的学习者仪表板,跟踪您的学习进度。
是的。在特定的学习课程中,如果您付不起注册费,可以申请助学金或奖学金。如果您选择的学习课程有助学金或奖学金,您可以在说明页面找到申请链接。
不,您不能免费学习此课程。报名参加该课程后,您可以学习专项课程中的所有课程,完成作业后可获得证书。如果您付不起学费,可以申请经济援助。
提供助学金,