学习可扩展的数据管理、评估大数据技术和设计有效的可视化。
本专业涵盖数据科学的中级课题。您将在可扩展的 SQL 和 NoSQL 数据管理解决方案、数据挖掘算法以及实用的统计和机器学习概念方面获得实践经验。您还将学习数据可视化和结果交流,并探索大数据工作中出现的法律和道德问题。在与数字实习平台 Coursolve 合作开发的毕业设计项目中,您将把新技能应用到真实世界的数据科学项目中。
本专业涵盖数据科学的中级课题。您将在可扩展的 SQL 和 NoSQL 数据管理解决方案、数据挖掘算法以及实用的统计和机器学习概念方面获得实践经验。您还将学习数据可视化和结果交流,并探索大数据工作中出现的法律和道德问题。在与数字实习平台 Coursolve 合作开发的毕业设计项目中,您将把新技能应用到真实世界的数据科学项目中。
添加到您的领英档案
本专业涵盖数据科学的中级课题。您将在可扩展的 SQL 和 NoSQL 数据管理解决方案、数据挖掘算法以及实用的统计和机器学习概念方面获得实践经验。您还将学习数据可视化和结果交流,并探索大数据工作中出现的法律和道德问题。在与数字实习平台 Coursolve 合作开发的毕业设计项目中,您将把新技能应用到真实世界的数据科学项目中。
数据分析已取代数据采集,成为基于证据的决策制定的瓶颈--我们正被数据分析所淹没。 从大型、异构和嘈杂的数据集中提取知识不仅需要强大的计算资源,还需要有效使用这些资源的编程抽象。 过去十年中出现的抽象概念融合了并行数据库、分布式系统和编程语言的思想,创建了一类新的可扩展数据分析平台,为现实规模的数据科学奠定了基础。 在本课程中,您将了解相关系统的概况、它们所依赖的原理、它们之间的权衡,以及如何根据您的要求评估它们的效用。您将了解实用系统是如何从计算机科学的前沿研究中衍生出来的,以及哪些系统即将出现在地平线上。 您还将了解数据科学的历史和背景、该术语所蕴含的技能、挑战和方法,以及如何构建数据科学项目。 在本课程结束时,您将能够: 学习目标:
1.描述与数据科学项目相关的常见模式、挑战和方法,以及它们与相关领域项目的不同之处。2. 识别并使用与可扩展数据操作相关的编程模型,包括关系代数、mapreduce 和其他数据流模型。使用适用于大规模分析的数据库技术,包括推动并行数据库、并行查询处理和数据库内分析的概念 4.评估键值存储和 NoSQL 系统,描述它们与同类系统的权衡、该领域重要实例的细节和未来趋势。用 MapReduce 进行 "思考",为 Hadoop 和 Spark 等系统有效地编写算法。 您将了解它们的局限性、设计细节、与数据库的关系,以及与之相关的算法、扩展和语言生态系统。描述针对图、数组和流的专业大数据系统的情况
统计实验设计和分析是数据科学的核心。 在本课程中,您将设计统计实验,并使用现代方法分析实验结果。 您还将探索解释统计论据的常见误区,尤其是与大数据相关的误区。 总之,本课程将帮助您内化一套实用有效的机器学习核心方法和概念,并应用它们解决一些实际问题。 学习目标:完成本课程后,您将能够: 1.设计有效的实验并分析实验结果 2.使用重采样方法进行清晰、有力的统计论证,而无需引用深奥的符号 3.解释并应用一套复杂度不断增加的核心分类方法(规则、树、随机森林),以及相关的优化方法(梯度下降和变体) 4.解释并应用一套无监督学习概念和方法 5.描述大规模图分析的常用习语,包括结构查询、遍历和递归查询、PageRank 和社群检测
重要说明:本课程的第二个作业涉及 "云中的图形分析 "主题,您将在其中使用 Elastic MapReduce 和 Pig 语言对一个中等大小的数据集(约 600GB)进行图形分析。为了完成这项任务,您需要使用亚马逊网络服务(AWS)。亚马逊慷慨地为本课程的每位学员提供高达 50 美元的免费 AWS 信用额度,以便您完成作业。有关获得此信用额度过程的更多详细信息,请参阅本课程的欢迎词以及作业本身。请注意,如果您用完了学分,亚马逊、华盛顿大学和 Coursera 将无法补偿您的任何费用。 虽然我们相信该作业有助于在本课程中获得极佳的学习体验,但我们理解有些学员可能无法或不愿使用 AWS。对于没有完成需要使用 AWS 的作业的学员,我们无法颁发课程证书。因此,如果您不能或不愿意使用 AWS,就不应该支付 "数据结果交流 "课程证书的费用,因为不使用 AWS 就无法成功完成课程。 仅仅进行预测是不够的! 有效的数据科学家知道如何解释和诠释他们的结果,并将结果准确地传达给利益相关者,为业务决策提供信息。 可视化是计算机科学的一个研究领域,它通过将感知、认知和算法联系起来,利用人类视觉皮层的巨大带宽,研究如何有效地交流定量结果。 在本课程中,您将学习如何识别、设计和使用有效的可视化方法。 您可以做出预测并说服他人采取行动,但这并不意味着您应该这样做。 在本课程中,您将探索围绕大数据的道德考量,以及这些考量如何开始影响政策和实践。 您将了解使用技术保护隐私的基本限制,以及新出现的指导数据科学家行为的行为准则。 您还将了解数据科学中可重现性的重要性,以及商业云如何帮助支持可重现性研究,即使是涉及海量数据集、复杂计算基础设施或两者的实验。 学习目标:完成本课程后,您将能够: 1.设计和评论可视化 2.解释大数据和数据科学在隐私、伦理和治理方面的最新进展 3.使用云计算以可重复的方式分析大型数据集。
在毕业设计中,学生将参与一个真实世界的项目,要求他们应用整个数据科学管道中的技能:准备、组织和转换数据、构建模型和评估结果。 通过与 Coursolve 合作,每个 Capstone 项目都与合作伙伴利益相关者联系在一起,这些利益相关者对你的成果有切身利益,并渴望在实践中运用这些成果。 这些项目不会是简单明了的,也不会规定结果--你需要容忍模糊性和负面结果! 但我们相信,这样的经历会让您受益匪浅,并为您在实践中开展数据科学项目做好更充分的准备。
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
华盛顿大学成立于 1861 年,是西海岸历史最悠久的州立高等教育机构之一,也是世界上最杰出的研究型大学之一。
完成课程所需的时间会根据您的日程安排而有所不同,但大多数学员都能在 5 个月内完成专业课程。
专业课程中的每门课程都有固定的开课时间,大约每月开课一次。如果您第一次没有完成课程,您可以很容易地转入下一次课程,您已完成的作业和成绩将继续有效。
我们建议按课程顺序选课,因为后面的课程将以前面课程的材料为基础。
Coursera 课程和证书不授予大学学分,但有些大学可能会选择接受专业证书作为学分。请向您的院校咨询以了解更多信息。
您将拥有独立应对数据科学挑战、分析网络内外真实数据源(可能达到 TB 级规模)的工作经验。您将准备在软件系统、可扩展算法、统计、机器学习和可视化方面进行更深入的技术研究。
学员需要有中级编程经验(大致相当于两门大学课程),并对数据库有一定的了解。整个专业课程中的编程作业将综合使用 Python、SQL、Scala、R 和 Javascript;熟悉其中一种或多种语言将有所帮助。
提供助学金,