课程结束时,您将能够: *从示例数据库和大数据管理系统中检索数据 *描述数据管理操作与在大规模分析应用中使用这些操作所需的大数据处理模式之间的联系 *确定大数据问题何时需要数据集成 *在 Hadoop 和 Spark 平台上执行简单的大数据集成和处理 本课程适合数据科学新手。 建议完成大数据入门课程。 无需编程经验,但需要具备安装应用程序和使用虚拟机的能力,以完成实践作业。 有关完整的硬件和软件规格,请参阅专业技术要求。 硬件要求:

您将获得的技能
要了解的详细信息

添加到您的领英档案
10 项作业
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有7个模块
欢迎来到 Big Data 专业的第三课。本周将向您介绍 Big Data Integration 和处理的基本概念。我们将指导您安装 Docker、下载本课程使用的数据 Set,并学习如何使用 Jupyter Notebook。
涵盖的内容
3个视频5篇阅读材料1个讨论话题
本模块涵盖数据检索和关系查询的各个方面。您还将学习 Postgres 数据库。
涵盖的内容
5个视频2篇阅读材料
本模块涵盖 NoSQL 数据检索的各个方面,以及数据聚合和数据帧处理。您将了解 MongoDB 和 Aerospike,并学习如何使用 Pandas 从它们中检索数据。
涵盖的内容
5个视频3篇阅读材料2个作业1个讨论话题
在本模块中,您将了解到包括 Splunk 和 Datameer 在内的数据集成工具,并对如何执行信息集成流程有一些实际的了解。
涵盖的内容
11个视频4篇阅读材料2个作业1个讨论话题
本模块向学员介绍大数据管道和工作流,以及使用 Apache Spark 处理和分析大数据。
涵盖的内容
9个视频4篇阅读材料2个作业3个讨论话题
在本模块中,您将通过学习 Spark Core 的内部工作原理深入了解大数据处理。您将了解 Spark 工具包中的两个关键工具:Spark MLlib 和 GraphX。
涵盖的内容
9个视频4篇阅读材料2个作业1个讨论话题
在本模块中,您将获得一些应用所学 Spark 和 MongoDB 分析 Twitter 数据的实际动手经验。
涵盖的内容
4篇阅读材料2个作业
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师


人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
62.04%
- 4 stars
25.64%
- 3 stars
6.91%
- 2 stars
2.59%
- 1 star
2.79%
显示 3/2428 个
已于 Dec 28, 2019审阅
Assigments would be more complexity but for a beginner they are enough to understand framework. More code practice should be presented. They need to be repeated to remember of syntax
已于 Dec 3, 2016审阅
Some of the lectures seemed slightly lesser quality with regards to the materials. For moocs especially, I would like to have the lecture better documented in order to download and review later.
已于 Oct 8, 2017审阅
Lot of new information, excellent delivery. Given 4 as I feel real-use case flavor is inadequate -exercises could be more intensive, real case studies can be added.
从 数据科学 浏览更多内容

University of Pittsburgh

Johns Hopkins University




