在本课程中,您将学习如何管理大型数据集,如何将其加载到集群和云存储中,以及如何对数据进行结构化处理,以便使用 Apache Hive 和 Apache Impala 等分布式 SQL 引擎对其进行查询。您还将学习如何根据要使用的工具和需要的性能选择正确的数据类型、存储系统和文件格式。

在集群和云存储中管理大数据
本课程是 使用 SQL 进行现代大数据分析 专项课程 的一部分


位教师:Ian Cook
顶尖授课教师
访问权限由 Coursera Learning Team 提供
12,690 人已注册
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有5个模块
涵盖的内容
7个视频3篇阅读材料1个作业1个讨论话题
涵盖的内容
7个视频12篇阅读材料2个作业1个讨论话题
涵盖的内容
5个视频12篇阅读材料2个作业1个讨论话题
涵盖的内容
8个视频13篇阅读材料2个作业1次同伴评审1个讨论话题
荣誉(可选)
涵盖的内容
6个视频20篇阅读材料2个作业1个讨论话题
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
提供方
人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
79.19%
- 4 stars
15.43%
- 3 stars
3.69%
- 2 stars
1%
- 1 star
0.67%
显示 3/297 个
已于 Feb 9, 2020审阅
Very good material and the labs using the VM are wonderful hands-on experience.
已于 Dec 15, 2019审阅
It would have been nice if videos would have been present instead of reading. Also a more deep diving would have been done in concepts like bucketing and indexing.
已于 Oct 7, 2021审阅
Very good course with lots of relevant skills and information learned. The hands-on assignment has some decent challenging parts to it too!
从 数据科学 浏览更多内容

Cloudera

University of Pittsburgh
¹ 本课程的部分作业采用 AI 评分。对于这些作业,将根据 Coursera 隐私声明使用您的数据。





