在本课程中,您将学习如何管理大型数据集,如何将其加载到集群和云存储中,以及如何对数据进行结构化处理,以便使用 Apache Hive 和 Apache Impala 等分布式 SQL 引擎对其进行查询。您还将学习如何根据要使用的工具和需要的性能选择正确的数据类型、存储系统和文件格式。

在集群和云存储中管理大数据
本课程是 使用 SQL 进行现代大数据分析 专项课程 的一部分


位教师:Ian Cook
顶尖授课教师
访问权限由 New York State Department of Labor 提供
12,685 人已注册
您将学到什么
使用不同工具浏览大数据系统中的现有数据库和表格
使用不同工具探索分布式大数据文件系统和云存储中的文件
使用 Apache Hive 和 Apache Impala 创建和管理大数据数据库和表格
描述并选择大数据系统的不同数据类型和文件格式
要了解的详细信息
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有5个模块
涵盖的内容
7个视频3篇阅读材料1个作业1个讨论话题
涵盖的内容
7个视频12篇阅读材料2个作业1个讨论话题
涵盖的内容
5个视频12篇阅读材料2个作业1个讨论话题
涵盖的内容
8个视频13篇阅读材料2个作业1次同伴评审1个讨论话题
荣誉(可选)
涵盖的内容
6个视频20篇阅读材料2个作业1个讨论话题
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
提供方
人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
79.46%
- 4 stars
15.48%
- 3 stars
3.36%
- 2 stars
1.01%
- 1 star
0.67%
显示 3/297 个
已于 Feb 9, 2020审阅
Very good material and the labs using the VM are wonderful hands-on experience.
已于 Aug 2, 2020审阅
The courses provided in this specialization are very good and gave more than expectations.
已于 Jun 25, 2021审阅
Super useful course with a lot of hands on practices. Though the VM is running slow on my computer.
从 数据科学 浏览更多内容

Cloudera

University of Pittsburgh
¹ 本课程的部分作业采用 AI 评分。对于这些作业,将根据 Coursera 隐私声明使用您的数据。





