本专业教授使用 SQL 处理大规模数据的基本技能。
也许您是 SQL 的新手,想要学习基础知识。或者,您已经有了一些使用关系数据库 SQL 查询较小规模数据的经验。无论如何,如果您有兴趣获得使用现代分布式 SQL 引擎查询大型数据所需的技能,本专业课程就是为您量身打造的。
大多数教授 SQL 的课程都侧重于传统的关系数据库,但如今,越来越多生成的数据太大,无法存储在关系数据库中,而且数据增长太快,无法有效地存储在商业数据仓库中。取而代之的是,越来越多的数据被存储在分布式集群和云存储中。这些数据存储具有成本效益和无限的可扩展性。
要在集群和云存储中查询这些庞大的数据集,你需要一种更新的 SQL 引擎:分布式查询引擎,如Hive、Impala、Presto 和Drill。这些开源 SQL 引擎能够查询庞大的数据集。本专业课程侧重于 Hive 和 Impala,它们是这些查询引擎中部署最广泛的引擎。
本专业旨在为Cloudera Certified Associate (CCA) Data Analyst认证考试提供出色的准备。您可以使用本专业课程所教授的 SQL 引擎--Hive 和 Impala 参加实践操作考试,从而获得该认证证书。
应用的学习项目
本专业的每门课程都包含一项由同行评分的实践作业。要获得专业证书,您必须成功完成每门课程中的实践和同行评分作业。本专业不像其他 Coursera 专业那样有单独的 "顶点项目"。