Apache Hive 是建立在 Apache Hadoop 之上的数据仓库软件项目,用于提供数据查询和分析。Coursera 的 Apache Hive 目录教您使用 SQL 结构管理驻留在 Distribution 存储中的大型数据集。您将学习如何通过 HiveQL 与 Hive 交互,实现数据汇总、查询和分析。此外,您还将熟悉数据 Warehousing、ETL 流程和 Hive 中数据存储的原理,同时掌握数据分区和分桶等概念。在学习旅程结束时,您将具备使用 Apache Hive 处理 Big Data 操作和制定高效数据处理策略的能力。