在本课程中,您将了解用于在磁盘和内存中物理存储数据的原始成分和过程。您将探索不同的存储系统,包括对象、块和文件存储,以及建立在这些原始成分之上的数据库。您还将有机会使用 Cypher 语言查询 Neo4j 图数据库,并执行向量相似性搜索,这是生成式 AI 和 Large Language Model 背后的一个关键功能。您将探索数据存储抽象的演变,从数据仓库到数据湖,再到数据湖,同时比较每种架构范例的优缺点。通过动手实践,您将使用 Amazon Glue 设计一个简单的数据湖,并使用 AWS LakeFormation 和 Apache Iceberg 构建一个数据湖房。在本课程的最后一周,您将了解查询在幕后是如何工作的,练习编写更高级的 SQL 查询,比较面向行和列的存储中的查询性能,并使用 Apache Flink 执行流查询。


您将学到什么
为各种 Use Cases 设计存储架构,并选择合适的技术来实现这些架构
练习常见的查询模式,找出提高查询性能和提升数据系统价值的方法
您将获得的技能
要了解的详细信息

可分享的证书
添加到您的领英档案
作业
3 项作业
授课语言:英语(English)
了解顶级公司的员工如何掌握热门技能

积累 云计算 领域的专业知识
本课程是 DeepLearning.AI 数据工程 专业证书 专项课程的一部分
在注册此课程时,您还会同时注册此专业证书。
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 通过 DeepLearning.AI 获得可共享的职业证书

该课程共有3个模块
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师
授课教师评分
(15个评价)
从 云计算 浏览更多内容
人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'

Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'

Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'

Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'
学生评论
- 5 stars
83.13%
- 4 stars
9.63%
- 3 stars
2.40%
- 2 stars
2.40%
- 1 star
2.40%
显示 3/83 个
RR
已于 Apr 24, 2025审阅
This is a really excellent course covering a number of topics that anyone going into data engineering should be familiar with.
YW
已于 Nov 18, 2024审阅
Insightful overview of a simple yet complicated concept such as storage and queries.
JT
已于 Oct 6, 2025审阅
Just excellent all around (from a current practitioner)




