在本课程中,您将探索各种类型的源系统,了解它们如何生成和更新数据,并排除在现实世界中尝试连接这些系统时可能遇到的常见问题。您将深入了解常见摄取模式的细节,并实施批处理和流管道。您将使用基础架构即代码和管道即代码工具来自动化和协调您的数据管道。您还将探索用于监控数据系统和数据质量的 AWS 和 Open Source 工具。


源系统、数据输入和管道
本课程是 DeepLearning.AI 数据工程 专业证书 的一部分

位教师:Joe Reis
顶尖授课教师
访问权限由 Coursera Learning Team 提供
12,430 人已注册
您将学到什么
收集利益相关者的需求,并将其转化为系统要求。
在 AWS 上实施批量和流式摄取流程,从各种源系统摄取数据。
将安全、数据管理、DataOps 和协调等方面整合到您构建的数据系统中。
您将获得的技能
要了解的详细信息

添加到您的领英档案
4 项作业
了解顶级公司的员工如何掌握热门技能

积累 云计算 领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 通过 DeepLearning.AI 获得可共享的职业证书

该课程共有4个模块
在第 1 课中,您将了解数据工程师通常与之交互的源系统。然后,在第 2 课中,您将学习如何连接到各种源系统并排除常见的连接问题。
涵盖的内容
21个视频9篇阅读材料1个作业1个编程作业3个非评分实验室
本周,您将深入了解批量和流式摄取模式。您将确定每种模式的 Use Cases 和注意事项,然后构建一个批量和流式摄取管道。在研究批量摄取时,您将对比 ETL 和 ELT 模式。您还将探索用于批量和流式摄取的各种 AWS 服务。
涵盖的内容
11个视频6篇阅读材料1个作业1个编程作业1个非评分实验室
在第一课中,您将探索 DataOps 自动化实践,包括将 CI/CD 应用于数据和代码,以及使用 Terraform 等基础架构即代码工具自动配置和管理资源。然后,在第 2 课中,您将探索 DataOps 可观察性和监控实践,包括使用 Great Expectation 等工具监控数据质量,以及使用 Amazon CloudWatch 监控基础架构。
涵盖的内容
17个视频5篇阅读材料1个作业1个编程作业2个非评分实验室
本周,您将学习如何协调数据管道任务。您将识别各种协调工具,但重点将放在 Airflow 上--这是当今该领域最流行、使用最广泛的工具之一。您将了解 Airflow 的核心组件、Airflow UI 以及如何使用 Airflow 的各种功能创建和管理 DAG。
涵盖的内容
11个视频5篇阅读材料1个作业1个编程作业2个非评分实验室
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
89.55%
- 4 stars
4.47%
- 3 stars
0%
- 2 stars
3.73%
- 1 star
2.23%
显示 3/134 个
已于 Dec 19, 2025审阅
its good , time has change to write code urself , if you can understand code than you can do it
已于 Mar 23, 2025审阅
best course and best projects to practice for data engineering
已于 Jun 8, 2025审阅
to the point and clear information related to that how data systems work and ingestion process and pipleine that is the main crux of the data engineering


