在本中级课程中,您将学习在 Google Cloud 上设计、构建和优化强大的 Batch 数据管道。除了基本的数据处理之外,您还将探索大规模数据转换和高效的工作流协调,这对及时的 Business Intelligence 和关键报告至关重要。 使用 Apache Beam 的 Dataflow 和 Apache Spark 的 Serverless(Dataproc Serverless)进行实施,并解决数据质量、监控和警报方面的重要问题,以确保管道的可靠性和卓越运营。建议具备数据 Warehhouse、ETL/ELT、SQL、Python 和 Google Cloud 概念的基础知识。

您将学到什么
确定 Batch 数据管道是否是您的业务用例的正确选择。
设计和构建可扩展的 Batch 数据管道,以实现大容量数据的摄取和 Transformer。
在 Batch 管道内实施数据质量控制,确保数据完整性。
协调、管理和监控 Batch 数据管道 Workflow,使用日志和监控工具实施错误处理和可观察性。
要了解的详细信息

添加到您的领英档案
5 项作业
了解顶级公司的员工如何掌握热门技能

积累特定领域的专业知识
- 向行业专家学习新概念
- 获得对主题或工具的基础理解
- 通过实践项目培养工作相关技能
- 获得可共享的职业证书

该课程共有4个模块
获得职业证书
将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。
位教师

提供方
从 云计算 浏览更多内容

Google Cloud

Google Cloud

Google Cloud
人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
学生评论
- 5 stars
65.98%
- 4 stars
25.71%
- 3 stars
6.01%
- 2 stars
1.46%
- 1 star
0.81%
显示 3/1711 个
已于 May 27, 2020审阅
A great course to help understand the various wonderful options Google Cloud has to offer to move on-premise Hadoop workload to Google Cloud Platform to leverage scalability of clusters.
已于 May 19, 2020审阅
Great course teaching how to build batch pipelines through GCP technologies, and showing cool tools for data wrangling and analysis
已于 Jul 16, 2020审阅
Great course learning what it is the big advantages of using GCP for data given they have big implementations and with better performance of what it is today in on premises scenarios




