Google Cloud

AI 基础设施:网络组建和管理技术

Google Cloud

AI 基础设施:网络组建和管理技术

包含在 Coursera Plus

深入了解一个主题并学习基础知识。
中级 等级
需要一些相关经验
4 小时 完成
灵活的计划
自行安排学习进度
深入了解一个主题并学习基础知识。
中级 等级
需要一些相关经验
4 小时 完成
灵活的计划
自行安排学习进度

您将学到什么

  • 确定 AI 流水线各个阶段的网络组建和管理需求,并找出适合的 Google Cloud 产品。

  • 区分不同 GPU 和 TPU 机器类型的网络组建和管理特性。

  • 确定适用于数据注入、AI 训练和生成式 AI 推理的网络组建和管理选项

  • 了解 AI 网络组建和管理最佳实践。

要了解的详细信息

可分享的证书

添加到您的领英档案

最近已更新!

April 2026

作业

4 项作业

授课语言:中文(简体)

了解顶级公司的员工如何掌握热门技能

Petrobras, TATA, Danone, Capgemini, P&G 和 L'Oreal 的徽标

该课程共有6个模块

本单元概述了课程内容并列出了学习目标。

涵盖的内容

1个插件

本单元详细介绍了 AI 工作负载相较于传统 Web 应用所具有的特殊网络组建和管理需求。内容涵盖了从数据注入到推理的各个流水线阶段在带宽和延迟时间方面的具体要求,并分析了 Google Cloud A3 和 A4 GPU 机型如何通过“轨道对齐”的网络架构,最大程度提高“有效吞吐量”。

涵盖的内容

1个作业3个插件

本单元详细介绍了将海量数据集高效迁移到云端的策略。内容涵盖了如何利用跨云网络和 Cloud Interconnect 构建高带宽流水线,并总结了相关的配置最佳实践(例如启用 Jumbo Frames [MTU]),以减少协议开销并优化吞吐量。

涵盖的内容

1个作业2个插件

本单元详细介绍了低延迟网络组建和管理在分布式模型训练中的关键作用。内容涵盖了 RDMA(远程直接内存访问)对于梯度同步的必要性、Google Titanium 分流架构在释放 CPU 资源方面的优势,以及在不产生瓶颈的情况下扩展集群所需的拓扑方案。

涵盖的内容

1个作业3个插件

本单元详细介绍了生成式 AI 推理所面临的特定网络组建和管理挑战,例如突发流量和长期有效的连接。内容涵盖了如何通过 GKE Inference Gateway 和“队列深度”路由来优化首 token 延迟,同时还介绍了在网络可靠性以及 Identity and Access Management (IAM) 方面的最佳实践。

涵盖的内容

1个作业5个插件

所有单元的学员 PDF 链接

涵盖的内容

1篇阅读材料

位教师

Google Cloud Training
Google Cloud
2,162 门课程4,167,754 名学生

提供方

Google Cloud

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'

Jennifer J.

自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'

Larry W.

自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'

Chaitanya A.

''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'
Coursera Plus

通过 Coursera Plus 开启新生涯

无限制访问 10,000+ 世界一流的课程、实践项目和就业就绪证书课程 - 所有这些都包含在您的订阅中

通过在线学位推动您的职业生涯

获取世界一流大学的学位 - 100% 在线

加入超过 3400 家选择 Coursera for Business 的全球公司

提升员工的技能,使其在数字经济中脱颖而出

常见问题