完成专业学习需要多长时间？

<text variant="body1">如果每周学习两小时，只需两周时间即可完成课程。

要顺利完成本课程，我是否需要任何背景知识？

如果您具备 Python 和 PyTorch 的基础知识，并熟悉机器学习和神经网络的概念，那就再好不过了。

完成本课程后，我可以担任哪些职务？

本课程是专业课程的一部分。完成该专业课程后，您将具备从事 AI 工程师、NLP 工程师、机器学习工程师、深度学习工程师和数据科学家等工作所需的技能和信心。

我需要什么特定的软件或工具才能顺利完成课程吗？

只需使用现代网络浏览器即可完成本课程和所有动手实验。您将免费访问基于云的环境来完成实验。您将注册 Hugging Face 等平台并使用不收费的功能。

我什么时候能看到讲座和作业？

要获得课程资料、作业和证书，您需要在注册课程时购买证书体验。您可以尝试免费试听，或申请资助。课程可能提供 "完整课程，无证书"。通过该选项，您可以查看所有课程资料，提交必要的评估，并获得最终成绩。这也意味着您无法购买证书体验。

订阅此证书能得到什么？

注册课程后，您就可以访问证书中的所有课程，并在完成作业后获得证书。您的电子证书将被添加到您的 "成就 "页面--在那里，您可以打印证书或将其添加到您的 LinkedIn 个人资料中。

生成式人工智能和 LLM：架构和数据准备

生成式人工智能和 LLM：架构和数据准备

Q: 我需要什么特定的软件或工具才能顺利完成课程吗？

只需使用现代网络浏览器即可完成本课程和所有动手实验。 您将免费访问基于云的环境来完成实验。 您将注册 Hugging Face 等平台并使用不收费的功能。

Q: 我什么时候能看到讲座和作业？

要获得课程资料、作业和证书，您需要在注册课程时购买证书体验。 您可以尝试免费试听，或申请资助。课程可能提供 "完整课程，无证书"。通过该选项，您可以查看所有课程资料，提交必要的评估，并获得最终成绩。这也意味着您无法购买证书体验。

本课程是多个项目的一部分。

位教师：Joseph Santarcangelo另外 1 个

53,399 人已注册

包含在中

2个模块

深入了解一个主题并学习基础知识。

428 条评论

中级等级

推荐体验

灵活的计划

6 小时完成

自行安排学习进度

95%

大多数学生喜欢此课程

2个模块

深入了解一个主题并学习基础知识。

428 条评论

中级等级

推荐体验

灵活的计划

6 小时完成

自行安排学习进度

95%

大多数学生喜欢此课程

您将学到什么

区分生成式 AI 架构和模型，如 RNN、Transformer、VAE、GAN 和扩散模型
说明 GPT、BERT、BART 和 T5 等 LLM 如何应用于自然语言处理任务中
使用 NLP 库（如 NLTK、spaCy、BertTokenizer 和 XLNetTokenizer）实施 tokenization，对原始文本进行预处理
在 PyTorch 中创建一个 NLP 数据加载器，处理文本数据集的 tokenization、数值化和填充问题

您将获得的技能

类别：Data Preprocessing
类别：Model Training
类别：Large Language Modeling
类别：Generative Model Architectures
类别：Natural Language Processing
类别：LLM Application
类别：Recurrent Neural Networks (RNNs)
类别：Data Pipelines

您将学习的工具

类别：Hugging Face
类别：Generative Adversarial Networks (GANs)
类别：Generative AI
类别：PyTorch (Machine Learning Library)

要了解的详细信息

可分享的证书

添加到您的领英档案

作业

4 项作业

授课语言：英语（English）

积累特定领域的专业知识

此课程作为的一部分提供

在注册此课程时，您还需要选择一个特定的合作项目。

向行业专家学习新概念
获得对主题或工具的基础理解
通过实践项目培养工作相关技能
获得可共享的职业证书

该课程共有2个模块

准备好探索令人兴奋的生成式 AI 和 Large Language Model (LLMs) 世界了吗？本 IBM 课程是 "生成式 AI 工程基础与 LLMs 专业证书 "的一部分，将为您提供利用 AI 改造各行业的实用技能。

本课程专为数据科学家、ML 工程师和 AI 爱好者设计，您将学习如何区分各种生成式 AI 架构和模型，如递归神经网络 (RNN)、Transformationer、生成对抗网络 (GAN)、变异自动编码器 (VAE) 和扩散模型。您还将发现生成预训练变换器（GPT）和变换器双向编码器表示（BERT）等 LLM 如何为实际语言任务提供支持。使用 NLTK、spaCy 和 Hugging Face 亲手实践 tokenization 技术，并使用 PyTorch 数据加载器构建高效的数据管道，为训练模型做好准备。对 Python、PyTorch 的基本了解以及对机器学习和神经网络的熟悉程度会有所帮助，但并非必须。立即报名，准备开启您的 AI 生成之旅！

单元详情

在本 Modulation 中，您将了解生成式 AI 的意义，以及它如何通过内容生成、代码创建和图像合成改变各个领域。您将探索关键的生成式 AI 架构，如生成对抗网络（GAN）、变异自动编码器（VAE）、扩散模型和 Transformer，并了解它们训练方法的不同之处。您还将考察生成预训练变换器（GPT）和变换器双向编码器表示（BERT）等大型语言模型（LLM）如何应用于构建基于 NLP 的应用程序。最后，通过动手实验室，您将使用 Hugging Face transformers 库创建一个简单的聊天机器人，并了解用于生成式 AI 开发的基本工具和库。

涵盖的内容

5个视频3篇阅读材料2个作业1个应用程序项目3个插件

5个视频总计28分钟

具有法学硕士学位的 AI 工程概述6分钟
课程介绍3分钟
生成式 AI 的意义6分钟
生成式 AI 架构和模型6分钟
用于 NLP 的生成式 AI7分钟

3篇阅读材料总计15分钟

IBM 产品聚焦：watsonx.governance2分钟
课程概览10分钟
摘要和要点3分钟

2个作业总计25分钟

分级测验：生成式 AI 架构15分钟
练习测验：生成式人工智能概述与架构10分钟

1个应用程序项目总计60分钟

实验室探索生成式 AI 库60分钟

3个插件总计32分钟

完成课程的有用提示2分钟
阅读AI 幻觉基础知识10分钟
阅读图书馆和工具概述20分钟

在本 Module 中，您将学习如何通过实现标记化和构建数据加载器，为训练 Large Language Model (LLM) 准备数据。您将探索不同的标记化方法，了解标记化器如何将原始文本转换为模型就绪的输入。您将使用 NLTK、spaCy、BertTokenizer 和 XLNetTokenizer 等库实现 tokenization。此外，您还将学习数据加载器在训练管道中的作用，并使用 PyTorch 中的 DataLoader 类创建一个带有自定义整理函数的数据加载器，以处理成批的文本。这些实用技能对于为 LLM 培训建立高效的 NLP 管道至关重要。此外，小抄和词汇表等辅助材料将强化您的学习。

涵盖的内容

2个视频6篇阅读材料2个作业2个应用程序项目2个插件

2个视频总计14分钟

令牌化7分钟
数据加载器概述7分钟

6篇阅读材料总计14分钟

数据质量和多样性促进有效的 LLM 培训5分钟
摘要和要点2分钟
下一步：探索 IBM watsonx.governance1分钟
课程总结3分钟
祝贺和下一步行动2分钟
团队和致谢1分钟

2个作业总计25分钟

分级测验：法律硕士的数据准备15分钟
练习测验：准备数据10分钟

2个应用程序项目总计120分钟

实验室实施 tokenization60分钟
实验室：创建 NLP 数据加载器60分钟

2个插件总计9分钟

小抄：Generative AI and LLMs：架构和数据准备5分钟
课程词汇：Generative AI and LLMs：架构与数据准备4分钟

获得职业证书

将此证书添加到您的 LinkedIn 个人资料、简历或履历中。在社交媒体和绩效考核中分享。

位教师

授课教师评分

(85个评价)

Joseph Santarcangelo

IBM

37 门课程2,470,530 名学生

提供方

IBM

学生评论

5 stars
77.31%
4 stars
15.04%
3 stars
4.86%
2 stars
1.62%
1 star
1.15%

显示 3/428 个

已于 Mar 2, 2025审阅

I love the structure and the content in this course. I can't wait applying the skills I have acquired!

已于 Jul 29, 2025审阅

I would expect more hands on and code submissions

已于 Jul 31, 2025审阅

gives a clear overview on genai - basics specifically tokenization, & data loader concepts

生成式人工智能和 LLM：架构和数据准备

生成式人工智能和 LLM：架构和数据准备

您将学到什么

您将获得的技能

您将学习的工具

要了解的详细信息

积累特定领域的专业知识

该课程共有2个模块

生成式 AI 架构

涵盖的内容

5个视频总计28分钟

3篇阅读材料总计15分钟

2个作业总计25分钟

1个应用程序项目总计60分钟

3个插件总计32分钟

法律硕士的数据准备

涵盖的内容

2个视频总计14分钟

6篇阅读材料总计14分钟

2个作业总计25分钟

2个应用程序项目总计120分钟

2个插件总计9分钟

获得职业证书

位教师

提供方

人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.

学生评论

常见问题

Coursera

社区

更多

移动应用程序