准备好探索令人兴奋的生成式 AI 和 Large Language Model (LLMs) 世界了吗?本 IBM 课程是 "生成式 AI 工程基础与 LLMs 专业证书 "的一部分,将为您提供利用 AI 改造各行业的实用技能。
本课程专为数据科学家、ML 工程师和 AI 爱好者设计,您将学习如何区分各种生成式 AI 架构和模型,如递归神经网络 (RNN)、Transformationer、生成对抗网络 (GAN)、变异自动编码器 (VAE) 和扩散模型。您还将发现生成预训练变换器(GPT)和变换器双向编码器表示(BERT)等 LLM 如何为实际语言任务提供支持。
使用 NLTK、spaCy 和 Hugging Face 亲手实践 tokenization 技术,并使用 PyTorch 数据加载器构建高效的数据管道,为训练模型做好准备。
对 Python、PyTorch 的基本了解以及对机器学习和神经网络的熟悉程度会有所帮助,但并非必须。立即报名,准备开启您的 AI 生成之旅!
在本 Modulation 中,您将了解生成式 AI 的意义,以及它如何通过内容生成、代码创建和图像合成改变各个领域。您将探索关键的生成式 AI 架构,如生成对抗网络(GAN)、变异自动编码器(VAE)、扩散模型和 Transformer,并了解它们训练方法的不同之处。您还将考察生成预训练变换器(GPT)和变换器双向编码器表示(BERT)等大型语言模型(LLM)如何应用于构建基于 NLP 的应用程序。最后,通过动手实验室,您将使用 Hugging Face transformers 库创建一个简单的聊天机器人,并了解用于生成式 AI 开发的基本工具和库。
涵盖的内容
5个视频3篇阅读材料2个作业1个应用程序项目3个插件
显示有关单元内容的信息
5个视频•总计28分钟
具有法学硕士学位的 AI 工程概述•6分钟
课程介绍•3分钟
生成式 AI 的意义•6分钟
生成式 AI 架构和模型•6分钟
用于 NLP 的生成式 AI•7分钟
3篇阅读材料•总计15分钟
IBM 产品聚焦:watsonx.governance•2分钟
课程概览•10分钟
摘要和要点•3分钟
2个作业•总计25分钟
分级测验:生成式 AI 架构•15分钟
练习测验:生成式人工智能概述与架构•10分钟
1个应用程序项目•总计60分钟
实验室探索生成式 AI 库•60分钟
3个插件•总计32分钟
完成课程的有用提示•2分钟
阅读AI 幻觉基础知识•10分钟
阅读图书馆和工具概述•20分钟
法律硕士的数据准备
第 2 单元•小时 后完成
单元详情
在本 Module 中,您将学习如何通过实现标记化和构建数据加载器,为训练 Large Language Model (LLM) 准备数据。您将探索不同的标记化方法,了解标记化器如何将原始文本转换为模型就绪的输入。您将使用 NLTK、spaCy、BertTokenizer 和 XLNetTokenizer 等库实现 tokenization。此外,您还将学习数据加载器在训练管道中的作用,并使用 PyTorch 中的 DataLoader 类创建一个带有自定义整理函数的数据加载器,以处理成批的文本。这些实用技能对于为 LLM 培训建立高效的 NLP 管道至关重要。此外,小抄和词汇表等辅助材料将强化您的学习。