了解如何构建多模式搜索和 RAG 系统。RAG 系统通过将专有数据纳入提示上下文来增强 LLM。通常情况下,RAG 应用程序使用文本文档,但是,如果所需的上下文包括图像、音频和视频等多媒体呢?本课程涵盖了使用多模态数据实施 RAG 以实现这一目标的技术方面。了解如何通过对比学习训练多模态模型,并在真实数据集上加以实现。2. 建立任意到任意的多模态搜索,以检索不同数据类型的相关上下文。了解如何通过 Visual instruction tuning 训练 LLM 来理解多模态数据,并将其用于多个图像推理实例上。4. 实现端到端多模态 RAG 系统,该系统可分析检索到的多模态上下文以生成有见地的答案。探索行业应用,如 Visualization 分析发票和流程图以输出结构化数据。创建一个多 Vector 推荐系统,通过比较多种模态的相似性来推荐相关项目。 随着 AI 系统越来越需要对多种数据模态进行处理和推理,学习如何构建此类系统是 AI 开发人员的一项重要技能。 本课程让您掌握在不同模态之间嵌入、检索和生成的关键技能。通过在多模态 AI 方面打下坚实的基础,您将为构建更智能的搜索、RAG 和推荐系统做好准备。
通过 Coursera Plus 解锁访问 10,000 多门课程。开始 7 天免费试用。


了解顶级公司的员工如何掌握热门技能

在 2 小时内学习、练习并应用岗位必备技能
- 接受行业专家的培训
- 获得解决实训工作任务的实践经验

关于此项目
位教师
授课教师评分
4.2 (12个评价)
学习方式
基于实践项目的学习
按照分步说明完成与工作相关的任务来练习新技能。
无需下载或安装
在云环境中访问您所需的工具和资源。
仅在台式计算机上可用
此项目专为具有可靠互联网连接的笔记本电脑或台式计算机而设计,而不是移动设备。
人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'

Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'

Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'

Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'
常见问题
在课程中,您将在交互式实践环境中按照一系列说明完成活动或场景。课程在真实云环境和各种产品的真实实例中完成,而不是在模拟或演示环境中完成。
购买课程后,您将获得完成该课程所需的一切信息,包括完成该课程所需的任意产品的临时访问权限。
虽然从技术上讲,您可以通过移动设备访问此课程,但我们强烈建议您仅在笔记本电脑或台式机上完成课程。



