Images, audio, and video make up a growing share of the data companies generate today, but most pipelines are still built for structured data alone. This course teaches you to build AI-powered pipelines that process multimodal data and turn it into LLM-ready text.

Building Multimodal Data Pipelines
Sparen Sie mit 40% Rabatt auf 3 Monate Coursera Plus bei den Fähigkeiten, die Sie zum Strahlen bringen. Jetzt sparen


Empfohlene Erfahrung
Was Sie lernen werden
Extract structured, queryable data from unstructured images, audio, and video using OCR, ASR, and Vision Language Models.
Build a VLM-backed pipeline that reasons across video frames to generate timestamped scene descriptions and track events over time.
Build a multimodal RAG app on real-world data—turning raw images, audio, and video into a queryable interface with grounded, cited answers.
Kompetenzen, die Sie festigen
- Kategorie: Data Pipelines
- Kategorie: Retrieval-Augmented Generation
- Kategorie: Text Mining
- Kategorie: Large Language Modeling
- Kategorie: Multimodal Prompts
- Kategorie: Unstructured Data
- Kategorie: Sampling (Statistics)
- Kategorie: Embeddings
- Kategorie: Natural Language Processing
- Kategorie: Data Processing
- Kategorie: Data Capture
- Kategorie: Image Analysis
- Kategorie: Computer Vision
Tools, die Sie verwenden werden
- Kategorie: Prompt Engineering
- Kategorie: Generative AI
- Kategorie: Vector Databases
Wichtige Details
April 2026
Nur als Desktop-Version verfügbar
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Lernen, Üben und Anwenden von berufsrelevanten Fähigkeiten in weniger als 2 Stunden
- Nehmen Sie an Schulungen von Branchenexperten teil
- Sammeln Sie mit Aufgaben aus der realen Welt praktische Erfahrung

Über dieses Projekt
Dozent

Was Sie beim Lernen erwartet
Praktisches, projektbasiertes Lernen
Üben Sie die Anwendung neuer Kompetenzen, indem Sie berufsbezogene Aufgaben anhand von detaillierten Anweisungen lösen.
Keine Downloads oder Installation erforderlich
Greifen Sie in einer Cloud-Umgebung auf die Tools und Ressourcen zu.
Nur für Desktop verfügbar
Dieses Projekt ist für die Bearbeitung an einem Laptop oder Desktop-Computer mit stabiler Internetverbindung konzipiert und nicht für Mobilgeräte.
Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Ihnen könnte auch Folgendes gefallen:
Status: Kostenloser Testzeitraum
Status: KostenlosDeepLearning.AI
Status: Kostenloser Testzeitraum
Status: Kostenloser Testzeitraum




