Coursera

End-to-End Multimodal AI: Fine-Tuning, Fusion, and MLOps

Sparen Sie mit 40% Rabatt auf 3 Monate Coursera Plus bei den Fähigkeiten, die Sie zum Strahlen bringen. Jetzt sparen

kurs ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
Coursera

End-to-End Multimodal AI: Fine-Tuning, Fusion, and MLOps

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

2 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

2 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Fine-tune transformer-based multimodal models using transfer learning in PyTorch and TensorFlow.

  • Build cross-modal retrieval systems using FAISS and attention-based fusion of visual and text embeddings.

  • Automate ML pipelines with drift monitoring, hyperparameter tuning, and retraining using MLflow and Ray Tune.

  • Design and document versioned multimodal inference APIs with FastAPI, OAuth2, and OpenAPI specifications.

Kompetenzen, die Sie erwerben

  • Kategorie: Solution Architecture
  • Kategorie: API Design
  • Kategorie: Fine-tuning
  • Kategorie: Artificial Intelligence and Machine Learning (AI/ML)
  • Kategorie: Machine Learning Algorithms
  • Kategorie: Model Training
  • Kategorie: MLOps (Machine Learning Operations)
  • Kategorie: Model Evaluation
  • Kategorie: Transfer Learning
  • Kategorie: Data Science
  • Kategorie: Machine Learning Software
  • Kategorie: Model Optimization
  • Kategorie: Machine Learning
  • Kategorie: Technical Communication
  • Kategorie: Data Architecture

Werkzeuge, die Sie lernen werden

  • Kategorie: OAuth
  • Kategorie: Model Deployment
  • Kategorie: AI Workflows
  • Kategorie: Vision Transformer (ViT)
  • Kategorie: Restful API

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

März 2026

Bewertungen

38 Zuweisungen¹

KI-bewertet siehe Haftungsausschluss
Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihr Fachwissen im Bereich Algorithms

Dieser Kurs ist Teil der Spezialisierung Multimodal Intelligence - Vision, Audio & Language in Action (berufsbezogenes Zertifikat)
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für dieses berufsbezogene Zertifikat angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat von Coursera zur Vorlage

In diesem Kurs gibt es 20 Module

You will build the foundational MLOps infrastructure for multimodal AI systems by designing modular data pipeline components and implementing your first multimodal transformer fine-tuning workflow using open source tools.

Das ist alles enthalten

3 Videos1 Lektüre1 Aufgabe1 Unbewertetes Labor

You will accelerate multimodal model development using transfer learning techniques and implement the transformation and loading pipeline stages that deliver processed data and trained models reliably to downstream systems.

Das ist alles enthalten

1 Video1 Lektüre3 Aufgaben

You will identify and analyze training and validation metric patterns to diagnose overfitting and gradient stability issues using TensorBoard visualization tools.

Das ist alles enthalten

2 Videos1 Lektüre1 Aufgabe1 Unbewertetes Labor

You will implement targeted interventions including gradient clipping and early stopping to stabilize training processes and prevent common neural network training failures.

Das ist alles enthalten

1 Video1 Lektüre3 Aufgaben

You will learn systematic image preprocessing techniques including normalization and color-space conversions to prepare raw visual data for computer vision applications.

Das ist alles enthalten

3 Videos1 Lektüre1 Aufgabe1 Unbewertetes Labor

You will learn optical flow and frame differencing techniques to extract temporal motion features from video sequences for computer vision applications.

Das ist alles enthalten

2 Videos1 Lektüre2 Aufgaben

You will establish foundational understanding of systematic error analysis approaches and learn to evaluate computer vision model performance beyond basic accuracy metrics.

Das ist alles enthalten

2 Videos1 Lektüre1 Aufgabe1 Unbewertetes Labor

You will apply advanced techniques to identify systematic failure patterns in computer vision models and generate comprehensive quality reports for model improvement.

Das ist alles enthalten

1 Video1 Lektüre3 Aufgaben

You will build foundational understanding of cross-modal retrieval systems and implement approximate nearest-neighbor search algorithms using FAISS for production-scale similarity search across multimodal embeddings.

Das ist alles enthalten

1 Video2 Lektüren1 Aufgabe1 Unbewertetes Labor

You will design and implement sophisticated attention-based fusion algorithms that intelligently combine visual and textual embeddings, mastering the creation of multimodal neural architectures for advanced cross-modal AI applications.

Das ist alles enthalten

2 Lektüren3 Aufgaben

You will learn the foundational concepts of computational complexity analysis, learning to systematically evaluate fusion algorithms using Big O notation and profiling tools.

Das ist alles enthalten

3 Videos1 Lektüre1 Aufgabe1 Unbewertetes Labor

You will apply complexity analysis skills to make strategic optimization decisions, evaluating trade-offs between performance, accuracy, and resource constraints in real-world deployment scenarios.

Das ist alles enthalten

1 Video3 Aufgaben

You will learn the systematic evaluation of production ML models to identify performance degradation and implement drift detection systems that automatically trigger remediation actions.

Das ist alles enthalten

1 Video1 Lektüre1 Aufgabe1 Unbewertetes Labor

You will build comprehensive automated ML pipelines with integrated hyperparameter optimization and end-to-end automation that maintains model performance in production environments.

Das ist alles enthalten

2 Videos1 Lektüre3 Aufgaben

You will build foundational skills for systematically analyzing multimodal AI model outputs, understanding cross-modal relationships, and preparing technical findings for stakeholder communication.

Das ist alles enthalten

2 Videos1 Lektüre1 Aufgabe1 Unbewertetes Labor

You will learn the critical skills of translating complex multimodal AI analysis into compelling business narratives, creating executive-level presentations, and developing stakeholder communication frameworks that drive strategic decisions.

Das ist alles enthalten

2 Videos1 Lektüre3 Aufgaben

You will design and implement versioned API endpoints specifically optimized for multimodal AI inference workloads

Das ist alles enthalten

3 Videos1 Lektüre2 Aufgaben

You will implement comprehensive OAuth2 authentication systems and observability middleware for production API services

Das ist alles enthalten

2 Videos1 Lektüre2 Aufgaben

You will create comprehensive OpenAPI specifications that enable automated testing, client generation, and seamless integration

Das ist alles enthalten

2 Videos1 Lektüre2 Aufgaben1 Unbewertetes Labor

You will build a production-grade multimodal AI system that processes visual and textual data, integrating fine-tuning, cross-modal fusion, and deployment-ready inference services.This capstone synthesizes model optimization, data engineering, API design, and MLOps practices to deliver a deployable, monitored multimodal application.

Das ist alles enthalten

4 Lektüren1 Aufgabe

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

Professionals from the Industry
472 Kurse83.884 Lernende

von

Coursera

Mehr von Algorithms entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen

¹ Einige Aufgaben in diesem Kurs werden mit AI bewertet. Für diese Aufgaben werden Ihre Daten in Übereinstimmung mit Datenschutzhinweis von Courseraverwendet.