Board Infinity

Deploying Deep Learning: Quantization, Serving, and Edge AI

Sparen Sie mit 40% Rabatt auf 3 Monate Coursera Plus bei den Fähigkeiten, die Sie zum Strahlen bringen. Jetzt sparen

kurs ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
Board Infinity

Deploying Deep Learning: Quantization, Serving, and Edge AI

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Fortgeschritten

Empfohlene Erfahrung

2 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Fortgeschritten

Empfohlene Erfahrung

2 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Apply INT4/INT8 quantization (AWQ, GPTQ, GGUF) to compress LLMs and vision models for production

  • Deploy high-throughput inference servers using vLLM's PagedAttention and NVIDIA Triton

  • Run optimized LLMs on CPU and edge devices using ONNX Runtime and Llama.cpp

  • Build, benchmark, and containerize a production-ready inference API with Docker

Kompetenzen, die Sie erwerben

  • Kategorie: API Design
  • Kategorie: Containerization
  • Kategorie: Application Deployment
  • Kategorie: Performance Tuning
  • Kategorie: Cloud Deployment
  • Kategorie: Large Language Modeling
  • Kategorie: Fine-tuning
  • Kategorie: Model Evaluation
  • Kategorie: Model Optimization
  • Kategorie: Memory Management
  • Kategorie: Scalability

Werkzeuge, die Sie lernen werden

  • Kategorie: Docker (Software)
  • Kategorie: Model Deployment

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

Mai 2026

Bewertungen

16 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung „Advanced Deep Learning Architectures“
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage

In diesem Kurs gibt es 4 Module

Learn model compression fundamentals, memory profiling, and modern INT8/INT4 quantization techniques including AWQ and GPTQ to optimize models for production inference.

Das ist alles enthalten

9 Videos3 Lektüren4 Aufgaben

Master production-grade serving engines including vLLM with PagedAttention and NVIDIA Triton for scaling inference across GPUs and nodes.

Das ist alles enthalten

9 Videos3 Lektüren4 Aufgaben

Export models to ONNX for interoperability, deploy LLMs on CPU and edge devices with Llama.cpp and GGUF, and build multimodal pipelines with CLIP and LLaVA.

Das ist alles enthalten

9 Videos3 Lektüren4 Aufgaben

Apply all course concepts in a final project to quantize a fine-tuned model, serve it via vLLM, benchmark it, and package it for cloud and edge deployment.

Das ist alles enthalten

9 Videos3 Lektüren4 Aufgaben

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozent

Board Infinity
Board Infinity
258 Kurse414.388 Lernende

von

Board Infinity

Mehr von Machine Learning entdecken

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen