Développez vos compétences avec Coursera Plus pour 239 $/an (habituellement 399 $). Économisez maintenant.

Ce cours n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Building Reliable LLM Systems

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

2 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

2 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Build scripts with lexical/semantic metrics to evaluate LLMs, diagnose hallucinations, and balance vector-search recall against latency.

  • Apply hypothesis testing, confidence intervals, and significance metrics to evaluate model accuracy and validate results from A/B experiments.

  • Utilize parameterized SQL and data manipulation to segment user logs, calculate retention, and securely retrieve large-scale datasets.

  • Analyze LLM performance gaps to prioritize technical fixes and implement remediation measures for production-level reliability.

Compétences que vous acquerrez

  • Catégorie : Debugging
  • Catégorie : Model Evaluation
  • Catégorie : Performance Testing
  • Catégorie : Retrieval-Augmented Generation
  • Catégorie : Large Language Modeling
  • Catégorie : Statistical Analysis
  • Catégorie : SQL
  • Catégorie : MLOps (Machine Learning Operations)
  • Catégorie : Performance Tuning
  • Catégorie : Statistical Hypothesis Testing
  • Catégorie : Data-Driven Decision-Making
  • Catégorie : Artificial Intelligence and Machine Learning (AI/ML)
  • Catégorie : LLM Application

Outils que vous découvrirez

  • Catégorie : Pandas (Python Package)
  • Catégorie : Python Programming
  • Catégorie : Query Languages
  • Catégorie : Vector Databases

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

mars 2026

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "LLM Engineering That Works: Prompting, Tuning, and Retrieval"
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 5 modules dans ce cours

This module lays the groundwork for quantitative Large Language Mode (LLM) evaluation. Learners will discover why relying on intuition to judge model performance is unsustainable and explore the foundational metrics used to create automated, objective evaluation systems. We will cover both lexical similarity metrics (like BLEU and ROUGE-L) that assess text structure and semantic metrics (like cosine similarity) that capture meaning. By the end of this module, learners will have the conceptual understanding and practical code to build their first automated evaluation script.

Inclus

8 vidéos3 lectures3 devoirs3 laboratoires non notés

When a production chatbot starts giving incorrect answers, how do you find the problem and fix it? This module equips AI practitioners, ML engineers, and data analysts with the essential skills for debugging production LLMs. Go beyond theory and learn the systematic, data-driven workflow that professionals use to solve the critical problem of AI hallucinations. You will be equipped to transition from merely observing AI failures to expertly diagnosing and resolving them.

Inclus

5 vidéos3 lectures3 devoirs2 laboratoires non notés

When making high-stakes deployment decisions, a simple accuracy score is not enough. This module equips you with the statistical methods to rigorously validate LLM performance improvements. By the end of this module, you will be able to move beyond subjective "it seems better" evaluations to confidently state, "we can prove it's better," ensuring every deployment decision is backed by sound statistical evidence.

Inclus

5 vidéos2 lectures3 devoirs3 laboratoires non notés

In the world of large-scale AI, slow queries and inefficient search can bring a system to its knees. This module provides the critical skills to prevent that, focusing on practical database and vector search optimization techniques. By the end of this module, you will be equipped to systematically analyze and optimize production retrieval systems, ensuring your AI applications are not only powerful but also fast and reliable.

Inclus

4 vidéos3 lectures4 devoirs3 laboratoires non notés

In this module, you will conduct an end-to-end performance audit comparing two LLM variants using an A/B test dataset. You will implement a pipeline to calculate key performance metrics, including lexical and semantic similarity, and use statistical A/B testing to validate model improvements. The project culminates in a comprehensive report where you will correlate hallucination rates with retrieval logs and synthesize your findings into data-driven recommendations for stakeholders, guiding the decision for a production-level rollout in a customer support application.

Inclus

2 lectures1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Professionals from the Industry
290 Cours 43 476 apprenants

Offert par

Coursera

En savoir plus sur Machine Learning

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.