Coursera

Spécialisation "LLM Optimization & Evaluation"

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Spécialisation "LLM Optimization & Evaluation"

Optimize & Deploy Production-Ready LLM Systems.

Build expertise in LLM evaluation, optimization, and deployment through hands-on MLOps projects.

John Whitworth
LearningMate

Instructeurs : John Whitworth

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Evaluate and optimize LLM performance using statistical testing, MLOps tools, and production monitoring systems.

  • Build automated pipelines for feature engineering, experiment tracking, and data processing with industry-standard tools.

  • Diagnose LLM errors, implement safety frameworks, and reduce operational costs through systematic analysis.

Compétences que vous acquerrez

  • Catégorie : AI Security
  • Catégorie : Data Pipelines
  • Catégorie : Data Presentation
  • Catégorie : Extract, Transform, Load
  • Catégorie : Large Language Modeling
  • Catégorie : LLM Application
  • Catégorie : MLOps (Machine Learning Operations)
  • Catégorie : Performance Tuning
  • Catégorie : Prompt Patterns
  • Catégorie : Root Cause Analysis
  • Catégorie : Scripting
  • Catégorie : SQL
  • Catégorie : Statistical Analysis
  • Catégorie : Technical Communication
  • Catégorie : Technical Documentation
  • Catégorie : User Acceptance Testing (UAT)
  • Catégorie : Version Control

Outils que vous découvrirez

  • Catégorie : Apache Airflow
  • Catégorie : Miro AI
  • Catégorie : Python Programming
  • Catégorie : PyTorch (Machine Learning Library)

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

décembre 2025

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 13 cours

Ce que vous apprendrez

  • Build feature engineering pipelines and evaluate ML experiments using MLOps tools to select and deploy production-ready models.

Compétences que vous acquerrez

Catégorie : Model Evaluation
Catégorie : Feature Engineering
Catégorie : Data Pipelines
Catégorie : Performance Tuning
Catégorie : Data Preprocessing
Catégorie : Predictive Modeling
Catégorie : Performance Analysis
Catégorie : Data Transformation
Catégorie : MLOps (Machine Learning Operations)

Ce que vous apprendrez

  • Use PyTorch Lightning to implement callbacks, diagnose instabilities, and optimize model performance.

Compétences que vous acquerrez

Catégorie : Deep Learning
Catégorie : PyTorch (Machine Learning Library)
Catégorie : Debugging
Catégorie : Performance Tuning
Catégorie : Model Deployment
Catégorie : Scalability
Catégorie : Model Evaluation
Catégorie : Transfer Learning
Catégorie : Artificial Neural Networks
Catégorie : MLOps (Machine Learning Operations)

Ce que vous apprendrez

  • Evaluate LLMs using metrics like BLEU & ROUGE run A/B tests for statistical significance, and optimize model performance with data-driven strategies.

Compétences que vous acquerrez

Catégorie : Model Evaluation
Catégorie : Statistical Analysis
Catégorie : Test Script Development
Catégorie : Statistical Hypothesis Testing
Catégorie : LLM Application
Catégorie : Business Metrics
Catégorie : Natural Language Processing
Catégorie : Prompt Engineering
Catégorie : Performance Metric
Catégorie : Large Language Modeling
Catégorie : Data-Driven Decision-Making

Ce que vous apprendrez

  • Use data analysis to diagnose LLM hallucinations by correlating user behavior and system errors, and document findings to guide engineering fixes.

Compétences que vous acquerrez

Catégorie : Root Cause Analysis
Catégorie : Analysis
Catégorie : Data Analysis
Catégorie : Data Analysis Expressions (DAX)
Catégorie : Generative AI
Catégorie : Business Metrics
Catégorie : Data Manipulation
Catégorie : Anomaly Detection
Catégorie : Performance Metric
Catégorie : Technical Communication
Catégorie : Customer Retention
Catégorie : LLM Application
Catégorie : Artificial Intelligence
Catégorie : Debugging
Catégorie : Data Processing
Catégorie : Pandas (Python Package)

Ce que vous apprendrez

  • Rigorously evaluate LLM performance using statistical tests and confidence intervals to make data-driven deployment decisions.

Compétences que vous acquerrez

Catégorie : Jupyter
Catégorie : Model Evaluation
Catégorie : Probability & Statistics
Catégorie : Matplotlib
Catégorie : Performance Metric
Catégorie : Statistical Hypothesis Testing
Catégorie : Statistical Analysis
Catégorie : Data Presentation
Catégorie : Statistical Inference
Catégorie : Statistical Methods
Catégorie : Experimentation
Catégorie : Statistical Visualization
Catégorie : Data-Driven Decision-Making
Catégorie : Data Storytelling
Catégorie : Large Language Modeling

Ce que vous apprendrez

  • Parameterized SQL with CTEs and window functions builds scalable, maintainable pipelines that adapt as business needs change.

  • Query optimization is systematic: analyze execution plans, find costly steps, then resolve them with indexing or rewrites.

  • Materialized summary tables and well-timed processing, like morning refreshes, support reliable analytics infrastructure.

  • Understanding execution internals helps analysts build self-sufficient workflows without recurring engineering delays.

Compétences que vous acquerrez

Catégorie : Performance Tuning
Catégorie : SQL
Catégorie : Extract, Transform, Load
Catégorie : Data Manipulation
Catégorie : Query Languages
Catégorie : Database Management
Catégorie : Stored Procedure
Catégorie : Scripting
Catégorie : Data Transformation
Catégorie : Data Pipelines

Ce que vous apprendrez

  • Build and validate a robust safety testing framework for LLMs. Create behavioral test suites and use mutation testing to ensure their effectiveness.

Compétences que vous acquerrez

Catégorie : Security Testing
Catégorie : AI Security
Catégorie : Software Testing
Catégorie : Test Case
Catégorie : Maintainability
Catégorie : Test Tools
Catégorie : Test Script Development
Catégorie : Unit Testing
Catégorie : Software Technical Review
Catégorie : Model Evaluation
Catégorie : LLM Application
Catégorie : Threat Modeling
Catégorie : API Testing
Catégorie : Large Language Modeling
Catégorie : Prompt Engineering
Catégorie : Penetration Testing
Catégorie : Verification And Validation
Catégorie : Quality Assessment
Catégorie : Responsible AI
Catégorie : Code Coverage

Ce que vous apprendrez

  • Track, version, and evaluate ML experiments using DVC and W&B to reliably select and prepare models for production deployment.

Compétences que vous acquerrez

Catégorie : MLOps (Machine Learning Operations)
Catégorie : Model Evaluation
Catégorie : Version Control
Catégorie : Data Management
Catégorie : Technical Documentation
Catégorie : Performance Testing
Catégorie : Performance Analysis
Catégorie : Machine Learning
Catégorie : Dashboard
Catégorie : Scripting
Catégorie : Git (Version Control System)
Catégorie : Large Language Modeling

Ce que vous apprendrez

  • Create automated Python scripts to manage multi-step cloud workflows, from provisioning resources to persisting data.

Compétences que vous acquerrez

Catégorie : Scripting
Catégorie : Python Programming
Catégorie : Data Persistence
Catégorie : Cloud Deployment
Catégorie : Command-Line Interface
Catégorie : Infrastructure as Code (IaC)
Catégorie : Virtual Machines
Catégorie : Data Pipelines

Ce que vous apprendrez

  • Build automated data pipelines with Apache Airflow, manage schema evolution to prevent failures, and implement monitoring for data integrity.

Compétences que vous acquerrez

Catégorie : Data Pipelines
Catégorie : Apache Airflow
Catégorie : Data Integrity
Catégorie : Data Quality
Catégorie : Data Modeling
Catégorie : Data Transformation
Catégorie : Extract, Transform, Load
Catégorie : System Monitoring
Catégorie : Scalability
Catégorie : Technical Communication
Catégorie : Continuous Monitoring
Catégorie : Data Validation
Catégorie : Data Migration

Ce que vous apprendrez

  • Translate an LLM product concept into a detailed PRD and create a UAT plan to validate that the delivered feature meets user requirements.

Compétences que vous acquerrez

Catégorie : User Acceptance Testing (UAT)
Catégorie : User Story
Catégorie : Technical Communication
Catégorie : Large Language Modeling
Catégorie : Risk Management Framework
Catégorie : User Requirements Documents
Catégorie : Functional Testing
Catégorie : Key Performance Indicators (KPIs)
Catégorie : AI Product Strategy
Catégorie : Business Requirements
Catégorie : Scenario Testing
Catégorie : LLM Application
Catégorie : Functional Requirement
Catégorie : Acceptance Testing
Catégorie : Requirements Analysis
Catégorie : Product Requirements

Ce que vous apprendrez

  • Create operational run-books for LLM systems and evaluate prompt patterns to improve performance and reduce operational costs.

Compétences que vous acquerrez

Catégorie : Prompt Patterns
Catégorie : Prompt Engineering
Catégorie : Technical Documentation
Catégorie : Data Maintenance
Catégorie : Performance Tuning
Catégorie : Configuration Management
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Technical Writing
Catégorie : Requirements Analysis
Catégorie : Performance Testing
Catégorie : Large Language Modeling
Catégorie : Benchmarking

Ce que vous apprendrez

  • Optimize LLM costs by analyzing spend reports and streamline ML pipelines using value-stream mapping to boost efficiency and reduce cycle times.

Compétences que vous acquerrez

Catégorie : Process Improvement and Optimization
Catégorie : Business Workflow Analysis
Catégorie : Process Optimization
Catégorie : Expense Management
Catégorie : Data-Driven Decision-Making
Catégorie : Cost Management
Catégorie : Productivity Software
Catégorie : Process Analysis
Catégorie : Cost Benefit Analysis
Catégorie : Miro AI

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

John Whitworth
Coursera
30 Cours 1 697 apprenants
LearningMate
229 Cours 14 147 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions