Coursera

Spécialisation "LLM Optimization & Evaluation"

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Spécialisation "LLM Optimization & Evaluation"

Optimize & Deploy Production-Ready LLM Systems.

Build expertise in LLM evaluation, optimization, and deployment through hands-on MLOps projects.

John Whitworth
LearningMate

Instructeurs : John Whitworth

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Evaluate and optimize LLM performance using statistical testing, MLOps tools, and production monitoring systems.

  • Build automated pipelines for feature engineering, experiment tracking, and data processing with industry-standard tools.

  • Diagnose LLM errors, implement safety frameworks, and reduce operational costs through systematic analysis.

Compétences que vous acquerrez

  • Catégorie : AI Security
  • Catégorie : Data Pipelines
  • Catégorie : Extract, Transform, Load
  • Catégorie : Large Language Modeling
  • Catégorie : LLM Application
  • Catégorie : MLOps (Machine Learning Operations)
  • Catégorie : Performance Tuning
  • Catégorie : Prompt Patterns
  • Catégorie : Root Cause Analysis
  • Catégorie : Scripting
  • Catégorie : SQL
  • Catégorie : Statistical Analysis
  • Catégorie : Technical Communication
  • Catégorie : Technical Documentation
  • Catégorie : User Acceptance Testing (UAT)
  • Catégorie : Version Control
  • Catégorie : Data Visualization

Outils que vous découvrirez

  • Catégorie : Apache Airflow
  • Catégorie : Miro AI
  • Catégorie : Python Programming
  • Catégorie : PyTorch (Machine Learning Library)

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

décembre 2025

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 13 cours

Ce que vous apprendrez

  • Build feature engineering pipelines and evaluate ML experiments using MLOps tools to select and deploy production-ready models.

Compétences que vous acquerrez

Catégorie : Model Evaluation
Catégorie : Feature Engineering
Catégorie : Data Pipelines
Catégorie : Predictive Modeling
Catégorie : Performance Tuning
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Data Transformation
Catégorie : Performance Analysis
Catégorie : Data Preprocessing

Ce que vous apprendrez

  • Use PyTorch Lightning to implement callbacks, diagnose instabilities, and optimize model performance.

Compétences que vous acquerrez

Catégorie : Performance Tuning
Catégorie : PyTorch (Machine Learning Library)
Catégorie : Debugging
Catégorie : Deep Learning
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Scalability
Catégorie : Transfer Learning
Catégorie : Model Deployment
Catégorie : Model Evaluation
Catégorie : Artificial Neural Networks

Ce que vous apprendrez

  • Evaluate LLMs using metrics like BLEU & ROUGE run A/B tests for statistical significance, and optimize model performance with data-driven strategies.

Compétences que vous acquerrez

Catégorie : Model Evaluation
Catégorie : Statistical Analysis
Catégorie : Test Script Development
Catégorie : Statistical Hypothesis Testing
Catégorie : Data-Driven Decision-Making
Catégorie : Business Metrics
Catégorie : Prompt Engineering
Catégorie : LLM Application
Catégorie : Performance Metric
Catégorie : Large Language Modeling
Catégorie : Natural Language Processing

Ce que vous apprendrez

  • Use data analysis to diagnose LLM hallucinations by correlating user behavior and system errors, and document findings to guide engineering fixes.

Compétences que vous acquerrez

Catégorie : Root Cause Analysis
Catégorie : Anomaly Detection
Catégorie : Customer Retention
Catégorie : Pandas (Python Package)
Catégorie : Artificial Intelligence
Catégorie : Performance Metric
Catégorie : Generative AI
Catégorie : Business Metrics
Catégorie : LLM Application
Catégorie : Data Analysis
Catégorie : Data Manipulation
Catégorie : Data Analysis Expressions (DAX)
Catégorie : Debugging
Catégorie : Technical Communication
Catégorie : Data Processing
Catégorie : Analysis

Ce que vous apprendrez

  • Rigorously evaluate LLM performance using statistical tests and confidence intervals to make data-driven deployment decisions.

Compétences que vous acquerrez

Catégorie : Model Evaluation
Catégorie : Experimentation
Catégorie : Performance Metric
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Statistical Analysis
Catégorie : Probability & Statistics
Catégorie : Matplotlib
Catégorie : Data-Driven Decision-Making
Catégorie : Data Visualization
Catégorie : Statistical Methods
Catégorie : Statistical Inference
Catégorie : Statistical Hypothesis Testing
Catégorie : Large Language Modeling
Catégorie : Statistical Visualization

Ce que vous apprendrez

  • Parameterized SQL with CTEs and window functions builds scalable, maintainable pipelines that adapt as business needs change.

  • Query optimization is systematic: analyze execution plans, find costly steps, then resolve them with indexing or rewrites.

  • Materialized summary tables and well-timed processing, like morning refreshes, support reliable analytics infrastructure.

  • Understanding execution internals helps analysts build self-sufficient workflows without recurring engineering delays.

Compétences que vous acquerrez

Catégorie : Performance Tuning
Catégorie : SQL
Catégorie : Data Transformation
Catégorie : Data Manipulation
Catégorie : Scripting
Catégorie : Query Languages
Catégorie : Database Management
Catégorie : Stored Procedure
Catégorie : Data Pipelines
Catégorie : Extract, Transform, Load

Ce que vous apprendrez

  • Build and validate a robust safety testing framework for LLMs. Create behavioral test suites and use mutation testing to ensure their effectiveness.

Compétences que vous acquerrez

Catégorie : Security Testing
Catégorie : Prompt Engineering
Catégorie : Software Technical Review
Catégorie : AI Security
Catégorie : Threat Modeling
Catégorie : Test Script Development
Catégorie : Software Testing
Catégorie : Test Case
Catégorie : API Testing
Catégorie : Model Evaluation
Catégorie : Large Language Modeling
Catégorie : Penetration Testing
Catégorie : Unit Testing
Catégorie : Responsible AI
Catégorie : Test Tools
Catégorie : LLM Application
Catégorie : Code Coverage
Catégorie : Maintainability
Catégorie : Verification And Validation
Catégorie : Quality Assessment

Ce que vous apprendrez

  • Track, version, and evaluate ML experiments using DVC and W&B to reliably select and prepare models for production deployment.

Compétences que vous acquerrez

Catégorie : MLOps (Machine Learning Operations)
Catégorie : Model Evaluation
Catégorie : Version Control
Catégorie : Git (Version Control System)
Catégorie : Scripting
Catégorie : Data Management
Catégorie : Large Language Modeling
Catégorie : Performance Analysis
Catégorie : Machine Learning
Catégorie : Technical Documentation
Catégorie : Dashboard
Catégorie : Performance Testing

Ce que vous apprendrez

  • Create automated Python scripts to manage multi-step cloud workflows, from provisioning resources to persisting data.

Compétences que vous acquerrez

Catégorie : Scripting
Catégorie : Data Persistence
Catégorie : Python Programming
Catégorie : Infrastructure as Code (IaC)
Catégorie : Cloud Deployment
Catégorie : Command-Line Interface
Catégorie : Data Pipelines
Catégorie : Virtual Machines

Ce que vous apprendrez

  • Build automated data pipelines with Apache Airflow, manage schema evolution to prevent failures, and implement monitoring for data integrity.

Compétences que vous acquerrez

Catégorie : Data Integrity
Catégorie : Apache Airflow
Catégorie : Data Pipelines
Catégorie : Data Quality
Catégorie : Data Migration
Catégorie : System Monitoring
Catégorie : Data Validation
Catégorie : Data Transformation
Catégorie : Data Modeling
Catégorie : Extract, Transform, Load
Catégorie : Scalability
Catégorie : Technical Communication
Catégorie : Continuous Monitoring

Ce que vous apprendrez

  • Translate an LLM product concept into a detailed PRD and create a UAT plan to validate that the delivered feature meets user requirements.

Compétences que vous acquerrez

Catégorie : User Acceptance Testing (UAT)
Catégorie : AI Product Strategy
Catégorie : Product Requirements
Catégorie : Large Language Modeling
Catégorie : Requirements Analysis
Catégorie : Scenario Testing
Catégorie : Risk Management Framework
Catégorie : Key Performance Indicators (KPIs)
Catégorie : User Requirements Documents
Catégorie : Technical Communication
Catégorie : LLM Application
Catégorie : User Story
Catégorie : Functional Testing
Catégorie : Functional Requirement
Catégorie : Business Requirements
Catégorie : Acceptance Testing

Ce que vous apprendrez

  • Create operational run-books for LLM systems and evaluate prompt patterns to improve performance and reduce operational costs.

Compétences que vous acquerrez

Catégorie : Prompt Patterns
Catégorie : Prompt Engineering
Catégorie : Configuration Management
Catégorie : Large Language Modeling
Catégorie : Performance Tuning
Catégorie : Technical Writing
Catégorie : Performance Testing
Catégorie : Requirements Analysis
Catégorie : Benchmarking
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Data Maintenance
Catégorie : Technical Documentation

Ce que vous apprendrez

  • Optimize LLM costs by analyzing spend reports and streamline ML pipelines using value-stream mapping to boost efficiency and reduce cycle times.

Compétences que vous acquerrez

Catégorie : Process Improvement and Optimization
Catégorie : Miro AI
Catégorie : Process Analysis
Catégorie : Cost Benefit Analysis
Catégorie : Cost Management
Catégorie : Productivity Software
Catégorie : Business Workflow Analysis
Catégorie : Process Optimization
Catégorie : Expense Management
Catégorie : Data-Driven Decision-Making

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

John Whitworth
Coursera
30 Cours 1 839 apprenants
LearningMate
231 Cours 15 499 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions