Évaluation & fiabilité : tests, garde-fous, observabilité
Parcours : Développer avec les LLMs · Avancé

≈ 6 min
Contexte
Pourquoi « ça a marché sur ma démo » ne suffit pas pour une app IA en production.
Au programme de ce module
- 01Contexte≈ 6 min
- 02Explication≈ 9 min
- 03Démonstration≈ 6 min
- 04Use Case≈ 6 min
- 05Case Study≈ 6 min
- 06Exercice≈ 6 min
- 07Quiz≈ 5 min

Une démo qui impressionne le directeur peut échouer une fois sur trois en production. Une app IA exige les mêmes disciplines qu'une app classique — tests, observabilité, coûts — plus des spécificités : évaluations sur jeu d'exemples, garde-fous contre les abus, suivi des hallucinations.
Objectifs d'apprentissage
À l'issue de ce module, vous saurez *Construire* un jeu d'évaluation (eval set), *Implémenter* des garde-fous d'entrée et de sortie, *Mettre en place* observabilité et tracking des coûts, et *Décider* des SLO/SLA réalistes pour une app IA.