Aperçu module
Aperçu limité — 3 premières étapes

Jailbreaks & prompt injection

Parcours : Sécurité IA & Red Teaming · Avancé

Jailbreaks & prompt injection
1/7
Étape 1 / 7

6 min

Contexte

Pourquoi les garde-fous d'un modèle peuvent être contournés.

Au programme de ce module

  1. 01Contexte6 min
  2. 02Explication9 min
  3. 03Démonstration6 min
  4. 04Use Case6 min
  5. 05Case Study6 min
  6. 06Exercice6 min
  7. 07Quiz5 min

Les garde-fous d'un LLM sont appris, pas codés en dur. Un attaquant peut donc tenter de les contourner par des formulations qui « sortent » le modèle de son cadre : c'est le jailbreak. Plus subtil, l'injection de prompt glisse des instructions hostiles dans des données que le modèle traite comme du contenu légitime.

Objectifs d'apprentissage

À l'issue de ce module, vous saurez *Distinguer* jailbreak (entrée utilisateur) et injection (donnée tierce, directe ou indirecte), *Analyser* la surface d'attaque d'un agent par source de données, et *Concevoir* une défense en profondeur (séparation, moindre privilège, validation humaine).