Aperçu module
Aperçu limité — 3 premières étapesAlignement : RLHF & Constitutional AI
Parcours : IA Safety & alignement · Avancé
1/7
Étape 1 / 7
≈ 5 min
Contexte
Pourquoi un modèle brut doit être « aligné » sur les intentions humaines.
Photo à shooterIllustration — Contexte
Un modèle pré-entraîné prédit du texte mais n'a aucune notion de ce qui est utile, honnête ou inoffensif. L'alignement est l'ensemble des techniques qui orientent son comportement vers les intentions humaines : être serviable, ne pas tromper, refuser le dangereux.