Alignement : RLHF & Constitutional AI

Parcours : IA Safety & alignement · Avancé

1/7

Étape 1 / 7

≈ 5 min

Contexte

Pourquoi un modèle brut doit être « aligné » sur les intentions humaines.

Photo à shooterIllustration — Contexte

Un modèle pré-entraîné prédit du texte mais n'a aucune notion de ce qui est utile, honnête ou inoffensif. L'alignement est l'ensemble des techniques qui orientent son comportement vers les intentions humaines : être serviable, ne pas tromper, refuser le dangereux.