Aperçu module
Aperçu limité — 3 premières étapes

Alignement : RLHF & Constitutional AI

Parcours : IA Safety & alignement · Avancé

1/7
Étape 1 / 7

5 min

Contexte

Pourquoi un modèle brut doit être « aligné » sur les intentions humaines.

Un modèle pré-entraîné prédit du texte mais n'a aucune notion de ce qui est utile, honnête ou inoffensif. L'alignement est l'ensemble des techniques qui orientent son comportement vers les intentions humaines : être serviable, ne pas tromper, refuser le dangereux.