Aperçu module
Aperçu limité — 3 premières étapes

Embeddings et recherche sémantique

Parcours : Data, RAG & Vector Databases · Avancé

Embeddings et recherche sémantique
1/7
Étape 1 / 7

15 min

Contexte

Pourquoi la recherche par mots-clés ne suffit pas pour le RAG.

Au programme de ce module

  1. 01Contexte15 min
  2. 02Explication35 min
  3. 03Démonstration30 min
  4. 04Use Case25 min
  5. 05Case Study25 min
  6. 06Exercice35 min
  7. 07Quiz5 min

Une recherche par mots-clés exige que la question contienne les mêmes mots que le document. Or un utilisateur écrit « comment annuler ma commande » alors que le document parle de « procédure de rétractation ». Pour relier le sens et non les mots, le RAG s’appuie sur les embeddings (représentations vectorielles du sens).

Cet écart de vocabulaire (vocabulary mismatch) est la première cause d’échec des recherches internes : l’auteur du document écrit dans le jargon de son métier, l’utilisateur formule avec ses propres mots. Aucune des deux parties n’a tort — c’est l’outil de recherche qui doit absorber l’écart.

Objectifs d'apprentissage

À l’issue de ce module, vous saurez *Comprendre* l’intuition d’un espace vectoriel sémantique, *Appliquer* la similarité cosinus pour retrouver des passages proches, *Créer* une visualisation d’embeddings dans un notebook (carnet de calcul interactif), et *Évaluer* l’écart de vocabulaire entre questions utilisateurs et titres de documents.