En directEN

Mise en cache du contexte (prompt caching)

Définition : La mise en cache du contexte réutilise une portion de prompt déjà traitée (instructions, documents) au lieu de la recalculer à chaque appel, ce qui réduit la latence et le coût.

Utile quand un même contexte volumineux revient sur plusieurs requêtes, comme un long document ou un prompt système stable. Le contenu mis en cache a une durée de vie limitée.

Voir aussi

← Tout le glossaire IA · Actualité de l'IA