En directEN

Streaming (réponse en flux)

Définition : Le streaming renvoie la réponse d'un modèle token par token au fur et à mesure de sa génération, au lieu d'attendre la réponse complète.

L'utilisateur voit le texte apparaître progressivement, ce qui améliore la latence perçue. Techniquement, le flux est souvent transmis via des événements envoyés par le serveur.

Voir aussi

← Tout le glossaire IA · Actualité de l'IA