TTFT (temps jusqu'au premier token)
Définition : Le TTFT (time to first token) est le délai entre l'envoi d'une requête et l'apparition du tout premier token de la réponse.
C'est une mesure clé de la réactivité ressentie, surtout avec le streaming où l'utilisateur voit le texte arriver progressivement. Il dépend de la longueur du prompt, du modèle et de la charge du service.