Calcul au moment de l'inférence (test-time compute)
Définition : Le calcul au moment de l'inférence désigne la puissance de calcul dépensée pendant la génération d'une réponse, et non pendant l'entraînement.
En laissant un modèle réfléchir plus longtemps ou explorer plusieurs pistes, on améliore la qualité sans le ré-entraîner. C'est le principe des modèles de raisonnement.