Inférence
Définition : L'inférence est l'étape où un modèle déjà entraîné produit une réponse à partir d'une entrée — l'« exécution » du modèle, par opposition à l'entraînement.
C'est ce que vous payez à l'usage via une API. Son coût et sa vitesse dépendent du modèle et du matériel.