Inférence

Définition : L'inférence est l'étape où un modèle déjà entraîné produit une réponse à partir d'une entrée — l'« exécution » du modèle, par opposition à l'entraînement.

C'est ce que vous payez à l'usage via une API. Son coût et sa vitesse dépendent du modèle et du matériel.

Voir aussi

← Tout le glossaire IA · Actualité de l'IA