Limite de débit (rate limit)
Définition : Une limite de débit plafonne le nombre de requêtes ou de tokens qu'un client peut envoyer à une API d'IA sur une période donnée.
Elle protège le service de la surcharge et répartit la capacité entre les utilisateurs. Quand elle est atteinte, l'API renvoie une erreur dédiée ; les applications la gèrent par des relances espacées et des files d'attente.