LLM juge (LLM-as-a-judge)
Définition : Le LLM juge consiste à utiliser un modèle de langage pour noter ou comparer les réponses d'un autre modèle, selon des critères de qualité définis.
C'est une façon rapide et scalable d'évaluer des sorties difficiles à mesurer automatiquement. Elle reste imparfaite : le juge peut hériter de biais et doit être calibré, souvent par recoupement avec un jugement humain.