MMLU
Définition : MMLU (Massive Multitask Language Understanding) est un benchmark de questions à choix multiples couvrant de nombreux domaines académiques et professionnels.
Il mesure l'étendue des connaissances générales d'un modèle. Très utilisé historiquement, il sature à mesure que les modèles progressent, ce qui en limite le pouvoir discriminant.