Fondamentaux des modèles Claude

20% de l'examen

Familles de modèles, fenêtres de contexte, compromis coût/latence/qualité et choix du bon modèle.

La famille Claude

Trois gammes : Opus (la plus capable, raisonnement complexe), Sonnet (équilibre coût/performance), Haiku (rapide et économique).
Choisir selon la tâche : Haiku pour la classification/extraction à haut volume, Sonnet pour la plupart des usages agentiques, Opus pour le raisonnement difficile et le code complexe.
Réflexe d'architecte : commencer petit (Haiku/Sonnet) et n'escalader vers Opus que si la qualité l'exige.

Grande fenêtre de contexte (jusqu'à 200K tokens, plus sur certaines versions) — entrée + sortie partagent ce budget.
Plus de contexte ≠ meilleure réponse : le bruit dégrade la qualité. Ne mettre que le pertinent.
1 token ≈ ~4 caractères ; on facture les tokens d'entrée ET de sortie (la sortie est plus chère).

Coût, latence et qualité forment un triangle : on optimise selon le cas d'usage.
Leviers : choix du modèle, taille du contexte, prompt caching, Batch API (asynchrone, moins cher), streaming (latence perçue).

0/10 répondue

1. Une application doit classifier 2 millions de tickets/jour avec une logique simple. Quel modèle privilégier par défaut ?
2. Un collègue veut « tout mettre » dans 200K tokens de contexte pour maximiser la qualité. Meilleure réponse ?
3. Quel mécanisme réduit le plus le coût d'un traitement par lots non urgent de millions de requêtes ?
4. Pourquoi la sortie coûte-t-elle généralement plus cher que l'entrée ?
5. Une tâche de raisonnement multi-étapes sur du code complexe échoue avec Haiku. Quelle escalade ?
6. Une tâche nécessite l'analyse d'images (captures d'écran). Quelle capacité de Claude utiliser ?
7. Pour un budget serré tout en gardant une bonne qualité sur des tâches variées, quel modèle est le meilleur point de départ ?
8. Le streaming change-t-il le coût d'une requête ?
9. Sur un très long document, où placer la question pour de meilleurs résultats ?
10. Quelle estimation de tokens est raisonnable pour budgéter en anglais ?