Fondamentaux des modèles Claude
20% de l'examenFamilles de modèles, fenêtres de contexte, compromis coût/latence/qualité et choix du bon modèle.
La famille Claude
- Trois gammes : Opus (la plus capable, raisonnement complexe), Sonnet (équilibre coût/performance), Haiku (rapide et économique).
- Choisir selon la tâche : Haiku pour la classification/extraction à haut volume, Sonnet pour la plupart des usages agentiques, Opus pour le raisonnement difficile et le code complexe.
- Réflexe d'architecte : commencer petit (Haiku/Sonnet) et n'escalader vers Opus que si la qualité l'exige.
Fenêtre de contexte & tokens
- Grande fenêtre de contexte (jusqu'à 200K tokens, plus sur certaines versions) — entrée + sortie partagent ce budget.
- Plus de contexte ≠ meilleure réponse : le bruit dégrade la qualité. Ne mettre que le pertinent.
- 1 token ≈ ~4 caractères ; on facture les tokens d'entrée ET de sortie (la sortie est plus chère).
Compromis d'architecte
- Coût, latence et qualité forment un triangle : on optimise selon le cas d'usage.
- Leviers : choix du modèle, taille du contexte, prompt caching, Batch API (asynchrone, moins cher), streaming (latence perçue).
S'entraîner — 10 questions
- 1. Une application doit classifier 2 millions de tickets/jour avec une logique simple. Quel modèle privilégier par défaut ?
- 2. Un collègue veut « tout mettre » dans 200K tokens de contexte pour maximiser la qualité. Meilleure réponse ?
- 3. Quel mécanisme réduit le plus le coût d'un traitement par lots non urgent de millions de requêtes ?
- 4. Pourquoi la sortie coûte-t-elle généralement plus cher que l'entrée ?
- 5. Une tâche de raisonnement multi-étapes sur du code complexe échoue avec Haiku. Quelle escalade ?
- 6. Une tâche nécessite l'analyse d'images (captures d'écran). Quelle capacité de Claude utiliser ?
- 7. Pour un budget serré tout en gardant une bonne qualité sur des tâches variées, quel modèle est le meilleur point de départ ?
- 8. Le streaming change-t-il le coût d'une requête ?
- 9. Sur un très long document, où placer la question pour de meilleurs résultats ?
- 10. Quelle estimation de tokens est raisonnable pour budgéter en anglais ?