Fondamentaux des modèles Claude

20% de l'examen

Familles de modèles, fenêtres de contexte, compromis coût/latence/qualité et choix du bon modèle.

La famille Claude

  • Trois gammes : Opus (la plus capable, raisonnement complexe), Sonnet (équilibre coût/performance), Haiku (rapide et économique).
  • Choisir selon la tâche : Haiku pour la classification/extraction à haut volume, Sonnet pour la plupart des usages agentiques, Opus pour le raisonnement difficile et le code complexe.
  • Réflexe d'architecte : commencer petit (Haiku/Sonnet) et n'escalader vers Opus que si la qualité l'exige.

Fenêtre de contexte & tokens

  • Grande fenêtre de contexte (jusqu'à 200K tokens, plus sur certaines versions) — entrée + sortie partagent ce budget.
  • Plus de contexte ≠ meilleure réponse : le bruit dégrade la qualité. Ne mettre que le pertinent.
  • 1 token ≈ ~4 caractères ; on facture les tokens d'entrée ET de sortie (la sortie est plus chère).

Compromis d'architecte

  • Coût, latence et qualité forment un triangle : on optimise selon le cas d'usage.
  • Leviers : choix du modèle, taille du contexte, prompt caching, Batch API (asynchrone, moins cher), streaming (latence perçue).

S'entraîner — 10 questions

0/10 répondue
  1. 1. Une application doit classifier 2 millions de tickets/jour avec une logique simple. Quel modèle privilégier par défaut ?
  2. 2. Un collègue veut « tout mettre » dans 200K tokens de contexte pour maximiser la qualité. Meilleure réponse ?
  3. 3. Quel mécanisme réduit le plus le coût d'un traitement par lots non urgent de millions de requêtes ?
  4. 4. Pourquoi la sortie coûte-t-elle généralement plus cher que l'entrée ?
  5. 5. Une tâche de raisonnement multi-étapes sur du code complexe échoue avec Haiku. Quelle escalade ?
  6. 6. Une tâche nécessite l'analyse d'images (captures d'écran). Quelle capacité de Claude utiliser ?
  7. 7. Pour un budget serré tout en gardant une bonne qualité sur des tâches variées, quel modèle est le meilleur point de départ ?
  8. 8. Le streaming change-t-il le coût d'une requête ?
  9. 9. Sur un très long document, où placer la question pour de meilleurs résultats ?
  10. 10. Quelle estimation de tokens est raisonnable pour budgéter en anglais ?

← Retour à l'Academy · Examen blanc →