Jailbreak (contournement de garde-fous)
Définition : Un jailbreak est une manipulation du prompt visant à faire produire à un modèle un contenu que ses règles de sécurité devraient refuser.
Il exploite des formulations détournées, des jeux de rôle ou des instructions contradictoires. Les fournisseurs renforcent en continu leurs défenses contre ces techniques.