Sûreté de l'IA (AI safety)
Définition : La sûreté de l'IA est le champ qui vise à rendre les systèmes d'IA fiables, contrôlables et bénéfiques, en limitant leurs risques et leurs usages néfastes.
Elle couvre l'alignement, l'évaluation des risques, la robustesse et la gouvernance. Anthropic en a fait sa mission centrale, avec une approche fondée sur la recherche.