Qu'est-ce que Sûreté de l'IA (AI safety) ?

Question

Accepted Answer

La sûreté de l'IA est le champ qui vise à rendre les systèmes d'IA fiables, contrôlables et bénéfiques, en limitant leurs risques et leurs usages néfastes. Elle couvre l'alignement, l'évaluation des risques, la robustesse et la gouvernance. Anthropic en a fait sa mission centrale, avec une approche fondée sur la recherche.

Sûreté de l'IA (AI safety)

Voir aussi