Transformer (architecture)

Définition : Le Transformer est l'architecture de réseau de neurones qui sous-tend les LLM modernes, fondée sur le mécanisme d'« attention ».

Introduit en 2017, il permet de traiter de longues séquences en pondérant l'importance de chaque élément. C'est le « T » de GPT.

Voir aussi

← Tout le glossaire IA · Actualité de l'IA