Transformer (architecture)
Définition : Le Transformer est l'architecture de réseau de neurones qui sous-tend les LLM modernes, fondée sur le mécanisme d'« attention ».
Introduit en 2017, il permet de traiter de longues séquences en pondérant l'importance de chaque élément. C'est le « T » de GPT.