Amphi 2 - SESSION 3.2 - 07/02/2018 15h50 > 16h20
Le FAT5 (Flash Attention T5) : comment pré-entraîner de manière efficiente un modèle de langage
Présentation du FAT5 et des techniques dâoptimisation de pré-entraînement des modèles de langage.