Hellowork
Amphi 3 - SESSION 2.3 - 07/02/2018 11h20 > 11h50


Des LLMs pour accélérer la création de datasets



Aujourd'hui les LLMs peuvent résoudre à peu près n'importe quelle tâche NLP et sont faciles d'accès. Mais un modèle plus simple reste souvent une très bonne option (pour des raisons de coût, temps de calcul, gouvernance de la donnée, etc.). Cependant, pour que ces modèles rivalisent avec leurs larges cousins, il est nécessaire d’avoir une grande quantité de données annotées pour l’entraînement. Et c’est là que ça se corse : comment obtenir de telles données ?

Nous présenterons comment utiliser des LLMs pour générer ces datasets (sélection des données, annotation automatique, génération synthétique, ...). Quel modèle pour quelle tâche ? Est-ce la solution miracle ou bien doit-on quand même travailler un peu ? Quel est le gain de temps réel ?"


Revoir le live :



Justine Bel-Letoile
Head of Data Science


S'inscrire !
Nos sponsors

Les stands partenaires

{\rtf1}