Le domaine du NLU a vu des avancées significatives avec le développement de
larges modèles de langue (BERT, GPT, ...). Néanmoins adapter ces modèles à des tâches
spécifiques requiert souvent un nombre suffisant de données labellisées. Dans cette présentation, nous étudierons un ensemble de techniques pour le zero ou few-shot learning sur des problématiques de NLU dans le cadre de la langue française.
Le CATIE (Centre Aquitain des Technologies de l'Information et Electroniques), organisme à but non lucratif créé en 2014, est un centre de transfert technologique spécialisé dans les technologies numériques. Sa principale mission est de soutenir les PME et les ETI de la région Nouvelle-Aquitaine dans leur transformation numérique et de les aider à adopter et à intégrer les technologies inhérentes.
Diplômé en 2014 d’un doctorat en mathématiques, Boris Albar est data scientist au CATIE
depuis 2017. Il s’intéresse plus spécifiquement aux techniques de machine learning dans les
domaines du NLU, de la vision par ordinateur, et de l’analyse de séries temporelles.