Scalian

Elagage de neurones pour amÃ©lioration de l'apprentissage par transfert de rÃ©seaux convolutifs

Résumé

1. Introduction

Les rÃ©seaux de neurones convolutifs (CNN) sont de plus en plus utilisÃ©s pour des tÃ¢ches de computer vision dans une multitude d'applications industrielles. NÃ©anmoins, les difficultÃ©s liÃ©es Ã l'entrainement de ces modÃ¨les sont toujours nombreuses. Notamment, le besoin d'un gros nombre de donnÃ©es d'entrainement est souvent un point de blocage, qui en limite le dÃ©veloppement et l'utilisation dans des applications industrielles. Le transfer learning, et en particulier l'apprentissage par transfert du rÃ©seau, permet d'adapter des modÃ¨les de grosse taille Ã l'Ã©tat de l'art, prÃ©-entrainÃ©s sur une tÃ¢che avec beaucoup de donnÃ©es disponibles, Ã des nouvelles taches sur lesquelles la quantitÃ© de donnÃ©es disponibles est trop limitÃ©e pour permettre la crÃ©ation d'un modÃ¨le Â« from-scratch Â». Le rÃ©seau adaptÃ© Ã la nouvelle tÃ¢che, souvent moins complexe de la tÃ¢che source, n'a plus nÃ©cessairement besoin de toute sa capacitÃ© (tous ses neurones/filtres), et les paramÃ¨tres en excÃ¨s peuvent rendre plus probable l'overfitting lors du fine-tuning. Une possibilitÃ© pour rÃ©duire ce phÃ©nomÃ¨ne est d'utiliser des techniques de Â« pruning Â» (Ã©lagage) du rÃ©seau. En effet, le pruning (structurÃ©) consiste en la suppression des neurones redondants, c'est-Ã -dire qui ont une relevance faible aux performances sur la tÃ¢che cible.

2. MÃ©thodologie

Nous avons comparÃ© l'efficacitÃ© du pruning ainsi que de plusieurs mÃ©thodes de sÃ©lection des filtres Ã Ã©laguer appliquÃ©s dans le contexte d'apprentissage par transfert sur une tÃ¢che cible de test. Certaines mÃ©thodes ont Ã©tÃ© prises directement de l'Ã©tat de l'art, tandis que sur d'autres des Ã©tudes ont Ã©tÃ© rÃ©alisÃ©s afin de les rendre utilisables sur des CNNs.

3. OriginalitÃ© / perspective

Les mÃ©thodes d'Ã©lagage sur lesquelles nous avons effectuÃ© un travail de dÃ©veloppement se basent sur des principes de thÃ©orie de l'information et d'interprÃ©tabilitÃ© des fonctionnalitÃ©s des CNN, et donc leur utilisation peut donner, en plus que l'amÃ©lioration des performances du modÃ¨le, des possibilitÃ©s d'explication et d'interprÃ©tation du fonctionnement du modÃ¨le et de l'opÃ©ration mÃªme d'Ã©lagage.

Télécharger le résume PDF

Revoir le live :

A propos - Scalian

Le groupe Scalian s'est imposÃ© depuis plus de 30 ans comme une importante ETI franÃ§aise dans l'ingÃ©nierie. Partenaire clÃ© de grands industriels, elle participe aux programmes majeurs dans les secteurs de l'aÃ©rospatial, l'Ã©nergie, du transport et de la dÃ©fense.
Scalian, spÃ©cialiste des systÃ¨mes numÃ©riques, de la qualitÃ© et du management de la performance des opÃ©rations industrielles, est Ã©galement reconnu pour son savoir-faire dans le dÃ©veloppement de produits & solutions innovants.

www.scalian.com/accueil/

A propos de l'orateur

Andrea Cortesi

Responsable scientifique de projet

www.scalian.com/accueil/

S'inscrire !

Ticket

Nos sponsors

En savoir plus sur les sponsors