BNP Paribas
Amphi 3 - SESSION 2.3 - 07/02/2018 15:00 > 15:30


Mise en production de modèles Machine Learning avec PMML dans le secteur bancaire



1.Introduction

Au sein de notre équipe, nous testons les différentes approches Machine Learning pour développer des modèles de risque de crédit ou de détection de fraude. Un vrai challenge pour nous consiste à pouvoir les mettre en production dans les différents environnements de production qui varient entre les filiales et pays. Pour résoudre ce problème, nous nous sommes tournés vers PMML (Predictive Model Markup Language), un format basé sur XML qui permet exporter les modèles Machine Learning entrainés puis de les éutiliser dans différents environnements autres que celui d'entrainement.

2.Méthodologie

- Machine Learning: méthodes ensemblistes comme Random forest ou Gradient boosting. - Transformation des modèles Machine Learning en PMML en utilisant le package sklearn2pmml de Python. - Utilisation d'un fichier PMML avec Python, Spark ou autre.

3.Originalité / perspective

PMML permet d'automatiser plusieurs étapes et optimiser le processus de mise en production des modèles de score. En perspective, nous envisageons d'intégrer la partie « Feature engineering » dans le pipeline complet de PMML et tester d'autres types de modèles Machine Learning.


Télécharger les slides

Revoir le live :



Angelina Pidash
Data Scientist


S'inscrire !
Nos sponsors

Les stands partenaires

{\rtf1}