Introduction
Malgré la multiplicité des travaux de recherche ayant abordé la problématique de l'utilisation de l'IA comme outils de détection et de lutte contre le blanchiment d'argent, à ce jour, la littérature comporte deux trous (gaps) ou aspects restant à couvrir.
L'aspect évaluation de la performance de l'IA
Dans la littérature, les études qui ont évaluées la performance de l'IA dans la détection des transactions correspondant à du blanchiment d'argent sont loin d'être exhaustives. En effet, ces études considèrent seulement un nombre restreint d'algorithmes souvent choisis arbitrairement. Par ailleurs, les conditions expérimentales diffèrent généralement d'une étude à une autre rendant difficile la comparaison des résultats.
Afin d'évaluer le potentiel de l'IA dans la LCB-FT, des études comparatives exhaustives qui considèrent l'ensemble des algorithmes et des conditions expérimentales homogènes manquent dans la littérature. De telles études permettraient d'identifier les forces et les faiblesses de chaque algorithme ou catégories d'algorithmes.
L'aspect explication des prédictions de l'IA
Une IA est dite explicable lorsque l'être humain est capable de comprendre les éléments clés conduisant l'IA à fournir un résultat donné. Par exemple, pourquoi l'IA conclut qu'une transaction est suspecte et qu'une autre ne l'est pas. à notre connaissance, la problématique de l'interprétation de l'IA dans le cadre de la LCB-FT a été très peu abordée dans la littérature. Pourtant, l'interprétation de l'IA permettrait de faciliter le travail des analystes chargés d'examiner et documenter les alarmes et de réduire le délai de déclaration de soupçon, ce qui est essentiel pour que les banques restent conformes à la réglementation.
Méthodologie
Pour évaluer la performance des outils LCB-FT basés sur l'IA, nous avons réalisé une étude comparative sous forme de benchmark. Nous avons considéré plus d'une quinzaine de modèles proposés dans l'état de l'art. Dans le but d'obtenir des résultats généralisables, plusieurs jeux de données d'évaluation provenant de différentes sources (e.g., blockchain et données bancaires) ont été considérés.
Comme dans la majorité des données de fraude, le ratio entre le nombre de cas de fraude et le nombre d'opérations normales est très faible. Cela peut entraîner des biais lors de l'apprentissage alors le modèle aura plus tendance à prédire le segment (ou la classe) surreprésentée. Afin de résoudre ce problème, la méthode SMOTE est utilisée pour créer artificiellement des données appartenant à la classe sous-représentée grâce à une technique d'interpolation des données réelles.
Originalité / perspective
à notre connaissance, c'est la première étude qui compare la performance de plus d'une quinzaine de modèles d'IA utilisés pour la LCB-FT. Notre étude intègre également l'aspect d'explicabilité, très peu étudié dans la littérature, mais fondamental pour des raisons de conformité et de transparence. Notre étude a permis d'établir une cartographie des systèmes LCB-FT basés sur l'IA en fonction des critères de fiabilité, d'efficacité opérationnelle et d'explicabilité.
Références
[1] F. Dama (2023). L'utilisation de l'Intelligence Artificielle dans la Lutte Contre le Blanchiment d'Argent - Ãtat de l'art. ActuAI en ligne.
https://www.actuia.com/contribution/fatoumata-dama/lintelligence-artificielle-au-service-de-la-lutte-contre-le-blanchiment-dargent-etat-de-lart/
[2] Pavlidis (2023). Deploying artificial intelligence for anti-money laundering and asset recovery : the dawn of a new era
[3] Mohammed et al. (2022). Machine Learning Approach to Anti-Money Laundering. A Review
[4] Gerlings et al. (2023). Machine Learning in Transaction Monitoring - The Prospect of xAI