CHU Bordeaux



DATAQUITAINE 2021 - SESSION 1.1 - Amphi 1 - 25/02/2021 11:00 > 11:30

Appariement entre données hospitalières et certificats de décès en combinant moteur de recherche et apprentissage automatique

CHU Bordeaux

Résumé

Introduction

Le statut vital est d'une importance capitale pour la recherche clinique hospitalière. Cependant, les systèmes d'information des hôpitaux n'enregistrent que les informations sur les décès à l'hôpital. Récemment, le gouvernement français a publié en open data les données des certificats de décès de plus de 25 millions de personnes depuis 1970. L'objectif de cette étude était de relier les certificats de décès français aux données hospitalières du CHU de Bordeaux pour compléter le statut vital.

Méthodologie

Notre stratégie était composée d'un moteur de recherche pour réduire le nombre de comparaisons entre les données hospitalières et les certificats de décès, et d'algorithmes d'apprentissage pour prédire la probabilité d'appariement de chaque paire. Deux seuils supérieur et inférieur ont été définis pour classer chaque paire en tant que non-lien, statut indéterminé ou lien. Le processus global a été évalué en créant un fichier contenant 3 565 décès à l'hôpital et 15 000 personnes vivantes.

Originalité / perspective

Le rappel et la précision de notre stratégie étaient respectivement de 97,5% et 99,97% pour le seuil supérieur et de 99,4% et 98,9% pour le seuil inférieur. Comparée à une approche déterministe basée sur une concordance exacte sur le nom, le prénom, la date de naissance et le sexe, l'approche proposée a amélioré le rappel d'au moins 6,2% sans diminuer la précision. Cette approche n'est pas spécifique aux données de santé et pourrait intéresser d'autres acteurs qui souhaitent lier des données nominatives à des certificats de décès pour identifier dans leur base les patients décédés.


Télécharger le résume PDF

Revoir le live :



A propos - CHU Bordeaux

CHU Bordeaux
L'unité IAM du CHU de Bordeaux met en place, en lien étroit avec la direction des systèmes d'information, un entrepôt de données de santé à des fins de recherche, d'amélioration de la pertinente et de la qualité des soins. Cette unité conçoit et implémente une architecture basée sur des technologies open-source à l'état de l'art dans le domaine de la santé avec des équipes de recherche universitaires INSERM U1219.

www.chu-bordeaux.fr



A propos de l'orateur



Sébastien Cossin
Docteur


CHU Bordeaux"



S'inscrire !
Nos sponsors

               

               

               
{\rtf1}