Les Large Language Models appliquÃ©s en biologie mÃ©dicale : Ã©valuation des dÃ©cisions pour des cas d'urgences vitales et respect RGPD CNIL

Dans le cadre du dÃ©ploiement de l'IA GÃ©nÃ©rative au sein du Groupe Inovie et pour des applications d'aides au diagnostic mÃ©dical et aide Ã l'interprÃ©tation. Nous avons dÃ©veloppÃ© un Benchmark privÃ© pour Ã©valuer la performance des IA gÃ©nÃ©ratives Large Language Models Locales (LLM Locales). 5 mÃ©decins ont developpÃ© 50 questions : 25 en Cardiologie, 25 en NÃ©phrologie avec des questions d'urgences vitales. RÃ©ponses Ã©valuÃ©es par 2 mÃ©decins spÃ©cialistes en biologie mÃ©dicale.

L'IA LLM LLAMA de Meta fait 0% d'erreur grave vitale en NÃ©phrologie. Cependant elle rÃ©alise 63% d'erreurs graves vitales en Cardiologie.

QWEN d'Alibaba rÃ©alise le moins d'erreurs vitale en Cardiologie : 18.18% d'erreurs suivi de Copilot ChatGPT (36.36% d'erreurs).

En vue de dÃ©ploiement d'une IA d'aide au diagnostic pour le groupe Inovie, il devient urgent d'utiliser des LLMs locaux et d'Ã©tablir des benchmarks privÃ©s pour mesurer rÃ©ellement le taux d'erreurs des LLMs sur des cas de "vie rÃ©elle".

Revoir le live :

Yohann Missiak

Docteur en MÃ©decine en Biologie MÃ©dicale

https://www.inovie.fr/

S'inscrire !

Ticket

Nos sponsors

Les stands partenaires

{\rtf1}