Aller au contenu principal

L’X et la Cnam s’unissent pour étudier les données de santé

Les données sont le nouvel or noir et, en la matière, le domaine de la santé n’échappe pas à la règle. Selon Nicolas Garcelon, responsable de la plateforme Data Science de l'institut Imagine à Paris cité par le magazine Sciences et Avenir dans son numéro de mars, un hôpital produirait à lui seul 10 gigaoctects de données par an, soit 20 000 fois le roman de Stendhal Le Rouge et le Noir. Pourtant, ces données sont encore trop souvent sous-exploitées.

 

Traiter scientifiquement les données de santé

Créé à la fin de l’année 2014 et renouvelé en février 2018 pour une période de trois ans, le partenariat entre l’École polytechnique et la Caisse nationale de l’Assurance maladie a pour objectif de développer différents types d’algorithmes de traitement des données afin, notamment, d’automatiser la détection de médicaments aux effets secondaires nocifs, voire graves et de permettre ainsi aux autorités sanitaires d’asseoir leurs décisions sur des faits scientifiquement prouvés.

Au cours des trois premières années de travaux, Emmanuel Bacry, responsable de l’initiative Data science à l’École polytechnique et directeur de recherche CNRS à l’Université Paris-Dauphine (CEREMADE), et l'équipe du Centre de mathématiques appliquées de l’X ont réussi à prouver l’efficacité de leur approche visant à détecter les signaux faibles dans l’immense volume de données du Sniiram, le système national d’information inter régimes de l’Assurance maladie. Les algorithmes d’apprentissage automatique développés par les chercheurs ont en effet retrouvé l'association connue et prouvée par les méthodes classiques entre prise de pioglitazone et le déclenchement d’un cancer de la vessie chez les patients souffrant de diabète.

 

Détecter les effets secondaires potentiels de médicaments

L’objectif du renouvellement du partenariat est d’approfondir les recherches dans le domaine de la surveillance des produits de santé et de développer des algorithmes sur différents types de données. Le projet de pharmaco-épidémiologie mené dans le cadre du renouvellement de ce partenariat sera ainsi centré sur la recherche et la validation de nouveaux signaux de sécurité pour détecter les effets secondaires potentiels de médicaments. L'étude de l'association entre la prise de rosiglitazone et l’apparition d'une insuffisance cardiaque ou d'un infarctus du myocarde est ainsi en cours.

Un second projet en cours de développement porte sur la prise médicamenteuse et la survenue de fractures chez les personnes âgées de plus de 65 ans. Ce projet cherchera à mettre en évidence à partir des données les sur-risques de fracture liés à la prise de médicaments identifiés comme facteur de risque de chute, tels que les anxiolytiques, les sédatifs et hypnotiques, les antidépresseurs ou les antipsychotiques.

 

Analyser les parcours de soins de patients

Au-delà des effets secondaires des médicaments, plusieurs approches orienteront les recherches afin d’analyser, d’identifier et de qualifier dans la masse de données différentes typologies de parcours de soins. Les chercheurs travailleront par exemple à estimer la fréquence des recours au système de santé ou décrire des pratiques cliniques et leur adéquation aux recommandations médicales. Pour ce faire, les équipes développeront des outils de visualisation et de clustering adaptés aux données volumineuses.

 

Identifier les mésusages et les fraudes

L'identification de situations de mésusage, voire de fraude, est indispensable à l'Assurance maladie pour éviter les gaspillages et assurer l’utilisation légitime de ses ressources. Ce projet vise à mettre en place des procédures automatisées permettant de balayer en continu la base de données du Sniiram pour identifier les situations suspectes. Avec cette nouvelle méthode employant le big data, l’innovation réside dans le fait de croiser les données en recherchant des cas de fraudes sans a priori initial sur les types de médicaments, la base étant analysée dans son intégralité. Cet outil constitue un complément précieux, car économe en moyens, à la réalisation par la CNAM de travaux spécifiques destinés à documenter ces éventuels mésusages et ces fraudes.

Pour Emmanuel Bacry, « l’intérêt de ce projet de recherche est de déployer, grâce à l’analyse de données massives, de nouvelles pistes permettant de répondre aux enjeux majeurs de santé publique. À terme, un de nos objectifs est par exemple de passer d’analyses ciblées et de tests individuels de médicaments à une détection automatique, simultanée et globale d’interactions nocives pour les patients ».