“Exploiter les données de santé est une opportunité majeure sous condition d’un encadrement éthique rigoureux” (Rapport Fidelia Cascini)

Publié le vendredi 02 mai 2025 à 17h39

Data IA

Réutiliser les données de santé électroniques pour la recherche, la surveillance épidémiologique ou le développement de nouvelles thérapies : tel est l’enjeu central décrit dans le rapport "Secondary Use of Electronic Health Data" de Fidelia Cascini. Dans ce document, elle dresse une analyse des catégories de données de santé exploitables, des usages secondaires et des défis à relever.

Une cartographie précise des sources de données mobilisables

Ce rapport propose une analyse approfondie des différentes catégories de données électroniques susceptibles d’être mobilisées pour des usages secondaires en santé. Les principales ressources identifiées incluent les données du monde réel (Real World Data, RWD), issues notamment des dossiers médicaux électroniques, des registres de maladies ou encore des bases d’assurance maladie. À ces éléments s’ajoutent les bases administratives, telles que celles liées à la facturation hospitalière et aux actes médicaux, qui permettent d’obtenir des informations précieuses sur les parcours de soins et les pratiques médicales.

Le périmètre des sources potentielles intègre également les données issues des essais cliniques, des biobanques et de la génomique, ouvrant la voie à des approches plus personnalisées de la recherche biomédicale. Enfin, les données produites directement par les patients, notamment via les dispositifs connectés et applications de suivi santé, ainsi que les registres nationaux spécialisés (par exemple dans le cancer ou le diabète), complètent cette cartographie dense.

Cette diversité de sources constitue une opportunité sans précédent pour approfondir la connaissance des maladies, améliorer la qualité des soins et accélérer la transition vers une médecine plus individualisée.

De multiples usages en santé publique, mais des défis persistants :

Le rapport de Fidelia Cascini met aussi en évidence l’impact majeur que peut avoir la réutilisation secondaire des données de santé dans plusieurs domaines prioritaires. Les usages en santé publique sont variés : amélioration de la surveillance épidémiologique, évaluation de l’impact des politiques de santé, accélération de la recherche clinique notamment en la rendant plus inclusive, ou encore développement d’outils d’intelligence artificielle au service du diagnostic et du traitement.

Toutefois, cette perspective est tempérée par l’existence d’obstacles importants. La qualité des données reste très hétérogène selon les sources, certaines bases étant marquées par des lacunes, des biais ou des erreurs de codage. À cela s’ajoute une interopérabilité encore insuffisante entre bases de données hétérogènes, ce qui freine les projets transversaux et multiplie les coûts de mise en qualité des informations. Malgré les procédés d’anonymisation, le risque de ré-identification des individus demeure un point d’alerte important. Enfin, la gouvernance complexe de l’accès aux données constitue une autre barrière, ralentissant de nombreux projets de recherche.

La nécessité d’un encadrement éthique renforcé

Au-delà des défis techniques, le rapport insiste avec force sur l’importance d’un encadrement éthique rigoureux de l’utilisation secondaire des données de santé. La protection de la vie privée doit rester au cœur des dispositifs, tout comme l’exigence de transparence sur les usages réalisés avec ces données.

Le consentement des patients émerge comme une dimension critique. Il doit être éclairé, renouvelable et réversible à tout moment, avec des modèles adaptables tels que le “broad consent” ou le “dynamic consent”. Toutefois, le rapport souligne que ces pratiques restent encore très inégalement appliquées entre les différents États membres de l’Union européenne et dans le monde, ce qui complique la création de cadres harmonisés.

Une vigilance particulière est également requise pour prévenir l’introduction de biais dans les algorithmes issus de l’entraînement sur ces bases de données. Sans contrôle rigoureux, de tels biais pourraient reproduire ou aggraver des inégalités existantes en matière d’accès aux soins ou de résultats cliniques.

Des données de santé multiples, indispensables pour entraîner l’IA

Le rapport met en évidence l’étendue des sources de données électroniques pouvant être mobilisées pour la recherche en santé et l’entraînement des modèles d’intelligence artificielle. Dossiers médicaux électroniques, bases administratives, essais cliniques, biobanques et données issues d’objets connectés offrent une richesse inédite pour développer des IA capables d’améliorer le diagnostic, la prévention et le traitement personnalisé. Cette diversité est une condition clé pour entraîner des modèles robustes, capables de refléter la complexité réelle des patients et de leurs parcours de soins.

Des perspectives immenses, mais des verrous à lever pour l’IA en santé :

L’exploitation secondaire de ces données est un levier majeur pour l’essor de l’IA appliquée à la santé publique, à la médecine personnalisée et à la recherche clinique. Néanmoins, des défis techniques majeurs subsistent : données hétérogènes, lacunaires ou biaisées, interopérabilité limitée entre bases et risques de ré-identification menacent la qualité et la sécurité des modèles IA développés. L’accès complexe aux bases freine également l’émergence de nouveaux usages algorithmiques à grande échelle.

Gouverner l’exploitation des données pour garantir une IA éthique :

La nécessité d’un encadrement éthique strict est rappelée avec force. Sans un contrôle exigeant sur la qualité des données, sans transparence sur les usages, et sans respect effectif du consentement des patients, les projets d’IA en santé risquent de perdre la confiance du public. Le rapport souligne que les biais présents dans les bases, s’ils sont ignorés, pourraient être amplifiés par les algorithmes, générant des risques graves en termes d’équité d’accès aux soins et de fiabilité clinique.

FermerPlease login

No account yet? Register

membres-icon

Derniers membres

Sandrine inscrit il y a 3 mois et 3 semaines
Celine inscrit il y a 7 mois et 1 semaine
Anne MAHEUST inscrit il y a 7 mois et 1 semaine
Guillaume inscrit il y a 8 mois et 1 semaine
Nabil inscrit il y a 10 mois et 3 semaines
Mayssa inscrit il y a 1 an et 1 mois
Pierre inscrit il y a 1 an et 1 mois
Qiaoli Vrinat inscrit il y a 1 an et 1 mois
events-icon

Événements

Dernier événement en vidéo

Retrouvez les meilleurs moment du RDV 2023 des datatransformeurs.