Bénéfices et risques de l'utilisation des données de santé à des fins de recherche - Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2023

Benefits and Risks of Using Health Data for Research

Bénéfices et risques de l'utilisation des données de santé à des fins de recherche

Résumé

As the digitalisation of the healthcare system becomes a reality in developed countries, the availability of large volumes of health data is raising stakeholders' expectations, sometimes excessively, and concerns, sometimes groundlessly. A review of the benefits that can legitimately be expected from exploiting the available data is proposed, while considering the adverse effects that have already been documented or can legitimately be anticipated, before determining where the benefit/risk balance stands. While the current criteria place the emphasis on the absolute protection of privacy, which hinders or delays many highly relevant studies, we propose that the benefit/risk balance should henceforth form the basis for decisions to authorise the use of health data for research purposes. Many benefits are expected from providing access to this data : (1) Facilitating the epidemiological surveillance of major diseases, upon which many public health decisions are based. (2) Enabling the measurement of healthcare efficacy and the detection of local or regional situations that deviate significantly from the mean. (3) Facilitating the monitoring of changes in practices over time and their impact. (4) Helping to document the positive and negative effects of innovations introduced as a result of changes in practices, be they medicinal, technical or organisational. (5) Providing information about patients' access to healthcare services, allowing rates and delays to be calculated and cross-referenced with geographical variables and socio-economic data in order to identify inequalities, effective and ineffective strategies, and determine which areas should be prioritised for improvement. (6) Contributing directly to improving knowledge – an essential step towards improving practices and designing effective and protective public policies. (7) Playing an essential role in developing the uses of artificial intelligence, based on new, high-quality algorithms which can be trained and tested on representative populations, which is not always the case at present. (8) Enabling the assessment of the effectiveness of prevention or screening campaigns, and of the extent to which best practice recommendations are followed. However, the use of such data by multiple stakeholders is not without risks. (1) The risk of revealing personal data is a major risk for personal data, but very minor for pseudonymised data and non-existent for anonymised data. (2) The risk of uncontrolled use, beyond the need to inform people, depends on operators complying with the rules for use, and is very closely monitored; (3) The risk of data theft and espionage by industrial operators or governments is often mentioned by opponents, but it is extremely low because non-identifying data has no commercial value, and this type of theft has never occurred. (4) The risk of infringement of intellectual property rights and of financial loss is often mentioned as an argument against the valorisation of this data but has not been documented; (5) Healthcare professionals are concerned about the risk of normative surveillance, although such surveillance is legitimate from the perspective of healthcare system funders, and tensions can be eased through dialogue. The potential risks to individuals and the community are minimal if the protective measures adopted are effectively implemented and none of the risks are liable to have a significant impact (on health), either individually or collectively. However, the use of such data can have substantial benefits for society (e.g. appropriateness of care, prevention of health scandals, evaluation of innovations) and for the individual (such as the development of new treatments), and may also have an impact on individuals themselves. The benefit/risk balance therefore leans strongly towards the benefits. This leaves the question of how to remove obstacles to the provision of access to data collections and promote a culture of the common good represented by health data throughout all levels of society. These obstacles are numerous and include: (1) a ban on the use of US data-storage tools in the absence of a European cloud, even though there have never been any complaints in the healthcare sector against US manufacturers for failing to comply with the GDPR in the healthcare field, nor any documented attempts to re-identify anonymised health research data; (2) a ban on using the social security numbers recorded in the French National Social Security Register to match databases that need to be cross-referenced, despite this practice being possible in many European countries that are subject to the same European regulations as France; (3) waiting times running into years for access to the main French National Health Data System (Système National des Données de Santé – SNDS) database, whereas this queue could be reduced if a copy of the main SNDS database were included in the HDH catalogue; (4) an ecosystem that is overly complex for historical reasons, and which needs to be simplified in order to move towards a Single Gateway, as recommended in the European directive in preparation; (5) public communications focusing solely on the risks and not presenting the benefits, despite well-informed citizens being in favour of the use of their data for research. This is likely to have a major impact on the feasibility of many studies. Auditing the barriers to research within the current system could help to convince the doubters.
La disponibilité de nombreuses données de santé, maintenant que la numérisation du système de santé devient une réalité dans les pays développés, suscite des attentes de la part de tous les acteurs, parfois surestimées, mais aussi des craintes, parfois exagérées. Il est proposé une revue des bénéfices que l’on peut légitimement attendre de l’exploitation des données disponibles, et des maléfices déjà documentés ou que l’on peut légitimement anticiper, puis de regarder de quel côté penche la balance bénéfices/risques. Nous proposons que la balance bénéfice/risque soit dorénavant le support des décisions d’autorisation pour l’utilisation des données de santé à des fins de recherche, alors que les critères actuels privilégient la protection absolue de la vie privée, ce qui entrave ou retarde la réalisation de nombreuses études de grande pertinence. Les bénéfices attendus de l’accessibilité de ces données sont nombreux. (1) Elles facilitent la surveillance épidémiologique des grandes pathologies, base de beaucoup de décisions en santé publique ; (2) elles permettent de mesurer l’efficacité des soins et de détecter des situations locales ou régionales s’écartant significativement de la moyenne ; (3) de même pour le suivi de l’évolution des pratiques dans le temps et leur impact ; (4) elles permettent de documenter les effets positifs et négatifs des innovations qui sont introduites par l’évolution des pratiques, qu’elles soient médicamenteuses, techniques ou organisationnelles ; (5) elles informent sur l’accès des patients aux interventions de santé : on peut calculer des taux et délais, et les croiser avec des variables géographiques, des données sociales et économiques, et ainsi identifier des inégalités, ce qui fonctionne ou non, et sur quels territoires doivent porter les efforts d’amélioration en priorité ; (6) elles contribuent directement à l’amélioration des connaissances, étape indispensable pour améliorer les pratiques et concevoir des politiques publiques efficaces et protectrices. (7) elles sont indispensables pour développer les usages de l’intelligence artificielle grâce à de nouveaux algorithmes de bonne qualité car entraînés et testés sur des populations représentatives, ce qui n’est pas toujours le cas actuellement ; (8) elles permettent d’évaluer l’efficacité des campagnes de prévention ou de dépistage, et l’observance des recommandations de bonnes pratiques. Mais l’usage de ces données par de multiples acteurs n’est pas sans risques. (1) le risque de révélation de données personnelles est un risque majeur pour les données nominatives mais très faible pour les données pseudonymisées et nul pour les données anonymisées ; (2) le risque d’utilisation non contrôlée, au-delà de l’information des personnes, dépend du respect des règles d’utilisation par les opérateurs. Il est très surveillé ; (3) le risque de vol de données et d’espionnage par des industriels ou des états est souvent cité par les opposants, il est pourtant extrêmement réduit car les données non nominatives n’ont pas de valeur marchande et ce type de vol ne s’est encore jamais produit ; (4) le risque de violation de la propriété intellectuelle et de préjudice financier par obstacle à la valorisation est souvent cité mais non documenté ; (5) le risque de surveillance normative des professionnels de santé est craint par ces professionnels, alors que cette surveillance est légitime du point de vue des financeurs du système de santé et les tensions peuvent être apaisées par le dialogue. Les risques potentiels pour les citoyens et la collectivité sont très minimes si les mesures de protection qui ont été adoptées sont efficacement mises en œuvre, et aucun des risques n’est de nature à faire courir un danger à fort impact (de santé), ni individuel ni collectif. En revanche, le bénéfice de l’utilisation de ces données peut être important pour la collectivité (ex. pertinence des soins, prévention des scandales sanitaires, évaluation des innovations) et pour l’individu (ex. développement de nouveaux traitements) et avoir des impacts sur les individus eux-mêmes. La balance bénéfice/risque est donc très en faveur des bénéfices. Reste à lever les freins à la mise en œuvre de l’ouverture des collections de données et à diffuser dans toutes les couches de la société la culture du bien commun que représentent les données de santé. Ces freins sont nombreux et comprennent : (1) l’interdiction d’utiliser des outils américains pour stocker des données alors qu’aucun cloud européen n’est disponible, et qu’il n’y a jamais eu de plaintes dans le secteur de la santé contre des industriels américains qui ne respecteraient pas le RGPD dans le domaine de la santé, ni de documentation de tentatives de réidentification de données anonymisées de recherche en santé ; (2) la difficulté d’utilisation du NIR pour apparier les bases de données que l’on souhaite croiser, alors que cela est possible dans beaucoup de pays européens, soumis à la même réglementation européenne que la France ; (3) des délais d’attente se chiffrant en année pour accéder à la base principale du SNDS alors que la file d’attente se réduirait si une copie de la base principale du SNDS était au catalogue du HDH ; (4) un écosystème trop complexe pour des raisons historiques, qui a besoin d’être simplifié pour aller vers un guichet unique, comme la directive européenne en préparation le préconise ; (5) une communication grand public ne portant que sur les risques et non sur les bénéfices, alors que les citoyens bien informés sont en faveur de l’usage de leurs données pour la recherche. Cela aurait un impact très important sur la faisabilité de nombreuses études. Un audit des entraves à la recherche dans le système actuel serait utile pour convaincre les réticents
Fichier principal
Vignette du fichier
CSC HDH - Bénéfices et risques de l'utilisation des données de santé à des fins de recherche.pdf (449.41 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04345572 , version 1 (14-12-2023)

Licence

Paternité

Identifiants

  • HAL Id : hal-04345572 , version 1

Citer

Ségolène Aymé, R Choquet, L Devillers, M Gilard, M Kelly-Irving, et al.. Bénéfices et risques de l'utilisation des données de santé à des fins de recherche : Rapport du Conseil scientifique Consultatif du Health Data Hub - octobre 2023. 2023. ⟨hal-04345572⟩
1583 Consultations
408 Téléchargements

Partager

Gmail Facebook X LinkedIn More