Site d’information destiné aux acteurs sanitaires et médico sociaux

Open data | 11/07/2014

Données de santé : l’ouverture se poursuit mais la porte est lourde

par Guillaume Garvanèse
Cocotte minute J. Steidl/Fotolia

Un nouveau rapport sur l’ouverture des données de santé rendu à Marisol Touraine le 9 juillet 2014 entend apaiser le débat qui agite le milieu de la santé depuis près de deux ans et nourrir la futur loi santé.

La commission « open data en santé » installée fin 2013 par Marisol Touraine a planché de novembre 2013 à mai 2014 autour des enjeux brûlants relatifs à l’ouverture des données de santé. Et si le travail a consacré des notions déjà connues, il aura surtout permis aux acteurs qui s’invectivaient il y a encore 18 mois (institutions, professionnels de santé, associations de consommateurs ou entreprises privées) « d’élaborer une vision commune » selon les mots d’Henri Verdier, directeur d’Etalab, le service rattaché à Matignon chargé de l’ouverture des données publiques.

Une vision commune qui laisse perplexe Pierre Desmarais, avocat en droit de la santé, qui de plus ne trouve rien d’innovant dans ce rapport : « la commission indique que le rapport a été approuvé consensuellement, mais une note de bas de page relève que les services de la Cnil ne l’ont pas approuvé formellement ». De quoi relativiser le consensus et le « partage d’attentes communes et fortes » proclamés en introduction.

Le Sniiram « cadenassé »

Et l’union trébuche aussi sur la critique de Patrick Guérin, PDG de Celtipharm, une entreprise spécialisée dans le traitement des informations de santé et très présente dans le débat : « C’est un rapport technocratique, qui ne fera pas bouger le système ». L’objet de son courroux : un arrêté du 20 juin 2005 qui a « cadenassé de manière injustifiée » le Système national d’information inter-régimes de l’Assurance maladie (Sniiram, la principale base de données de santé) pour les entreprises privées ainsi que pour la Haute autorité de santé (HAS) et l’Agence nationale de sécurité du médicament et des produits de santé (ANSM) jusqu’à ce qu’une décision contraire du Conseil d’Etat rendue le 19 juillet 2013 y mette un terme. « Ce verrouillage est un vrai frein à l’innovation et aux études sur le mésusage des médicaments ou leurs effets secondaires, et le rapport est trop timide sur la réouverture », tempête-t-il.

Obligation européenne

Concrètement, les rapporteurs entérinent la nécessité d’ouvrir les jeux de données strictement anonymes, c’est-à-dire ceux qui n’entraînent aucun risque de ré-identification des personnes. Il s’agit en fait de faire respecter le cadre réglementaire existant. En outre, les producteurs de données doivent prévoir l’ouverture de ces données dès leur fabrication. Cette recommandation répond à l’obligation faite par Bruxelles aux Etats membres d’ouvrir leurs données publiques non sensibles d’ici au 18 juillet 2015.

Mais pour que le système soit efficace, il doit se faire en temps réel, ce qui selon Patrick Guérin implique l’accès aux flux de données brutes. En effet, Celtipharm procède à une veille syndromique. « Or nous n’avons accès qu’à des extractions du Sniiram, ce qui demande un certain délai, regrette-t-il. Et quand bien même le Sniiram serait-il ouvert, il est alimenté avec deux mois de retard ! Ce que nous voulons, c’est un accès aux flux de données brutes anonymisées par un processus validé par la Cnil ». Bien qu’autorisé par la Cnil, l’accès aux flux reste bloqué à ce jour.

La commission semble pourtant prendre un tout autre chemin en travaillant sur les données du Sniiram et du PMSI pour créer… une nouvelle base de données. L’idée laisse Pierre Desmarais d’autant plus songeur qu’il ne comprend pas ce que vient faire cette initiative dans l’open data : « pour moi, il ne s’agit que d’un édulcorant visant à contourner les problèmes, mais en aucun cas il ne s’agit d’open data. »

Une opportunité pour les collectivités

« Outre l’échéance de juillet 2013, l’accélération dans la libération des données est aussi due à un risque pénal qu’a très bien compris Marisol Touraine », analyse Patrick Guérin. Et de prendre pour exemple la corrélation, simple, entre le nombre de prescriptions de Médiator et le nombre de diabétiques qui aurait pu alerter les services sanitaires en temps réel à l’époque, mais qui n’a pas été réalisée. Une bonne grosse épée de Damoclès judiciaire dont voudrait se débarrasser le ministère au plus vite selon Patrick Guérin.

Les travaux sont conséquents, mais les collectivités pourraient immédiatement tirer parti des données déjà disponibles si une ouverture intervenait rapidement. En effet, les bases dont les rapporteurs demandent l’ouverture immédiate regroupent des données comme la qualité des eaux de baignade, le volume de consommation des médicaments dans les hôpitaux, l’inventaire du patrimoine hospitalier ou encore les tableaux de bord de pilotage pour le médico-social… Autant de matière propice à améliorer l’efficacité des politiques sanitaires et médico-sociales.

T.Ratcliff/Flickr

Plusieurs dizaines de bases de données

A ce titre, les opérateurs et directions générales des établissements publics sont mis à contribution par la commission. Cette dernière suggère qu’ils établissent un échéancier d’ouverture des données avec l’appui d’un correspondant open data. Des expérimentations d’anonymisation ont d’ailleurs été menées sur le PMSI avec pour but d’être étendues au Sniiram.

En ce qui concerne les données à anonymiser, l’enjeu est un peu plus élevé. D’abord, si on parle beaucoup de la base Sniiram, ce mastodonte de 450 téraoctets alimentés par 1,2 milliards de feuilles de soins chaque année, la réalité englobe au moins 240 bases de données selon la cartographie établie par Etalab. Un trésor sur lequel veille farouchement la Caisse national d’assurance maladie (Cnam).

Deux branches de données sont à prendre en compte. En premier lieu, les données à très faible risque de ré-identification pour lesquelles une procédure simplifiée pourrait être retenue après validation de la Cnil. En clair, il s’agit de mesurer la balance entre les bénéfices apportés par l’exploitation des données et les risques de ré-identification.

Calculer le rapport bénéfice/risque de l’anonymisation

Un rapport bénéfice/risque rapidement calculé par François Bancilhon, PDG de Data Publica, début juillet lors d’une conférence à Paris : « Pendant la canicule de 2003, les personnes âgées sont mortes et les ministères n’étaient pas au courant car nous n’avions pas de remontées de morbidité en temps réel. Il existe un tas de technique d’anonymisation, mais je ne suis pas convaincu que cet investissement humain soit réellement utile. Il faut donner la primauté à la survie et à la santé des gens par rapport à la préservation de l’anonymat à tout prix. »

Les données détaillées, à fort risque de ré-identification, restent soumise au contrôle fort de la Cnil, mais la commission propose d’alléger le circuit des demandes d’accès des organismes privés ou publics.

Le poids financier de la donnée

Passé le travail technique d’anonymisation (floutage statistique, ajout de bruit, effacement des coordonnées, double hashage…) pour lequel le rapport n’émet pas de recommandation par rapport aux processus existants (la commission évoque bien une standardisation du processus, mais la pléthore de structures de bases de données laisse peu de chances à la réalisation d’un tel vœu), la commission s’attache à consacrer la gratuité des données traitées sans aborder la question de la propriété intellectuelle. Une question qui hérisse Pierre Desmarais : « Les concepts de gratuité et de liberté de réutilisation ne figurent pas dans la directive européenne que la France doit transposer, or ces concepts sont très différents de la notion de droit à réutilisation. Si la gratuité des données est adoptée, le poids financier sera intégralement supporté par la dépense publique au profit des sociétés commerciales. »

A contrario, le PDG de Celtipharm se félicite de cette recommandation et voit dans la gratuité des données un levier à l’innovation commerciale : « la donnée est un bien commun qui participe à la création de richesse. Les usages doivent être libres, mais connus de tous, avec un rapport annuel par exemple. »

Avec le rapport de Louis Bras sur la gouvernance et l’utilisation des données de santé remis en janvier, ce rapport a pour vocation d’inspirer le volet open data de la futur loi santé, en court d’écriture. Mais les braises couvent encore sous les soixante pages du rapport. L’été risque d’être chaud…

Le contenu de cet article est temporairement déverrouillé

publier un commentaire

Réagissez à cet article

  1. « Il faut donner la primauté à la survie et à la santé des gens ». Bon début! mais dans quelles conditions? L’intérêt de vivre, certes en meilleure santé, c’est d’en faire quelque chose de positif (vivre pour vivre n’a aucun intérêt). Que chacun arrête de regarder ses propres intérêts mais considère les intérêts des personnes qui doivent survivre en relative santé.

Laisser un commentaire

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>