ConSoRe, moteur de recherche pour le big data en cancérologie

La quantité de données accumulées chaque jour dans les Centres hospitaliers recèle des informations essentielles pour accroître notre connaissance du cancer : fréquence des effets secondaires, efficacité des médicaments en vie réelle, résistance de certains patients aux traitements, etc. Les technologies du big data offrent aujourd’hui l’opportunité d’exploiter ces données pour faire avancer la recherche et améliorer les soins en cancérologie.

Mais le défi est de taille. Pour le relever, Unicancer construit un moteur de recherche puissant, sorte de Google des données de santé, capable de retrouver des informations disséminées dans le texte de centaines de milliers de dossiers des patients des Centres de lutte contre le cancer. C’est l’outil ConSoRe, pour Continuum soins-recherche.

 

 

 

Un complément à la recherche en laboratoire

L’étude du big data est une des tendances fortes qui se dégageaient des études prospectives d’Unicancer (La cancérologie en 2025). Son analyse doit devenir un complément incontournable à la recherche en laboratoire.

Cette approche est particulièrement utile en cancérologie, car elle permet d’étudier un nombre de patients suffisant pour segmenter les cancers en nombreux sous-types et offrir une médecine personnalisée aux patients.

Le défi technologique du big data en santé

La quantité de données en santé est massive. Les analyser est complexe, du fait de leur volume et de leur fragmentation dans de nombreuses bases et sources de données cloisonnées (PMSI, dossiers patient, dossier pharmaceutique). La plupart (80 %) de ces informations sont conservées sous forme de texte ce qui complexifie d’autant plus leur exploitation. Et les informations structurées ne sont pas non plus codées de la même façon d’un établissement à un autre.

Création de cohorte, études épidémiologiques, médico-économiques, etc. : à quoi sert ConSoRe

Première étape pour une exploitation facilitée de la donnée, ConSoRe se veut utile aux chercheurs comme aux cliniciens. Il permet :

  • L’identification simplifiée de patients à qui proposer une étude clinique multicentrique. Cette étape de sélection est dans la pratique courante coûteuse et chronophage pour les équipes de recherche. ConSoRe identifie en quelques secondes le nombre de patients répondant aux principaux critères de sélection dans les différents centres.
  • La visualisation synthétique de l’histoire pathologique des patients (apparition d’une tumeur, récidive, métastase, second cancer et traitements) et des soins dispensés en préparation de la réunion de concertation pluridisciplinaire.
  • L’analyse de données pour des études épidémiologiques, en vie réelle ou médico-économiques. Par exemple, ConSoRe sert à un programme de recherche sur la résistance aux traitements anti-cancéreux.

 

 

A écouter

Co-médications et réponse à la chimiothérapie. Comment l'équipe d'Alain Livartowski à l'Institut Curie a utilisé ConSoRe.
A la minute 20, reportage de Céline Loozen, pour « La méthode scientifique », sur France Culture

 

 

Les sources des données

Pour chaque Centre participant, ConSoRe rassemble des données structurées et non structurées depuis 2004 notamment sur les traitements, les examens, la caractérisation des tumeurs et la démographie des patients.

Elles sont issues :

  • Des dossiers patients y compris les compte-rendu d’examens et les courriers
  • Des actes codés dans le PMSI (y compris la chirurgie et la radiothérapie)
  • Les fiches de description standardisée des tumeurs
  • Du dossier pharmaceutique pour les chimiothérapies
  • Des informations du Centre de ressources biologiques (disponibilité d’échantillons tumoraux ou sanguins)
 

Le moteur de recherche exploite uniquement des documents existants et ne requiert donc aucun travail de codage supplémentaire aux centres hospitaliers qui l’utilisent.

Ces sources devraient être prochainement enrichies avec :

  • Les informations des outils métiers de la radiothérapie
  • Les analyses biologiques
  • Les données d’imagerie.

Respect de la vie privée et sécurité des données

Unicancer a travaillé étroitement avec la Commission nationale de l'informatique et des libertés (CNIL) pour définir un fonctionnement qui garantisse la sécurité et la confidentialité des informations.

Les données des patients sont hébergées dans le Centre qui le soigne. Seul le personnel soignant du Centre peut accéder aux données détaillées des patients. Comme ils ont déjà accès par ailleurs aux dossiers des patients de leur Centre, ConSoRe ne modifie pas les règles de confidentialité posées par la CNIL.

Les chercheurs, eux, n’ont accès qu’à des données du Centre où ils travaillent pour lesquelles les informations permettant l’identification du patient (nom, prénom, adresse, etc.) ont été supprimées.

Cependant, tous les utilisateurs peuvent interroger les autres centres pour avoir un dénombrement des cas d’intérêt. Ils n’auront pas accès au contenu de ces dossiers. S’ils souhaitent poursuivre, ils peuvent alors monter un projet de recherche avec les autres centres, après obtention des autorisations requises par la réglementation française et européenne portant sur les essais cliniques, les études épidémiologiques et la protection des données de santé.

Traitement et enrichissement des données

Les informations interrogées par le moteur de recherche de ConSoRe ont été préalablement traitées et enrichies, et leur structuration a été uniformisée. Cela optimise la recherche à la fois des données structurées et des mots clefs dans le texte.

Pour ce travail, Unicancer s’appuie sur l’expertise de partenaires industriels :

  • Sword (développement, sémantique),
  • Intel (optimisation de la plateforme).

En savoir plus sur le traitement et l’enrichissement des données

Où est utilisé le moteur de recherche ?

ConSoRe est installé dans 5 centres de luttes contre le cancer :

  • L’Institut Curie, à Paris
  • L’institut du Cancer de Montpellier
  • Le Centre Léon-Bérard, à Lyon
  • L’Institut Paoli-Calmettes, à Marseille
  • Le Centre Oscar Lambret, à Lille

L’installation est en cours dans 5 autres centres :

  • Institut Bergonié, à Bordeaux
  • Centre Henri Becquerel, à Caen
  • Centre Jean- Perrin, de Clermont-Ferrand
  • Centre François-Leclerc, à Dijon
  • Institut de cancérologie de Loraine, à Nancy

Dans le cadre d’un partenariat de recherche sur la résistance aux traitements, ConSoRe sera installé dans un centre hospitalier-universitaire, les Hôpitaux universitaires de Strasbourg.