Bull Cancer 2016; 103: S71–S75
Synthèse
en ligne sur / on line on www.em-consulte.com/revue/bulcan www.sciencedirect.com
Les grandes bases de données nationales et les études dans la vraie vie : l’exemple des sarcomes en France Maud Toulmonde1, Françoise Ducimetière2, Vianney Jouhet3, Thomas Gaudin1, Arnaud Malfilatre4, Yec’han Laizet1, Simone Mathoulin-Pélissier1,5, Jean-Yves Blay2, Jean-Michel Coindre1,5 Travail présenté le 30 Juin 2016 lors du Congrès de la Société Française du Cancer
1. Institut Bergonié, Bordeaux 2. Centre Léon Bérard, Lyon 3. Centre Hospitalo-Universitaire, Bordeaux 4. Centre Hospitalo-Universitaire, Nantes 5. Université de Bordeaux
Correspondance : Jean-Michel Coindre, Département de Biopathologie, Institut Bergonié, 229 cours de l’Argonne 33076 Bordeaux cédex
[email protected]
Keywords Database Sarcoma Evaluation of medical practices
Résumé Les sarcomes sont des tumeurs rares et hétérogènes et l’amélioration des connaissances et de la prise en charge des patients nécessitent la mise en commun des données et matériels biologiques. La base nationale sarcome rassemble dans un entrepôt de données environ 60 000 patients avec des informations cliniques, anatomopathologiques, moléculaires, thérapeutiques et évolutives ainsi que les données sur les échantillons disponibles et les pratiques médicales. Cette mise en commun au sein de réseaux nationaux structurés constitue un outil majeur pour le Groupe Sarcome Français.
Summary The big national databases and studies on real world data: example of sarcomas in France Sarcomas are rare and heterogeneous tumours, and improvement of knowledge and of patient management need to gather and share data and biological material. The French sarcoma database stores in a warehouse clinical, pathological, molecular, therapeutic and follow-up data as well as data on samples and medical practices. This database and the national structured networks constitute major tools for the French Sarcoma Group.
Bulletin du tome 103 > Numéro spécial congrès > Juin 2016 © 2016 Société Française du Cancer. Publié par Elsevier Masson SAS. Tous droits réservés.
CANCER
S71
Mots clés Base de données Sarcomes Évaluation des pratiques médicales
Synthèse
M. Toulmonde, F. Ducimetière, V. Jouhet et al.
Introduction Les sarcomes sont des tumeurs rares avec environ 4 à 5000 nouveaux cas par an en France. Ces tumeurs se développent principalement au niveau des tissus mous mais également des viscères et plus rarement des os. Il en existe plus de 50 types et sous-types histologiques différents dont certains sont caractérisés par des anomalies moléculaires spécifiques qui constituent des marqueurs diagnostiques [1]. La prise en charge de ces patients est complexe nécessitant une approche multidisciplinaire experte, en particulier en ce qui concerne le diagnostic histologique et la prise en charge chirurgicale. De ce fait la mise en commun de l’expérience concernant ces tumeurs dans des bases de données partagées constitue un outil incontournable pour la recherche clinique et biologique et l’évaluation des pratiques médicales. La première base de données nationale portant sur les sarcomes a été établie en 1989. Il s’agissait de la constitution d’une cohorte de sarcomes des tissus mous (STM) de l’adulte pris en charge dans des centres spécialisés membres du Groupe Sarcome Français (GSF-GETO), qui avait pour objectif principal d’établir des facteurs pronostiques. En 2007 dans le cadre d’un réseau d’excellence européen (CONTICANET) ont été mises en place deux bases de données européennes dédiées aux STM et des viscères (Conticabase) et aux tumeurs stromales du tube digestif ou GIST (ConticaGIST). À partir de 2010, dans le cadre de l’implémentation par l’INCa de réseaux nationaux pour la prise en charge des cancers rares de l’adulte, trois réseaux de référence sarcome ont été mis en place: le réseau de relecture histologique des STM et des viscères (RRePS pour Réseau de Référence en Pathologie des Sarcomes), le réseau de relecture en pathologie des sarcomes osseux (ResOs) et le réseau de prise en charge clinique des sarcomes (NetSarc). Une quatrième base, également partagée au sein du GSF-GETO, rassemble les données de profil génomique (CGH-array) et de profil transcriptomique (cDNA-array) d’environ 1 000 patients (ATG Sarc). En 2016 ces différentes bases de données ont été rassemblées dans un entrepôt de données (Base Clinico-Biologique ou BCB Sarcome) qui comporte actuellement les informations clinicobiologiques d’environ 60 000 patients. Les objectifs principaux de la création de ces bases sarcomes sont de disposer d’un outil pour améliorer les connaissances et les pratiques dans ce domaine et également de constituer un modèle d’organisation des informations en cancérologie.
Méthodes
S72
•• Sur le plan structurel, la BCB Sarcome est un entrepôt de données qui regroupe plusieurs applications : –– La Conticabase (https://conticabase.sarcomabcb.org/) correspondant à une cohorte de patients porteurs d’un STM ou des viscères traités dans les 30 centres experts régionaux du GSF-GETO et comportant des données cliniques, histologiques, moléculaires, thérapeutiques et évolutives ainsi que
des informations sur les échantillons tumoraux collectés chez ces patients (environ 200 items). –– Les bases RRePS (https://rreps.sarcomabcb.org/), ResOs (https://resos.sarcomabcb.org/) et NetSarc (https://netsarc.sarcomabcb.org/) qui portent plus spécifiquement sur la prise en charge histologique et thérapeutique des patients porteurs d’un STM, des viscères ou des os en France depuis le 1er janvier 2010, et comportent des indicateurs de pratiques (60 items). Une autre application ConticaGIST (https://conticagist.sarcomabcb.org/) va également être intégrée dans cet entrepôt de données dans un futur proche. Sur le plan technique, le modèle de base de données et de type « Entité, Attribut, Valeur ». Les entités définies sont le patient, la tumeur primaire, les évènements récidive locale et métastase, les RCP, l’inclusion dans un essai thérapeutique, ainsi que l’échantillon d’anatomie pathologique, la paraffine, le tissu congelé, l’immunohistochimie, la cytogénétique moléculaire, la lignée cellulaire, le sang périphérique et les lignes de chimiothérapie. Ces différentes entités comportent de 10 à 50 attributs avec des valeurs structurées prédéfinies selon les standards internationaux. Il s’agit d’un système souple et évolutif qui permet d’ajouter autant d’échantillons, de récidives, de lignes de chimiothérapie, etc... que nécessaire ainsi que d’autres attributs potentiellement intéressants selon l’évolution des connaissances. •• La collecte des données est organisée sur le plan national avec la participation d’une dizaine d’assistants de recherche clinique (ARC) et des pathologistes relecteurs. Ces données sont mises à jour en particulier en ce qui concerne l’apparition de récidives, de métastases, de nouveaux traitements et de nouveaux échantillons. •• La qualité des données est assurée par un choix préétabli raisonné des données à collecter et le caractère structuré de ces données qui sont définies dans un dictionnaire de données, par une collecte et des mises à jour réalisées par des ARC formés spécifiquement, ainsi que par un programme d’assurance qualité avec une aide en ligne, des formations régulières et des contrôles de cohérence. En outre chaque étude effectuée à partir de l’entrepôt de données est l’occasion de contrôler les données et de les améliorer. •• Sur le plan réglementaire, la BCB Sarcome possède les autorisations CCTIRS et CNIL. Les données sont sécurisées avec des codes d’accès qui changent tous les 6 mois, un cryptage des données, une traçabilité des modifications et une sauvegarde quotidienne. Les données individuelles des patients sont accessibles en lecture et/ou en écriture avec deux règles de base : un professionnel de santé est propriétaire des données des patients de son centre et n’a accès qu’aux données individuelles des patients de son centre. •• Des outils et règles ont été mis en place afin de favoriser la valorisation de la base de données dans des études coopératives : un module d’interrogation sur l’ensemble des données disponibles est accessible à tous les membres du GSF-GETO afin d’évaluer la faisabilité d’une étude. Tout membre du GSF-GETO peut initier une étude, il doit alors adresser par courrier électronique un
Bulletin du
CANCER
tome 103 > Numéro spécial congrès > Juin 2016
Résultats •• L’entrepôt de données contient actuellement environ 60 000 patients avec près de 16 000 pour la Conticabase, 33000 pour NetSarc, 28000 pour RRePS et 2000 pour ResOs. En 2014, RRePS couvrait 91% des nouveaux patients attendus à l’échelle nationale, ResOs 79% et NetSarc 73%. •• Plusieurs types d’études ont été réalisés à partir de la BCB Sarcome : –– Des études de facteurs pronostiques sur des cohortes de patients. Par exemple les études de description et validation du grading histopronostique de la FNCLCC dans différents types histologiques de sarcomes ont abouti à la validation du grading Français qui est maintenant le grading de référence pour les sarcomes des tissus mous pour l’OMS [2-7]. –– Des études biologiques. Par exemple une étude réalisée à partir de la BCB Sarcome a permis la description d’un grading moléculaire (CINSARC) à partir de l’expression de 67 gènes qui interviennent dans le contrôle de la stabilité chromosomique [8]. Cette organisation en réseau et l’existence de ce système de base de données ont également permis au GSFGETO d’être retenu dans le programme International Cancer Genome Consortium (ICGC) pour être porteur du projet de séquençage complet de 300 léiomyosarcomes. –– Des études portant sur un type particulier de tumeurs, avec description d’une cohorte de patients, étude mutationnelle, génomique et transcriptomique. Un programme de ce type a été effectué sur les tumeurs desmoïdes [9-12]. Un autre programme est actuellement en cours sur les sarcomes développés sur tissu irradié et comporte en outre une étude de la qualité de la radiothérapie initiale, et deux études ancillaires portant sur l’apoptose radio-induite des lymphocytes T8 et les polymorphismes des gènes de réparation de l’ADN à partir du sang circulant. –– Des études portant spécifiquement sur les thérapeutiques, comme l’étude de l’impact du délai, de la dose et des volumes d’irradiation sur le pronostic local, ou l’étude de l’impact de la chimiothérapie néoadjuvante, adjuvante ou palliative [13-15]. Ces types d’étude peuvent être particulièrement intéressants pour les industriels pharmaceutiques en vue de la mise sur le marché de nouvelles molécules dans le traitement de patients atteints de sarcomes. –– Des études d’évaluation et d’amélioration des pratiques dans les domaines du diagnostic anatomo-pathologique et de la prise en charge thérapeutique [16].
Bulletin du tome 103 > Numéro spécial congrès > Juin 2016
Discussion •• La BCB Sarcome constitue actuellement un outil important pour la prise en charge des patients et l’évolution des connaissances dans le domaine des sarcomes pour le GSF-GETO. Notre organisation en réseaux de pathologistes et de cliniciens nous permet de couvrir l’ensemble des tumeurs conjonctives sur tout le territoire national et une collecte de qualité pour la majorité des patients porteurs d’un sarcome. •• Plusieurs challenges existent quant à la pérennisation et au développement de la BCB Sarcome. •• La qualité des données et du taux de remplissage des items est un élément clé de la pérennisation de la BCB Sarcome et représente un coût majeur humain, temporel et financier. L’amélioration de cette qualité à un moindre coût devra se faire dans le futur par l’utilisation de comptes rendus standardisés structurés lors de la prise en charge des patients. Ces comptes rendus standardisés structurés existent actuellement en France en anatomie pathologique pour plus de 60% des comptes rendus de sarcome et sont la preuve du concept. L’objectif est désormais d’utiliser des comptes rendus standardisés structurés pour la consultation initiale, l’imagerie, la chirurgie, l’oncologie médicale, la radiothérapie et le suivi des patients. La mise en place de ce type de compte rendu est difficile par les contraintes techniques dues à l’hétérogénéité et les problèmes d’interopérabilité des systèmes informatiques selon les centres mais également par le frein culturel qu’il représente pour les médecins. Il s’agit cependant d’un enjeu majeur pour le futur. •• Un autre challenge concerne l’intégration des données hétérogènes. Du fait d’une grande utilisation des analyses génomiques pour les tumeurs malignes et en particulier les sarcomes il est maintenant important de pouvoir intégrer les données dites « omiques » (profil génomique, profil d’expression, données de séquençage massif) aux données dites phénotypiques classiques que sont les données cliniques, anatomo-pathologiques, thérapeutiques et évolutives. Il existe des outils d’intégration disponibles dans la communauté scientifique et reconnus sur le plan international comme I2B2 (https://www.i2b2.org/) et tranSMART (http://transmartfoundation.org/) qui permettent ce type d’approche [17]. Le GSF-GETO a initié un projet intégrant les données de la Conticabase et les données « omiques » d’environ 1 000 sarcomes dans ces 2 interfaces avec des résultats préliminaires très prometteurs. •• Un problème crucial généré par le développement des bases de données est l’interopérabilité de ces différents systèmes. L’utilisation généralisée des analyses génomiques tant pour la recherche que pour l’évaluation des thérapeutiques dites ciblées, a rendu nécessaire de pouvoir rassembler et comparer les données obtenues sur des tumeurs de localisations et de types histologiques différents. Les bases de données doivent donc être structurées pour être interopérables, c’est à dire utiliser des standards et des référentiels internationaux afin de pouvoir échanger les données collectées. La BCB Sarcome participe à ce titre au projet OSIRIS (projet Inter SIRIC de partage
CANCER
S73
descriptif résumé de l’étude, qui est ensuite soumis au conseil d’administration (comité scientifique). Si l’accord du conseil d’administration est donné, le data manager initie l’étude dans le module « Studies » de l’entrepôt de données qui permet de recueillir l’autorisation d’accès aux données des autres centres, le suivi des études et leur traçabilité. Des règles de publication du GSF-GETO ont été mises en place avec comme règle principale un auteur par 5% de patients entrés dans une étude.
Synthèse
Les grandes bases de données nationales et les études dans la vraie vie : l’exemple des sarcomes en France
Synthèse
M. Toulmonde, F. Ducimetière, V. Jouhet et al.
des données) initié par l’INCa qui a pour objectif de définir un set minimum d’attributs cliniques et génomiques communs aux tumeurs solides et de créer une base transversale commune. Un autre point important pour la pérennisation et le développement de la BCB Sarcome est son actualisation et son adaptation aux besoins de la « vraie vie ». La BCB Sarcome est particulièrement bien adaptée à cette problématique grâce au recueil au quotidien des données concernant la relecture histologique de tous les nouveaux cas de sarcomes, GIST et tumeurs desmoïdes ainsi que les données de RCP des patients pris en charge par les réseaux nationaux. Un autre projet de développement important est la mise en place prochaine sur le plan national un suivi de l’efficacité et des effets secondaires des nouvelles molécules utilisées chez les patients en phase avancée.
Conclusion Le développement et le maintien de grandes bases de données nationales nécessitent une structuration nationale en réseau dans la pathologie étudiée, la participation active de tous les centres experts, la complémentarité des organisations existantes pour la collecte de données, un outil informatique partagé structuré et évolutif ainsi qu’un cadre réglementaire. La BCB Sarcome permet le recensement des diagnostics caractérisés de façon maximale (double lecture, biologie moléculaire)
avec les techniques les plus récentes, la collection d’un set de données cliniques et biologiques minimum actualisées et à disposition immédiate. De plus, la couverture nationale de la BCB Sarcome permet de repérer aisément les patients aux différentes étapes de leur maladie, et son taux de quasi-exhaustivité, notamment via l’entrée par la relecture anatomopathologique systématique, offre la possibilité de décrire des données épidémiologiques en population générale. Coordonnée par un comité scientifique réactif, constitué des leaders d’opinion dans le domaine, travaillant en collaboration avec différentes plateformes d’expertise régionales ou nationales, la BCB Sarcome a les capacités organisationnelles d’obtenir des données complémentaires et de suivi des patients dans de courts délais, d’homogénéiser les coûts d’accès à ses données cliniques et biologiques et de diminuer les délais de contractualisation avec ses partenaires. Ainsi, la BCB Sarcome peut représenter un modèle d’outil majeur et fiable pour la réalisation d’études en vie réelle. Déclaration d’intérêt : Les auteurs déclarent ne pas avoir de lien d’intérêt avec cet article.
Remerciements : Nous remercions l’Institut National du Cancer (INCa) pour son soutien financier des réseaux sarcomes (RRePS, NetSarc et ResOs) et de la BCB Sarcome.
Références
S74
[1] Fletcher CDM, Bridge JA, Hogendoorn PCW, Mertens F. WHO classification of tumours of soft tissue and bone. World Health Organization. IARC Press: Lyon 2013. [2] Coindre JM, Terrier P, Bui NB, Bonichon F, Collin F, Le Doussal V et al. Prognostic factors in adult patients with locally controlled soft tissue sarcoma: a study of 546 patients from the French Federation of Cancer Centers Sarcoma Group. J Clin Oncol 1996;14:869-77. [3] Le Doussal V, Coindre JM, Leroux A, Hacene K, Terrier P, Bui NB et al. Prognostic factors for patients with localized primary malignant fibrous histiocytoma. A multicenter study of 216 patients with multivariat analysis. C ancer 1996;77:1823-30. [4] Guillou L, Coindre JM, Bonichon F, Bui NB, Terrier P, Collin F et al. Comparative study of the National Cancer Institute and French Federation of Cancer Centers Sarcoma Group Grading Systems in a population of 410 adult patients with soft tissue sarcoma. J Clin Oncol 1997;15:350-62. [5] Trassard M, Le Doussal V, Hacène K, Terrier P, Ranchère D, Guillou L et al. Prognostic factors in localized primary synovial sarcoma: a multicenter study of 128 adult patients. J Clin Oncol 2001;19:525-34.
[6] Coindre JM, Terrier P, Guillou L, Le Doussal V, Collin F, Ranchère D et al. Predictive value of grade for metastasis development in the main histologic types of adult soft tissue sarcomas. A study of 1240 patients from the french Federation of Cancer Centers Sarcoma Group. Cancer 2001;91:1914-26. [7] Guillou L, Benhattar J, Bonichon F, Gallagher G, Terrier P, Stauffer E et al. Histologic grade, but not SYT-SSX fusion type, is an important pronostic factor in patients with synovial sarcoma: a multicenter, retrospective analysis. J Clin Oncol 2004;15:4040-50. [8] Chibon F, Lagarde P, Salas S, Pérot G, Brouste V, Tirode F et al. Validated prediction of clinical outcome in sarcomas and multiple types of cancer on the basis of a gene expression signature related to genome complexity. Nat Med 2010;16:781-7. [9] Dômont J, Salas S, Lacroix L, Brouste V, Saulnier P, Terrier P et al. High frequency of beta-catenin heterozygous mutations in extra-abdominal fibromatosis: a potential molecular tool for disease management. Br J Cancer 2010;102:1032-6. [10] Salas S, Chibon F, Noguchi T, Terrier P, Ranchere-Vince D, Lagarde P et al. Molecular characterization by array comparative
genomic hybridization and DNA sequencing of 194 desmoid tumors. Genes Chromosomes. Cancer 2010;49:560-8. [11] Salas S, Dufresne A, Bui B, Blay JY, Terrier P, Ranchere-Vince D et al. Prognostic Factors Influencing Progression-Free Survival Determined From a Series of Sporadic Desmoid Tumors: A Wait-and-See Policy According to Tumor Presentation. J Clin Oncol 2011;29:3553-8. [12] Salas S, Brulard C, Terrier P, Ranchere- Vince D, Neuville A, Guillou L et al. Gene Expression Profiling of Desmoid Tumors by cDNA Microarrays and Correlation with Progression-Free Survival. Clin Cancer Res 2015;21:4194-200. [13] Italiano A, Penel N, Robin YM, Le Cesne A, Piperno-Neumann S, Tubiana-Hulin M et al. Neo/adjuvant chemotherapy does not improve outcome in resected primary synovial sarcoma/ a study of the French Sarcoma Group. Ann Oncol 2009;20:425-30. [14] Italiano A, Le Cesne A, Mendiboure J, Blay JY, Piperno-Neumann S, Chevreau C et al. Prognostic factors and impact of adjuvant treatments on local and metastatic relapse of soft-tissue sarcoma patients in the competing risks setting. Cancer 2014;120:3361-9.
Bulletin du
CANCER
tome 103 > Numéro spécial congrès > Juin 2016
[16] Penel N, Coindre JM, Bonvalot S, Italiano A, Neuville A, Le Cesne A et al. Management of desmoid tumours: a nationwide survey of labelled reference centre networks in France. Eur J Cancer 2016;58:90-96.
Bulletin du tome 103 > Numéro spécial congrès > Juin 2016
CANCER
[17] Canuel V, Rance B, Avillach P, Degoulet P, Burgun A. Translational research platforms integrating clinical and omics data: a review of publicly available solutions. Brief Bioinform 2015;16:280-90.
S75
[15] Garbay D, Maki RG, Blay JY, Isambert N, Piperno-Neumann S, Blay C et al. Advanced soft-tissue sarcoma in elderly patients: patterns of care and survival. Ann Oncol 2013;24:1924-30.
Synthèse
Les grandes bases de données nationales et les études dans la vraie vie : l’exemple des sarcomes en France