S114
EPI-CLIN 2014 / Revue d’Épidémiologie et de Santé Publique 62S (2014) S113–S132
Méthodes.– Nous avons étudié la méthode de Case & Morgan, identifié et testé les logiciels l’implémentant, puis recensé les articles d’essais cliniques publiés dans PubMed, ayant utilisé ce design entre la parution de l’article et le 31 janvier 2014. Résultats.– Le design de Case & Morgan repose sur la comparaison, à un temps donné, de la proportion de survie à une proportion minimale fixée, à l’aide de l’estimateur de Nelson-Aalen. Les auteurs ont utilisé la distribution conjointe de cet estimateur, mesuré à différents moments, proposée par Lin et al. afin de définir la distribution conjointe des deux statistiques de test utilisées aux analyses intermédiaire et finale : il s’agit d’une loi normale bivariée dépendant du ratio de l’information disponible à la fin de chaque étape. Le calcul du nombre de sujets nécessaire n’a pas une solution unique : il faut notamment spécifier si l’on préfère minimiser la durée d’inclusion ou bien la durée totale de l’étude, tout en paramétrant la dynamique d’inclusion attendue (exemple : 10, 30 et 20 patients pour la première, deuxième et troisième année d’inclusion respectivement) qui conditionne l’information disponible à chaque temps. En plus du programme informatique 2stgb.exe conc¸u par Case & Morgan (que l’on peut se procurer par simple demande par email), la fonction OptimDes du package R OptInterim implémentée par Bo Huang et Neal Thomas en 2012 ainsi que le logiciel Sample Size Software (SSS) développé par Sze-Huey Tan, associé au livre de D. Machin et al. (Sample size tables for clinical studies, third edition) permettent de calculer le nombre de sujets nécessaire et de réaliser les analyses intermédiaire et finale. Un seul article publié en 2013 dans l’European Journal of Cancer présente les résultats d’un essai clinique utilisant ce design : il s’agit d’une étude britannique publiée en 2013, évaluant la survie globale d’enfants et d’adolescents nouvellement atteints d’un gliome du tronc cérébral traités par radiothérapie et temozolomide. Conclusion.– Case & Morgan ont proposé en 2003 un design de phase II adapté aux problématiques des données de survie puisqu’il évite une suspension prolongée des inclusions à l’analyse intermédiaire. La première étude utilisant cette méthodologie vient d’être publiée, dix ans après la publication de l’article princeps. L’implémentation de ce design dans différents logiciels le rend désormais accessible, permettant à notre équipe d’engager un travail de simulations pour tester sa robustesse lors de différents scénarios. http://dx.doi.org/10.1016/j.respe.2014.05.004 1.3
Modèle multi-états pour analyser un essai randomisé dans les formes progressives secondaires de la sclérose en plaques : essai PROMESS L. Baschet a,b , B. Brochet c,d , M. Deloire c , T. Loock c , J.-C. Ouallet c , A. Ruet c , P. Perez a,b a Unité de soutien méthodologique à la recherche clinique et épidémiologique, Pôle de santé publique, CHU de Bordeaux, Bordeaux, France b Inserm, Centre d’investigation clinique - épidémiologie clinique CIC-EC7, Bordeaux, France c Service de neurologie, CHU de Bordeaux, Bordeaux, France d Inserm U 862, Université de Bordeaux, Bordeaux, France Mots clés : Sclérose en plaques ; Essai clinique randomisé ; Modèle multi-états ; Illness-death ; Intention de traiter Introduction.– Il n’existe pas aujourd’hui de traitement efficace sur les formes secondairement progressives (SP) de sclérose en plaques (SEP). L’objectif principal de l’essai PROMESS était de comparer l’efficacité du cyclophosphamide (CPM) et de la méthylprednisolone (MP) pour réduire l’incidence d’aggravation du handicap à deux ans dans les formes SP de SEP. Des arrêts prématurés de traitement liés aux effets indésirables étant attendus, l’étude conjointe de la tolérance et de l’efficacité était nécessaire pour interpréter les résultats. Méthodes.– Il s’agit d’un essai randomisé multicentrique en double insu sur deux groupes parallèles CPM versus MP. Le traitement était administré en perfusion intraveineuse tous les mois la première année, puis tous les deux mois la deuxième. Chaque patient était suivi par un neurologue traitant chargé de la prise en charge médicale et neurologique du patient, et un neurologue évaluateur chargé du recueil des critères de jugement. Le critère de jugement principal était le délai d’aggravation, confirmée à quatre mois, du handicap mesuré par le score
Expanded Disability Status Scale (« EDSS »). L’analyse principale en intention de traiter était réalisée par un modèle de Cox. La censure par intervalle entre deux visites a été gérée par imputation du milieu de l’intervalle. Une analyse secondaire consistait en un modèle multi-états de type « illness-death » (package msm de R) afin d’analyser conjointement l’aggravation et les arrêts prématurés de traitement, et en gérant la censure par intervalle sans imputation. Résultats.– Au total, 27 centres en France ont inclus 138 patients entre 2005 et 2009, sur les 360 prévus initialement. Soixante-douze ont été randomisés dans le groupe CPM et 66 dans le groupe MP. Les caractéristiques à l’inclusion étaient comparables dans les deux groupes. Trente-trois patients dans le groupe CPM (46 %) ont arrêté prématurément le traitement, principalement pour effets indésirables (pour 20 d’entre eux), majoritairement vomissements et nausées, contre 22 (33 %) dans le groupe MP, pour d’autres raisons plus variées. En conséquence, 23 patients ont arrêté prématurément leur suivi avant aggravation dans le groupe CPM, contre 11 dans le groupe MP. Cette censure, potentiellement informative, pouvait biaiser les résultats des modèles de survie, et dans tous les cas diminuait la puissance du test. Avec ajustement sur la durée de la maladie et l’existence de poussées dans l’année précédant l’inclusion, le risque relatif d’aggravation associé au traitement par CPM était de 0,65 [0,32–1,30], p = 0,22. Le modèle multi-états indiquait que le risque relatif de transition de l’état initial vers l’aggravation était de 0,42 [0,19 ; 0,92], et de l’état initial vers l’arrêt prématuré de traitement de 2,56 [1,13 ; 5,79], indiquant un effet protecteur du CPM sur le délai d’aggravation et un effet délétère sur le délai d’arrêt prématuré de traitement. Des analyses de sensibilité ont conforté ce résultat. Conclusion.– L’analyse en intention de traiter n’a pas permis de démontrer l’efficacité du CPM pour ralentir l’aggravation du handicap dans les formes SP de SEP. Cependant, le modèle multi-états a mis en évidence des résultats prometteurs sur la protection vis-à-vis de l’aggravation, conjointement aux problèmes de tolérance. L’utilisation de nouveaux médicaments anti-émétiques plus efficaces permettrait de mettre en place un nouvel essai pour confirmer les résultats d’efficacité. http://dx.doi.org/10.1016/j.respe.2014.05.005 1.4
Améliorer la prise en charge de l’insuffisance rénale chronique modérée à sévère chez les patients vivant avec le VIH en France : un essai en cluster A. Rachas a , J. Tourret b , M. Guiguet c , C. Isnard-Bagnis b , P. Tattevin d , E. Billaud e , D. Costagliola c , P. Durieux a , S. Abgrall c a Hôpital Européen Georges-Pompidou, Paris, France b Hôpital Pitié-Salpétrière, Paris, France c Inserm UMR S 1136, Paris France d Hôpital Pontchaillou, Rennes, France e Hôpital Hôtel-Dieu, Nantes, France Mots clés : VIH/IRC ; Cohorte ; Essai d’intervention ; Cluster Introduction.– L’insuffisance rénale chronique (IRC) fréquente chez les personnes vivant avec le VIH (PVVIH) peut avoir une évolution ralentie par des mesures médicales simples. Afin d’évaluer si une promotion « active » des recommandations nationales et internationales sur la prise en charge de l’IRC est plus efficace pour améliorer les pratiques médicales que la diffusion habituelle de l’information. Méthodes.– Essai randomisé en cluster : 42 centres participant à la base des données franc¸aises sur l’infection à VIH (FHDH-ANRS-CO4), les cliniciens et les patients ayant une IRC (débit de filtration glomérulaire estimé [DFGe] entre 15 et 60 mL/min/1,73 m2 selon les estimateurs MDRD ou Cockcroft) inclus dans la FHDH. Randomisation des centres entre deux bras : témoin : diffusion simple de l’information le 30/04/2009 avec rappel aux cliniciens de l’existence de recommandations ; intervention : trois envois aux cliniciens entre le 30/04/2009 et le 30/04/2010 de rappels des recommandations, de documents décisionnels (résumé et explication des recommandations, algorithmes et plans de prise en charge), d’affiches et de la liste anonymisée des patients concernés issus de la FHDH. Évaluation en 2011 de l’adéquation de la prise en charge de l’IRC des patients éligibles avant (30/04/2009) et deux ans après le début de l’intervention
EPI-CLIN 2014 / Revue d’Épidémiologie et de Santé Publique 62S (2014) S113–S132 (30/04/2011). La prise en charge était estimée adéquate en cas de consultation de néphrologie ou de mesure de la protéinurie, de la TA, du LDL cholestérol et de la glycémie dans l’année précédente et de prise en charge thérapeutique selon les résultats. L’évolution au cours du temps de l’adéquation de la prise en charge était comparée entre le bras intervention et le bras témoin en testant l’interaction entre le bras de randomisation (intervention versus témoin) et le temps (2011 versus 2009) sur l’adéquation de la prise en charge à l’aide d’un modèle de régression logistique mixte incluant les facteurs de confusion potentiels (dernière charge virale, DFGe, ténofovir et région du soin) comme effets fixes, et les centres et les patients comme effets aléatoires. Résultats.– Parmi 306 individus inclus le 30/04/2009, 217 (71 %) étaient des hommes, l’âge médian était 57 ans (interquartile range, 48–65), le DFGe médian (MDRD) 52 mL/min/1,73 m2 (39–62) et les CD4 médians 440/mm3 (296–635). Tous sauf 8 recevaient un traitement antirétroviral, 250 (82 %) avaient une charge virale < 50 cp/mL. Le 30/04/2011, 16 patients avaient débuté une dialyse, 22 étaient décédés, 30 étaient perdus de vue. Entre le 30/04/2009 et le 30/04/2011, le pourcentage de prise en charge adéquate passait de 64,1 % à 70,4 % (+6,3 %) dans le bras intervention et de 68,3 % à 75,6 % (+7,3 %) dans le bras contrôle, sans différence d’amélioration liée à l’intervention (test d’interaction : p = 0,95). Des résultats similaires étaient obtenus quand les patients n’étant plus dans le soin en 2011 étaient exclus ou étaient considérés comme pris en charge de fac¸on non adéquate en 2011. Conclusion.– L’adéquation aux recommandations s’est améliorée légèrement dans les deux groupes entre 2009 et 2011. Dans cet essai randomisé en cluster, la promotion active des recommandations n’a pas amélioré les pratiques par rapport à la diffusion habituelle des recommandations. http://dx.doi.org/10.1016/j.respe.2014.05.006 1.5
Comment détecter le biais de sélection dans les essais randomisés en clusters ? Intérêt du score de propension C. Leyrat , A. Caille , B. Giraudeau CIC Inserm1415, CHRU de Tours, Tours, France Mots clés : Biais de sélection ; Essai en clusters ; Score de propension ; Statistique c Introduction.– Les essais randomisés en clusters sont des essais dans lesquels l’unité de randomisation n’est pas l’individu lui-même mais son unité d’appartenance (famille, hôpital. . .). Malgré la randomisation, ces essais peuvent être sujets à biais de sélection, en particulier lorsqu’il n’y a pas d’aveugle et que les individus sont identifiés et inclus après la randomisation. Il est donc nécessaire de pouvoir détecter la présence d’un tel biais pour en tenir compte lors de l’analyse statistique. Les tests univariés de comparaison des groupes à l’inclusion sont déconseillés dans le contexte des essais randomisés. Nous avons donc développé un outil, utilisant le modèle de score de propension, permettant de détecter la présence d’un biais de sélection à partir des données mesurées à l’inclusion. Méthodes.– Cet outil repose sur la statistique c du modèle de score de propension, c’est-à-dire du modèle contenant les facteurs de confusion potentiels mesurés à l’inclusion. En effet, en présence d’un biais de sélection, certaines covariables prédictives de la réponse sont également associées au traitement rec¸u, et donc le modèle contenant les variables déséquilibrées permet de prédire l’attribution du traitement. Dans un premier temps, nous avons développé un abaque fournissant, pour un effectif, un nombre de covariables et un nombre de clusters donnés, la valeur seuil de la statistique c au-delà de laquelle nous pouvons considérer la présence d’un biais de sélection. Dans un second temps, une étude de simulation a été conduite pour évaluer les performances de cette méthode dans différentes configurations, en particulier lorsqu’il existe une corrélation intra-cluster des covariables. Résultats.– Les résultats ont montré que la méthode proposée a de très bonnes performances pour détecter le biais lorsque les effectifs sont élevés (> 500 par bras), et que ces performances augmentent lorsque le nombre de covariables déséquilibrées augmente ou lorsque les déséquilibres entre les covariables augmentent. Pour des effectifs faibles à modérés (50 et 100 par bras), les performances diminuent en cas d’inclusion dans le score de propension de
S115
variables équilibrées, suggérant la nécessité d’une sélection des variables a priori. Conclusion.– La statistique est donc un outil adapté pour détecter les biais de sélection dans les essais en clusters. Cependant, afin d’optimiser les performances de cette approche pour les effectifs modérés, une stratégie de sélection préalable des covariables à inclure dans le modèle de score de propension est actuellement à l’étude. http://dx.doi.org/10.1016/j.respe.2014.05.007
Session 2 – Essais cliniques : conception, réalisation, analyses (II) 2.1
Une nouvelle approche pour intégrer les données de toxicité de l’ensemble des cycles de traitement et leur grade, dans l’analyse des essais de phase I de recherche de dose en oncologie A. Dousseau a,b , R. Thiebaut a,c,d , B. Geoerger e , M.-C. Le Deley e , P. Schöffski f , P. Fumoleau g , S. Mathoulin-Pélissier d,h , E. Rizzo i , C. Le Tourneau b , X. Paoletti b,j a Inserm U897, Bordeaux, France b Institut Curie, Paris, France c CHU de Bordeaux, Bordeaux, France d Université Bordeaux, Bordeaux, France e Institut Gustave-Roussy, Villejuif, France f Leuven Cancer Institute, Leuven, Belgique g Centre de lutte contre le cancer Georges-Fran¸ cois-Leclerc, Dijon, France h Institut Bergonié, Bordeaux, France i EORTC, Bruxelles, Belgique j Inserm U900, Paris, France Mots clés : Essais cliniques ; Recherche de dose ; Modèle mixtes ; Modèle ordinal ; Toxicité Introduction.– Les données de toxicité au-delà du premier cycle de traitement apportent des informations complémentaires sur la dose maximale tolérée identifiée dans les essais de recherche de dose en oncologie. Nous avons analysé rétrospectivement les données de trois essais pour illustrer deux indicateurs : la probabilité de toxicité ordonnée par cycle, et le risque de toxicité sur la durée de traitement. Méthodes.– Les données de deux essais menés selon un schéma adaptatif avec attribution des doses guidées par un modèle logistique basé sur un critère de toxicité binaire évalué sur la période d’initiation du traitement (E1 : aviscumine pour les tumeurs solides, avec une durée de traitement courte ; E2 : erlotinib + radiothérapie dans les gliomes du tronc cérébral de l’enfant, avec un traitement plus long) et d’un essai algorithmique selon le schéma 3 + 3 (E3 : liposomal doxorubicin + cyclophosphamide, en association, pour les carcinomes ovariens). La probabilité de toxicité modérée ou grave, et de toxicité grave par cycle ont été estimées par un modèle logistique mixte à cotes proportionnelles, ou modèle ordinal mixte. La variable ordinale répétée modélisée était la toxicité la plus sévère observée par cycle, en trois modalités (grave/modéré/pas de toxicité). Le gain de précision des estimations de ce modèle a été évalué par rapport aux conclusions initiales de l’essai. Le risque cumulé de toxicité grave sur la durée de traitement a été évalué par un modèle logistique pondéré selon la durée de traitement. Résultats.– Quatre-vingt-trois patients ont été inclus dans les trois essais ; 94, 96 et 72 cycles de traitement ont été administrés, respectivement. Les cycles dont la toxicité la plus sévère était une toxicité modérée étaient au moins deux fois plus fréquents que les cycles avec toxicité grave. Les approches analysant les données sur l’ensemble des cycles étaient peu pertinentes pour l’essai E1 pour lequel la majorité des patients n’ont rec¸u qu’un à deux cycles de traitement. Dans l’essai