EPICLIN 2018 / Revue d’Épidémiologie et de Santé Publique 66 (2018) S171–S189 PM3.5
PM3.6
Tests multiples corrélés et contrôle du « Family-Wise Error Rate » (FWER) dans une application R Shiny interactive
Typologie des comportements de jeu sur Internet et identification des pratiques à risque : analyse en classes latentes multi-niveaux à partir des données d’un opérateur de jeu en ligne
A. Aurousseau ∗ , F. Gillaizeau , C. Maudet , P. Vaissié , S. Leuillet Biofortis Mérieux NutriSciences, Saint-Herblain, France ∗ Auteur correspondant. Adresse e-mail :
[email protected] (A. Aurousseau) Introduction Tester de multiples hypothèses est fréquent dans les études cliniques et les études génomiques. Quand plusieurs hypothèses sont testées simultanément, il est connu que le « Family-Wise Error Rate » (FWER), c’està-dire, la probabilité d’au moins un résultat significatif alors que l’ensemble des hypothèses nulles est vrai (faux positif), augmente. Plusieurs procédures de corrections ont été proposées pour maintenir le FWER au niveau alpha. Cependant, la majorité d’entre elles font l’hypothèse d’indépendance entre les tests alors que les tests multiples se produisent généralement sur des données corrélées, ce qui réduit le FWER. La problématique des tests multiples corrélés et du contrôle du FWER reste mal appréhendée dans la communauté scientifique. Méthodes Pour visualiser l’effet de la corrélation des tests statistiques sur le FWER, une application R Shiny a été développée. Deux variables A et B sont simulées suivant une loi Normale centrée réduite. Chaque point de coordonnées (a, b) est tracé et représente le résultat de deux tests Z de comparaison d’une moyenne observée à une moyenne théorique qui seraient réalisés dans un échantillon. L’utilisateur peut choisir le coefficient de corrélation entre les deux tests et le nombre d’observations de l’échantillon. L’application R Shiny permet de visualiser les faux positifs de chaque test et fournit les estimations du FWER selon trois procédures ne prenant pas en compte la corrélation : sans ajustement, Bonferroni et Sidak. Le FWER correspond à la proportion des points du graphique dont une des coordonnées dépasse en valeur absolue le quantile d’ordre 1-alpha/2 de la loi Normale. Cet alpha varie selon la procédure : alpha = 0,05 sans ajustement (quantile égal à 1,960), alpha = 0,05/2 avec correction de Bonferroni (quantile égal à 2,241) et alpha = 1 − (1 − 0,05)1/2 avec correction de Sidak (quantile égal à 2,237). Résultats Avec un million d’observations et une corrélation rho = 0, sans ajustement une inflation du risque alpha est observée avec un FWER égal à 9,74 % (proche du FWER théorique de 9,75 %) tandis qu’avec les procédures de Bonferroni et Sidak l’inflation du risque alpha est contrôlée avec un FWER obtenu de 4,94 % et 5,02 %, proche du risque alpha souhaité de 5 %. Avec une corrélation élevée rho = 0,95, sans ajustement le FWER obtenu est égal à 6,47 % tandis qu’avec les procédures de Bonferroni et Sidak le FWER est trop conservateur avec des valeurs respectives égales à 3,30 % et 3,35 %. Conclusion L’application R Shiny développée permet d’introduire de manière interactive le concept des tests multiples (corrélés ou non) et leur impact sur le FWER. Ce travail confirme que les ajustements de Bonferroni et Sidak sont trop conservateurs lorsque les tests sont corrélés. Plusieurs extensions de ce travail sont en cours : l’implémentation de procédures prenant en compte la corrélation entre les tests (pour détendre les p-valeurs et augmenter la puissance des tests des procédures classiques telles que Bonferroni) ainsi qu’une généralisation à trois tests corrélés associée à une visualisation en 3D. Mots clés Tests multiples ; FWER ; Corrélation ; R Shiny Déclaration de liens d’intérêts d’intérêts.
Les auteurs déclarent ne pas avoir de liens
https://doi.org/10.1016/j.respe.2018.03.296
S175
B. Perrot a,b,c,∗ , J.-B. Hardouin a,c , M. Grall-Bronnec a,b , G. Challet-Bouju a,b a Inserm, SPHERE U1246 « Methods in Patient-centered outcomes and Health Research », Université de Tours, Université de Nantes, Nantes, France b Unité d’investigation clinique « Addictologie, psychiatrie & pédopsychiatrie », Institut fédératif des addictions comportementales (IFAC), CHU de Nantes, Nantes, France c Plateforme de méthodologie et de biostatistique, Direction de la recherche clinique et de l’innovation, CHU de Nantes, Nantes, France ∗ Auteur correspondant. Adresse e-mail :
[email protected] (B. Perrot) Introduction La majorité des individus jouant à des jeux de hasard et d’argent (JHA) jouent de manière contrôlée et récréative. Mais certains joueurs perdent le contrôle de leur pratique de jeu et développent une addiction aux JHA entraînant des conséquences négatives d’ordre social, personnel ou professionnel. On estime que 17 % des individus ayant joué à des JHA sur Internet au moins une fois dans l’année ont souffert de problèmes liés au jeu, contre 3,9 % pour les jeux hors ligne. Cela semble confirmer le caractère a priori plus addictogène des JHA en ligne. La pratique des JHA sur Internet génère de nombreuses données récoltées en continu par les opérateurs de jeu (argent misé, nombre de paris, argent déposé sur le compte, retraits d’argent, etc.) qui pourraient permettre de caractériser les comportements de jeu en ligne et d’identifier les caractéristiques des comportements de jeu à risque. Nous proposons d’établir une typologie des comportements de jeu en ligne à l’aide d’un modèle à classes latentes multi-niveaux. Méthodes Nous avons utilisé les données d’activité de jeu de 10 000 utilisateurs tirés au sort parmi les clients d’un opérateur de jeu en ligne franc¸ais. Pour chaque utilisateur, on disposait de données agrégées au niveau mois pour une période d’observation maximale de 12 mois. Un modèle à classes latentes multi-niveaux a été utilisé, le premier niveau correspondant aux joueurs-mois (les observations mensuelles d’activité de jeu de chaque joueur, 12 observations par joueur), et le second niveau correspondant aux joueurs. Les joueurs-mois ont une certaine probabilité d’appartenir à des « clusters » définis par des comportements de jeu mensuels particuliers, et les joueurs ont une certaine probabilité d’appartenir à des « classes » en fonction de leur propension à être dans tel ou tel cluster au cours des mois. Les variables utilisées étaient des indicateurs généraux de l’activité de jeu (argent misé, nombre de prises de jeu, etc.) et des indicateurs plus spécifiques aux comportements à risque (dépôts d’argent rapprochés, augmentation des montants misés, etc.). Résultats Un modèle à six clusters et cinq classes a été retenu. Le cluster 1 (40 % des joueurs-mois) correspondait à une inactivité de jeu (pas d’argent misé ou déposé sur le compte). Les clusters 2 (17 %), 3 (15 %) et 4 (15 %) correspondaient à une activité de jeu moyenne. Le cluster 5 (10 %) correspondait à une forte activité de jeu. Le cluster 6 (3 %) correspondait à une très forte activité de jeu (459 euros misés et 205 prises de jeu par mois) et était caractérisé par de nombreux jeux différents joués (11 jeux différents). La probabilité d’observer des dépôts rapprochés était de 57 %. Ce cluster était aussi caractérisé par une proportion élevée de jeux de grattage et de loteries immédiates (80 % des prises de jeu) par rapport aux loteries différées. Enfin, la proportion de femmes dans ce cluster était de 45 %, alors qu’elles représentaient 32 % de l’échantillon global. Au niveau des classes, en particulier, les joueurs de la classe 5 (4 % des joueurs) avaient une probabilité de 68 % d’être dans le cluster 6. Conclusion Les données de jeu individuelles ont permis d’identifier un cluster composé de 3 % des observations qui semble être associé à des comportements de jeu à risque. La proportion élevée de jeux de grattage et la forte proportion de femmes dans ce cluster pourront permettre la mise en place de mesures de prévention adaptées auprès de cette population. Mots clés Typologie ; Problèmes de jeu ; Modèle à classes latentes ; Jeu en ligne Déclaration de liens d’intérêts B. Perrot et J-B. Hardouin déclarent ne pas avoir de liens d’intérêts. M. Grall-Bronnec et G. Challet-Bouju déclarent que le
S176
EPICLIN 2018 / Revue d’Épidémiologie et de Santé Publique 66 (2018) S171–S189
fonds de dotation du CHU de Nantes perc¸oit des dons, sous forme de mécénat d’entreprise, de la part de la FDJ et du PMU. L’indépendance, en particulier scientifique, vis-à-vis de ces opérateurs est garantie.
Tableau 1 Comparaison des résultats des études randomisées et des cohortes post-AMM.
https://doi.org/10.1016/j.respe.2018.03.297
Session 4 – Méthodologie des essais cliniques PM4.1
Quel apport des études de vraie vie par rapport aux études randomisées avec les anticoagulants oraux directs (AOD) ? M. Safieddine a , C. Chapelle b , E. Ollier c , L. Bertoletti d , F. Bellet e , P. Mismett c , M. Cucherat f , S. Laporte c,∗ a DVH Sainbiose UMR U1059, université Jean-Monnet, Saint-Étienne, France b Unité de recherche clinique, innovation, pharmacologie, CHU de Saint-Étienne, France c DVH Sainbiose, UMR U1059, unité de recherche clinique, innovation, pharmacologie, CHU de Saint-Étienne, université Jean-Monnet, Saint-Étienne, France d DVH Sainbiose UMR U1059, Inserm CIC1408, F-CRIN InnoVTE network, service de médecine vasculaire et thérapeutique, CHU de Saint-Étienne, université Jean-Monnet, Saint-Étienne, France e Centre régional de pharmacovigilance, CHU de Saint-Étienne, France f UMR CNRS 5558 Évaluation et modélisation des effets thérapeutiques, université Claude-Bernard Lyon 1, Lyon, France ∗ Auteur correspondant. Adresse e-mail :
[email protected] (S. Laporte) Introduction Les études randomisées sont la méthode de référence pour l’évaluation d’un nouveau traitement. Mais on leur reproche d’être peu représentatives de la vraie vie, du fait d’une sélection assez stricte des patients. La conduite de cohortes post-AMM plus larges, en population générale, est donc vivement encouragée par les autorités de santé. Elles intègrent généralement une correction du biais de sélection/indication par l’utilisation d’un score de propension. Nous avons utilisé les méthodes méta-analytiques pour comparer les populations et les événements d’efficacité et de sécurité entre les études randomisées et les études de cohortes avec les anticoagulants oraux directs (AOD) dans le traitement des événements thromboemboliques veineux. Méthodes Une recherche exhaustive dans différentes bases électroniques (Pubmed, Cochrane Database, Google Scholar) a permis d’identifier les études randomisées et les études de cohortes ayant étudié les AOD versus le traitement standard (antivitamines K [AVK]) dans le traitement des événements thromboemboliques veineux sur le risque de récidives et les hémorragies majeures. Les méta-analyses ont été réalisées avec la méthode du logarithme des risques relatifs (RR) en pondérant les études par l’inverse de la variance. Résultats Six études randomisées et cinq études de cohortes (trois prospectives) ont été incluses (Tableau 1). Les patients traités par AOD dans les cohortes prospectives étaient proches de ceux des études randomisées. La méta-analyse de ces cohortes donne des résultats superposables à celle des essais randomisés, malgré une perte de précision (Tableau 1). Les différences apparaissent surtout avec les études rétrospectives en termes de caractéristiques de population. Discussion Les études de cohortes prospectives de vraie vie telles que conduites avec les AOD n’ont pas permis d’apporter d’information supplémentaire par rapport aux études randomisées, probablement parce que les investigateurs ont respecté les indications de traitement par peur du risque hémorragique ou par effet Hawthorne. Les larges cohortes rétrospectives semblent plus représentatives de la vraie vie, mais le biais de sélection/indication reste moins bien contrôlé du fait du faible nombre de variables disponibles pour l’ajustement. Le même travail est en cours avec les études dans la fibrillation atriale. Mots clés Études post-AMM ; Essais randomisés ; Meta-analyses
* : après appariement ou ajustement sur le score de propension ou modèle multivarié.
Déclaration de liens d’intérêts d’intérêts.
Les auteurs déclarent ne pas avoir de liens
https://doi.org/10.1016/j.respe.2018.03.298 PM4.2
Guip1 : une interface graphique pour la planification des essais cliniques de phase I J. Fraisse a,∗ , D. Dinart b , D. Tosi a , A. Mauguen c , Y. Laghzali a , C. Touraine a , M.-C. Le Deley d,e , C. Bellera b,f,g , C. Mollevi a,h a Institut du cancer de Montpellier (ICM), université de Montpellier, Montpellier, France b Inserm CIC1401, Module épidémiologie clinique, Institut Bergonié, Bordeaux, France c Memorial Sloan Kettering Cancer Center, New-York, États-Unis d Centre Oscar Lambret, Lille, France e Inserm, UVSQ, CESP, université Paris-Saclay, université Paris-Sud, Villejuif, France f Unité de recherche et d’épidémiologie clinique, Institut Bergonié, Centre de lutte contre le cancer, Bordeaux, France g Inserm U1219, Bordeaux Population Health Center, Équipe Epicene, Bordeaux, France h Inserm U1194, Institut de recherche en cancérologie de Montpellier, Montpellier, France ∗ Auteur correspondant. Adresse e-mail :
[email protected] (J. Fraisse) Introduction L’objectif principal des essais cliniques de phase I en oncologie est d’identifier le plus rapidement possible et le plus précisément la dose maximale tolérée, définie classiquement comme la dose à laquelle on observe des toxicités intolérables pour une proportion donnée de patients. Plusieurs méthodes d’escalade de dose basées sur une modélisation mathématique de la relation dose-toxicité ont été développées. Dans ce contexte, la méthode de réévaluation continue (« Continual Reassessment Method » [CRM]) introduite par O’Quickley et al. (bayésienne ou fréquentiste) a émergé dans les années 1990. Plus récemment, des variantes telles que l’« Escalation With Overdose Control » (EWOC) qui intègre en plus la contrainte éthique de minimiser la probabilité de traiter des patients à des doses excessivement élevées et les méthodes « Time To Event » (TITE-CRM et TITE-EWOC) qui prennent en compte le délai d’apparition de l’évènement pour les toxicités tardives ont été proposées. Plusieurs logiciels implémentent chacune des méthodes, cependant, aucun ne les rassemble. L’objectif de ce travail est de proposer une interface graphique conviviale et facile à utiliser qui combine l’ensemble des approches et implémente la méthode TITE-EWOC. Méthodes Différents packages R et fonctions implémentant ces méthodes ont été sélectionnés. La fonction « crm » du package « dfcrm » pour implémenter les méthodes CRM ainsi que la fonction « titecrm » de la même librairie pour la méthode TITE-CRM. La fonction « bcrm » du package du même nom pour la méthode EWOC. Enfin, la méthode TITE-EWOC qui n’était pas disponible sous R a été programmée. Une interface graphique « GUIP1 » pour « Graphical User