Disponible en ligne sur
ScienceDirect www.sciencedirect.com Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131
Revue ge´ne´rale
Surveillance et de´tection des e´ve´nements inhabituels en toxicovigilance : revue des me´thodes pertinentes Surveillance and detection of unusual events in toxicovigilance: Review of relevant methods L. Faisandier a,*, A. Fouillet a, D.J. Bicout b, F. Golliot c, I. Ahmed d, S. Bringay e, D. Eilstein a a
b
Institut de veille sanitaire, 12, rue du Val-d’Osne, 94415 Saint-Maurice cedex, France Unite´ biomathe´matiques et e´pide´miologie, laboratoire TIMC, E´cole nationale ve´te´rinaire de Lyon, 1, avenue Bourgelat, BP 83, 69280 Marcy-l’E´toile, France c Cire Languedoc-Roussillon, 28, Parc-Club du Mille´naire, 1025, rue Henri-Becquerel, CS 30001, 34067 Montpellier cedex 2, France d Inserm, UMRS U1018, centre de recherche en e´pide´miologie et sante´ des populations, 16, avenue Paul-Vaillant-Couturier, 94807 Villejuif, France e UMR 5506 UM3, centre Lirmm, 161, rue Ada-Route-de-Mende, 34199 Montpellier, France Rec¸u le 17 mars 2014 ; accepte´ le 8 janvier 2015 Disponible sur Internet le 26 mars 2015
Abstract Background. – Declared cases of exposures related to potential toxic agents are reported through a national database, the French Network of Poison Centers, and account on average for 200,000 cases per year, including 75,000 to 80,000 symptomatic cases. These data are currently used to investigate signals from local, national or international institutional partners (such as hospitals, local health authorities, and the Rapid Alert System for Food and Feed). Our objective is to complete this classical toxicovigilance activity through the automated detection of unexpected or unusual events in order to identify precociously signals representing potential threats for public health. To reach this objective, the inventory of surveillance and detection methods of unexpected events is necessary. Methods. – A literature review was conducted via Scopus1 and Pubmed1 databases, completed with grey literature and data available on worldwide vigilance systems’ websites. Results. – The most commonly used methods are disproportional measures in the field of pharmacovigilance, some of which are subject to a routine detection at regular time intervals. Criteria of signal generation differ from one system to another, which have implemented data filtering strategies before or after analysis, in order to decrease the number of generated signals and improve their priority level. These signals are then transmitted to an experts committee for a clinical and epidemiological evaluation, and at times, for informing the patient’s medical records. We also notice an interest in other approaches such as surveillance methods of temporal series or symbolic methods for associative rules extraction between one or more drugs and one or more adverse effects, with the possibility to include other types of variables, such a demographic data. The developments of probabilistic-based algorithms have also been recently developed, opening new opportunities. Conclusion. – These surveillance and detection methods are of high interest for the automated detection of signals from the French toxicovigilance network. The initial step to developing these methods consists in studying the statistical quality of data and targeting the needs and expectations of the toxicovigilance network for what we want and what we can detect. # 2015 Published by Elsevier Masson SAS. Keywords: Surveillance; Detection; Vigilance; Toxicovigilance; Poisoning center; Data mining
Re´sume´ Position du proble`me. – Les cas de´clare´s d’exposition associe´s a` des agents potentiellement toxiques sont collecte´s dans une base nationale et repre´sentent en moyenne 200 000 cas annuels dont 75 000 a` 80 000 cas symptomatiques. Ces donne´es sont actuellement exploite´es pour documenter des signaux e´manant de partenaires institutionnels locaux (centre hospitalier, agence re´gionale de sante´), nationaux (agence sanitaire) ou internationaux (Rapid Alert System for Food and Feed [RASFF]). Le re´seau de toxicovigilance souhaite de´velopper un programme de de´tection automatise´e des e´ve´nements inhabituels dans le but d’identifier le plus toˆt possible des signaux pre´sentant une menace potentielle pour la sante´
* Auteur correspondant. Adresse e-mail :
[email protected] (L. Faisandier). http://dx.doi.org/10.1016/j.respe.2015.01.072 0398-7620/# 2015 Publie´ par Elsevier Masson SAS.
L. Faisandier et al. / Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131
120
publique. Pour re´pondre a` l’objectif de ce programme, il est ne´cessaire de dresser l’inventaire des me´thodes pour la surveillance et la de´tection automatise´e des e´ve´nements inhabituels pouvant eˆtre utilise´es dans le cadre de la toxicovigilance. Me´thodes. – Une revue de la litte´rature a e´te´ conduite via Scopus1 et Pubmed1, comple´te´e par la litte´rature grise ainsi que par la consultation des informations disponibles sur les sites Internet des syste`mes de vigilance. Re´sultats. – Les me´thodes les plus couramment utilise´es, notamment pour la pharmacovigilance, sont les mesures de disproportion. Certaines d’entre elles sont utilise´es pour une activite´ de de´tection en routine. Les crite`res de ge´ne´ration de signal diffe`rent peu selon les syste`mes mais ces derniers ont mis en place des strate´gies de filtrage des donne´es, pre´- ou post-analyse, afin de re´duire la quantite´ de signaux ge´ne´re´s et d’ame´liorer leur priorisation. Ces signaux sont ensuite transmis a` un comite´ d’experts pour une e´valuation clinique et e´pide´miologique, et e´ventuellement pour un retour au dossier me´dical du patient. On note ne´anmoins un inte´reˆt pour d’autres approches, telles que les me´thodes de surveillance des se´ries de donne´es temporelles ou encore les me´thodes symboliques utilise´es jusqu’a` pre´sent en pharmacovigilance. Ces dernie`res permettent d’extraire des re`gles d’association entre un ou plusieurs me´dicaments et un ou plusieurs effets secondaires, avec la possibilite´ d’inte´grer d’autres variables telles que de´mographiques. Le de´veloppement d’algorithmes spe´cifiques base´s sur des approches probabilistes empiriques a e´galement fait l’objet de re´cents travaux de recherche. Conclusion. – Les me´thodes de de´tection de signal utilise´es en pharmacovigilance pre´sentent un inte´reˆt certain pour le programme de de´tection automatise´e du signal en toxicovigilance. Une e´tape pre´alable au de´veloppement de ces approches ne´cessite d’e´tudier la qualite´ statistique des donne´es et de cibler les e´ve´nements de´tectables et a` de´tecter en fonction des donne´es disponibles. # 2015 Publie´ par Elsevier Masson SAS. Mots cle´s : Surveillance ; De´tection ; Vigilance ; Toxicovigilance ; Centre antipoison ; Fouille de donne´es
1. Introduction Les vigilances sont des activite´s indispensables a` la mise en œuvre des dispositifs de se´curite´ sanitaire. De´finie par l’article R. 1341-11 du Code de la sante´ publique, la toxicovigilance a pour objet la surveillance des effets toxiques pour l’homme, d’un produit, d’une substance ou d’une pollution afin de mener des actions d’alerte, de pre´vention, de formation et d’information. La pharmacovigilance, ayant pour objet la surveillance spe´cifique du risque d’effet inde´sirable re´sultant de l’utilisation des me´dicaments (article R. 5144-1 du Code de la sante´ publique), sera e´galement aborde´e dans cet article. En France, le syste`me de toxicovigilance est coordonne´ depuis 2004 par l’Institut de veille sanitaire (InVS) et fonde´ sur le re´seau national des centres antipoison et de toxicovigilance (CAPTV), re´partis sur le territoire franc¸ais. Les CAPTV sont charge´s de re´pondre, notamment en cas d’urgence, « a` toute demande d’avis ou de conseil concernant le diagnostic, le pronostic et le traitement des intoxications humaines, accidentelles ou volontaires, individuelles ou collectives, aigue¨s ou non, provoque´es par tout produit ou substance naturelle ou de synthe`se, disponible sur le marche´ ou pre´sent dans l’environnement » (de´cret no 96-833 du 17 septembre 1996). Ces centres sont rassemble´s autour d’un syste`me d’information commun, appele´ le syste`me d’information des centres antipoison (Sicap), comprenant : une Base nationale des cas d’intoxication (BNCI) qui enregistre des de´clarations spontane´es de cas d’exposition symptomatiques et asymptomatiques, et des demandes d’information relatives a` l’utilisation d’un produit ou d’une substance ; une Base nationale des produits et compositions (BNPC) qui enregistre via le portail de de´claration Synapse1 et au fur et a`
1
Lien : www.declaration-synapse.fr.
mesure de l’occurrence des cas d’intoxication, des donne´es relatives aux substances et aux pre´parations commerciales soumises a` l’e´tiquetage ainsi qu’aux champignons, ve´ge´taux et animaux potentiellement en cause dans la survenue de signes cliniques. La principale source de ces donne´es repose aujourd’hui sur la re´ponse toxicologique a` l’urgence (RTU) re´alise´e 24 h/24 et 7j/7, accessible gratuitement pour les particuliers, industriels et professionnels de sante´. Chaque anne´e, le Sicap enregistre de manie`re structure´e et standardise´e, 200 000 cas d’exposition en moyenne, dont 75 000 a` 80 000 cas d’exposition symptomatiques [1]. ` ce jour, ces bases de donne´es sont interroge´es A pour re´pondre a` une sollicitation ou une saisine aboutissant a` une e´valuation toxicologique d’un produit ou d’une substance et a` la publication d’un rapport d’expertise2. Ces donne´es sont e´galement exploite´es de manie`re ponctuelle pour documenter des signaux d’alarme e´manant des syste`mes de surveillance externes, comme le dispositif Rapid Alert System Food & Feed (RASFF) ou le Rapid Alert System for Chemicals (RASChem). Enfin, les CAPTV participent activement a` la « remonte´e de signal ». En effet, les enregistrements issus de la RTU font l’objet d’une e´valuation, notamment en termes d’imputabilite´, par les toxicologues en charge de la re´ponse, qui alertent l’InVS et/ou l’Agence re´gionale de sante´ (ARS) en cas de risque potentiel pour la sante´ publique. Une requeˆte dans la BNCI permet alors de rechercher des cas similaires et de documenter les signaux. L’exploitation actuelle des donne´es collecte´es ne garantit pas une de´tection et une remonte´e de signal optimale. En effet, la de´tection ne´cessite d’eˆtre comple´te´e par l’utilisation de me´thodes automatise´es permettant de garantir une vision nationale des cas enregistre´s et de prendre en compte l’historique des enregistrements dans la base de donne´es. 2
Lien : http://www.centres-antipoison.net/CCTV/index.html.
L. Faisandier et al. / Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131
L’enregistrement syste´matique des cas dans le Sicap offre l’opportunite´ d’identifier des e´ve´nements pouvant re´ve´ler une menace pour la sante´ publique. La de´tection de signal automatise´e ne remplace pas l’intuition et l’expertise des toxicologues mais apporte une aide de´cisionnelle, comple´mentaire a` l’activite´ classique de toxicovigilance. En conse´quence, le re´seau souhaite de´velopper un outil de surveillance et de de´tection de signal automatise´e afin d’identifier, le plus toˆt possible, des e´ve´nements inhabituels et permettre le de´clenchement rapide d’une alerte et la prise de mesures de gestion approprie´es afin de pre´venir la survenue de nouveaux cas ou de nouvelles situations a` risque. Ainsi, deux programmes sont actuellement en cours de de´veloppement :
121
temporelles de de´tection de signal utilise´es dans le domaine des vigilances sanitaires, notamment en pharmacovigilance, hors de´tection spatiale, spatio-temporelle et textuelle, dont les mots suivants figurent dans le titre, les mots cle´s ou le re´sume´ des publications parues depuis 2000 a` 2013 : vigilance, signal, poison, database, data mining, automatic detection, abnormal event, early detection, early warning system. Une deuxie`me requeˆte4 a porte´ sur les me´thodes de de´tection temporelle des e´ve´nements inhabituels ou inattendus, applique´es plus largement au domaine de la sante´ et publie´es de 2000 a` 2013 avec les mots cle´s suivants : detection, automated, event, health, abnormal, anomaly, aberration, unexpected. 3. Re´sultats
un programme de surveillance (syste´matique) et automatise´e d’e´ve´nements connus et saisonniers avec l’e´laboration d’indicateurs pour le suivi en routine de certains agents (par exemple la surveillance saisonnie`re des cas d’intoxication par champignons ou la surveillance saisonnie`re des envenimations par physalies) ; un programme de de´tection automatise´e des e´ve´nements inhabituels avec l’utilisation de me´thodes d’extraction des connaissances (ECBD ou Knowledge Discovery in Databases [KDD]) appele´es plus couramment me´thodes de fouille de donne´es (data mining). Notre travail s’inscrit dans le programme de de´tection automatise´e du signal visant a` de´tecter des e´pisodes d’intoxication dont la survenue e´chapperait au dispositif actuel tels que : la recrudescence inexplique´e de cas impliquant un meˆme produit ou un meˆme syndrome ; un couple agent-symptoˆme nouveau ou en recrudescence ; une interaction potentielle entre agents ou substances ; des comportements a` risque ou des usages inhabituels lie´s a` l’utilisation d’un produit ou d’une substance ; un regroupement temporel et/ou ge´ographique de cas d’exposition symptomatiques. Les objectifs de ce document sont de dresser l’inventaire des me´thodes pour la surveillance et la de´tection des e´ve´nements inhabituels, d’e´tudier les modalite´s de ge´ne´ration de signal et d’examiner les processus de filtrage et d’e´valuation des signaux ge´ne´re´s en vue d’une application aux donne´es de toxicovigilance des CAPTV franc¸ais. 2. Me´thode Dans un premier temps, les re´fe´rences ont e´te´ collecte´es par consultation des bases de donne´es bibliographiques via Scopus1. Une premie`re requeˆte3 a porte´ sur les approches 3
Requeˆte 1 Scopus : ((TITLE-ABS-KEY(detection) OR TITLE-ABSKEY(early) OR TITLE-ABS-KEY(warning) OR TITLE-ABS-KEY(abnormal)) AND PUBYEAR > 1999) AND ((TITLE-ABS-KEY(data mining) OR TITLE-ABS-KEY(datamining)) AND PUBYEAR > 1999) AND (TITLEABS-KEY(vigilance) AND PUBYEAR > 1999).
Les dispositifs ayant teste´ ou mis en place en routine des me´thodes pour la surveillance et la de´tection des e´ve´nements inhabituels sont ge´ne´ralement organise´s en macro-processus (Fig. 1). Les points de´veloppe´s dans cette section sont, autant que possible, illustre´s par des exemples. 3.1. Pre´paration des donne´es ` partir de la base de donne´es « brute », la pre´paration des A donne´es est une e´tape pre´liminaire, non spe´cifique a` l’application des me´thodes pour la surveillance et la de´tection des e´ve´nements inhabituels ; cette pre´paration se fait au niveau de la se´mantique (regroupement de codages par exemple) et au niveau de la qualite´ statistique des donne´es. 3.1.1. Regroupement de codages Une des limites bien identifie´e des syste`mes de recueil de donne´es re´side dans l’utilisation des the´saurus (ou re´fe´rentiel de codage des variables d’inte´reˆt). Pour pallier les difficulte´s engendre´es par le choix de codes redondants ou impre´cis, certains dispositifs font appel a` un comite´ d’experts pour regrouper des codes, en syndromes par exemple, ou a` des me´thodes automatise´es (data mining ou text mining) pour caracte´riser les pratiques usuelles de codage et proce´der a` des regroupements. Par exemple, les noms des me´dicaments dans la version publique de la base de donne´es Adverse Event Reporting System (AERS) ont e´te´ unifie´s par des noms ge´ne´riques avec une approche de text mining, les fautes d’orthographes saisies dans les champs de texte libre sont corrige´es a` l’aide du logiciel GNU Aspell et les remplacements sont confirme´s par les pharmaciens [2]. Un autre exemple illustre le regroupement de codages avec des me´thodes de classification statistique (unsupervised clustering) de´veloppe´es sur les donne´es du re´seau de 4
Requeˆte 2 Scopus : ((TITLE-ABS-KEY(detection) AND TITLE-ABSKEY(health) AND TITLE-ABS-KEY(automat) AND TITLE-ABS-KEY (event)) AND PUBYEAR > 1999) AND ((TITLE-ABS-KEY(abnormal) OR TITLE-ABS-KEY(anomaly) OR TITLE-ABS-KEY(aberration) OR TITLEABS-KEY(unexpected)) AND PUBYEAR > 1999).
[(Fig._1)TD$IG] 122
L. Faisandier et al. / Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131 Applicaon des méthodes pour la surveillance et la détecon des événements inhabituels
Données Préparaon des données
Base de données « brute » • •
Regroupements de codages Qualité stasque des données
Filtrage des données • •
Straficaon Ajustement
• • • •
• •
Mesures de disproporons Méthodes basées sur la Loi de Poisson Approches bayésiennes Surveillance syndromique Règles associaves Algorithme d’apprenssage supervisé
Signaux Sélecon des signaux • •
Priorisaon des signaux
Evaluaon des signaux • • •
Nombre minimum de cas Stasque du Chi2
Stasque Toxicologique Epidémiologique
• •
Experse Epidémiologie
Fig. 1. Sche´ma des macro-processus relatifs a` la mise en œuvre des me´thodes de surveillance et de de´tection des e´ve´nements inhabituels.
surveillance des maladies de la faune sauvage (surveiller pour agir [SAGIR]), dont l’un des objectifs est de de´tecter pre´cocement l’apparition de nouvelles maladies dans la faune sauvage [3]. 3.1.2. Qualite´ des donne´es Le processus d’e´valuation continue de la qualite´ des donne´es [4] constitue un pre´requis a` l’application des me´thodes de surveillance et de de´tection automatise´es pour l’interpre´tation qualitative des signaux ge´ne´re´s. Plusieurs indicateurs peuvent eˆtre calcule´s, comme la proportion de valeurs manquantes, incohe´rentes ou aberrantes, afin de comple´ter et pre´ciser le cas e´che´ant les informations par un retour au dossier me´dical, pour les cas graves uniquement. 3.2. Filtrage des donne´es Des techniques de filtrage sont utilise´es en amont de la mise en œuvre des me´thodes de surveillance et de de´tection des e´ve´nements inhabituels, pour cibler des e´ve´nements d’inte´reˆt. Par exemple, les approches par stratification ou par ajustement peuvent faire l’objet d’une pre´-analyse. Un groupe d’experts de Vigibase (WHO global ICSR database) a de´veloppe´ un algorithme, en routine depuis 2001, pour le filtrage pre´-analyse de certains e´ve´nements, tels que les nouveaux me´dicaments associe´s a` des effets inde´sirables graves (serious reaction and new drug), la recrudescence de signalements sur une courte pe´riode (rapid reporting increase) ou des the´matiques pre´sentant un inte´reˆt particulier en termes de vigilance (special interest terms) [5]. Applique´es a` la base de donne´es des CAPTV, ces me´thodes pourraient dans un premier temps eˆtre applique´es a` diffe´rents e´chantillons, comme par exemple sur les cas d’exposition symptomatiques stratifie´s sur l’aˆge des expose´s (moins de 5 ans, plus de 60 ans par exemple) et/ou selon les circonstances d’exposition (volontaire/accidentelle).
contingence 2 2 (Tableau 1) re´alise´es pour chacun des ` titre illustratif, couples me´dicament–symptoˆme (Tableau 2). A le programme de de´tection du syste`me europe´en de pharmacovigilance EudraVigilance utilise la mesure de disproportion du proportional reporting ratio (PRR). Dans le cas ou` une personne est multi-expose´e et/ou multi-symptomatique, on proce`de a` un de´coupage des associations renseigne´es sous la forme de couples. Par exemple, une personne expose´e a` n me´dicaments et pre´sentant m symptoˆmes est comptabilise´e comme n m couples me´dicament–symptoˆme. 3.3.2. Me´thodes probabilistes 3.3.2.1. Loi de Poisson. Applique´e a` des situations ou` les e´ve´nements sont rares en pharmacovigilance, cette me´thode identifie les couples me´dicament–symptoˆme dont les fre´quences observe´es sont supe´rieures aux fre´quences attendues, partant de l’hypothe`se que la distribution du nombre de couples me´dicament–symptoˆme observe´s suit une loi de Poisson de moyenne m observe´e sur une pe´riode note´e T. Le crite`re de ge´ne´ration de signal propose´ par le Re´seau national de vigilance et de pre´vention des pathologies professionnelle (RNV3P) [10] est le suivant : un signal est ge´ne´re´ lorsque, selon une loi de Poisson de moyenne m, la probabilite´ d’observer A e´ve`nements est infe´rieure a` 0,05 ; soit Prob (Poisson(m) > A) > 0,05. 3.3.2.2. Sequential Probability Reporting Test (SPRT2). Le calcul du SPRT2 a initialement e´te´ de´veloppe´ pour surveiller la fre´quence cumule´e d’un e´ve´nement de sante´. Adapte´ en pharmacovigilance [19], le test de SPRT2 consiste a` quantifier le risque que les e´ve´nements « prise d’un me´dicament » et « apparition d’un effet inde´sirable » apparaissent en meˆme temps. Par exemple, le crite`re de ge´ne´ration de signal utilise´ dans la Base nationale de pharmacovigilance de l’Agence nationale de se´curite´ du me´dicament (ANSM), et le RNV3P de l’Agence
3.3. Inventaire des me´thodes 3.3.1. Mesures de disproportion En pharmacovigilance, les mesures de disproportion ont pour finalite´ la mise en e´vidence des couples me´dicament– symptoˆme pre´sentant des fre´quences observe´es supe´rieures au bruit de fond attendu. Ces mesures sont base´es sur des tables de
Tableau 1 Table de contingence 2 2 utilise´e pour le calcul des mesures de disproportion.
Me´dicament Autres me´dicaments
Symptoˆme
Autres symptoˆmes
A C
B D
Tableau 2 Synthe`se des me´thodes pour la surveillance et la de´tection des e´ve´nements inhabituels. Me´thode
Me´thode de calcul
Crite`res de ge´ne´ration de signal
Dispositif ayant teste´ ou mis en place la me´thode
Re´fe´rences bibliographiques
Mesures de disproportion Proportional Reporting Ratio (PRR)
PRR = (A/(A + B))/(C/(C + D))
PRR > 2 et n 3 et Chi2 > 4
Adverse Event Reporting System (AERS) – Food and Drug Administration (FDA) Sentinel (ex-ADROIT, Adverse Drug Reactions Online Information Tracking) – Medical Control Agency (MCA) Re´seau national de vigilance et de pre´vention des pathologies professionnelles (RNV3P) – Agence nationale de se´curite´ sanitaire de l’alimentation, de l’environnement et du travail (ANSES) Syste`me europe´en de pharmacovigilance (Eudravigilance) – European Medicine Agency (EMEA) ARISj – Pharmaceuticals and Medical Devices Agency (PMDA), Ministry of Health, Labour and Welfare (MHLW) Vigibase – Uppsala Monitoring Center (UMC)
[2,7]
2
PRR > 3 et n 3 et Chi > 4
Reporting Odds Ratio (ROR)
Yule’s Ratio (Q)
Me´thodes base´es sur la loi de Poisson Loi de Poisson simple : P (X = k) = (mk/k !) exp-m Sequential Probability Reporting Test (SPRT2)
Approches baye´siennes Bayesian Confidence Propagation Neural Network (BCPNN)
PRR > 2 et IClow95 % > 1 et n 3 et Chi2 4
IClow95
%
> 1 et n 3
IClow95
%
>1
[9–11]
[12,13]
[14–16]
ROR = AD/BC
ROR > 1
IClow95 % = expln(ROR) 1,96 SE(ln(ROR)) avec SE(ln(ROR)) = (1/a + 1/b + 1/c + 1/ d)1/2
IClow95
%
>1
Centre de pharmacovigilance aux Pays-Bas (Lareb)
[18]
IClow95
%
>1
Re´seau national de vigilance et de pre´vention des pathologies professionnelles (RNV3P) – Agence nationale de se´curite´ sanitaire de l’alimentation, de l’environnement et du travail (ANSES) Re´seau national de vigilance et de pre´vention des pathologies professionnelles (RNV3P) – Agence nationale de se´curite´ sanitaire de l’alimentation, de l’environnement et du travail (ANSES)
[11]
Re´seau national de vigilance et de pre´vention des pathologies professionnelles (RNV3P) – Agence nationale de se´curite´ sanitaire de l’alimentation, de l’environnement et du travail (ANSES) Base nationale de phramacovigilance (BNPV) – Agence nationale de se´curite´ du me´dicament (Ansm)
[11]
Re´seau national de vigilance et de pre´vention des pathologies professionnelles (RNV3P) – Agence nationale de se´curite´ sanitaire de l’alimentation, de l’environnement et du travail (ANSES)
[11]
Q = (AD – BC)/(AD + BC) avec IClow = Q – 1,96 (1 – Q)2/2 (1/a + 1/ b + 1/c + 1/d)1/2
IClow 6¼ 0
Hypothe`se : le nombre de couples me´dicament–symptoˆme observe´s suit une loi de Poisson de moyenne m observe´e au cours de la pe´riode T SPRT2 = Ao ln (2) – AA avec Ao le nombre de cas observe´s et AA le nombre de cas attendu
1 – S (eA mA)/A ! < 0,05
SPRT2 2,94
[17]
[19]
Information Component (IC) = log (A (A + B + C + D)/(A + C)(A + B))
IClow95
%
6¼ 0
Syste`me de pharmacovigilance internationale (Vigibase) – Uppsala Monitoring Center (UMC)
[20]
IClow95
IClow95
%
6¼ 0
Re´seau national de vigilance et de pre´vention des pathologies professionnelles (RNV3P) – Agence nationale de se´curite´ sanitaire de l’alimentation, de l’environnement et du travail (ANSES)
[9]
%
= Expect (IC) – 1,96 SD (IC)
L. Faisandier et al. / Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131
IClow95 % = expln(PRR) 1,96 SE(ln(PRR)) avec SE(ln(PRR)) = 1/A + 1/C – 1/ (A + B) – 1/(C + D)1/2
[8]
123
124
Me´thode Gamma Poisson Shrinker (GPS) Outils pour la surveillance syndromique Me´thodes des limites historiques
Cartes de controˆle – Par exemple la me´thode CUSUM (Observed minus Expected) Extraction de re`gles associatives Algorithme Apriori
Approche par Exposome
Me´thode de calcul
Crite`res de ge´ne´ration de signal
Dispositif ayant teste´ ou mis en place la me´thode
Re´fe´rences bibliographiques
Empirical Bayes Screening (EBGM) = (A + B)(A + C)/ (A + B + C + D)
EBGM 2 et A 2
Adverse Event Reporting System (AERS) – Food and Drug Administration (FDA)
[21]
La valeur observe´e la semaine s de l’anne´e n est compare´e aux valeurs attendues calcule´es sur le jour e´quivalent des 3 semaines pre´ce´dentes de chaque anne´e historique Mesure la diffe´rence entre les effectifs observe´s et attendus, ge´ne´ralement repre´sente´e sous la forme d’un graphique de surveillance en routine
Nsn > 3 SD (Nsn1, Nsn2, Nsn3)
Syste`me d’alerte canicule et sante´ (Sacs) – Institut de Veille Sanitaire (InVS)
Ct = Ct1 + (Xt – X0)
Adverse Event Reporting System (EARS) – Center for Disease Control and prevention (CDC)
Lien : http://www.ars.lorraine.sante.fr/ fileadmin/LORRAINE/ARS_LORRAINE/ ACTUALITES/CVAGS/CANICULE/ Lorraine__Bulletin_MIGA_ 2012-19.08.12.pdf [22,23]
Support (X, Y) = P (X U Y) et Confiance (X, Y) = P (X) P (Y) pour un me´dicament X et un effet inde´sirable Y
Se´lection des associations dont le support est strictement supe´rieur a` 3
Adverse Event Reporting System (AERS) – Food and Drug Administration (FDA)
[24]
Re´seau national de vigilance et de pre´vention des pathologies professionnelles (RNV3P) – Agence nationale de se´curite´ sanitaire de l’alimentation, de l’environnement et du travail (ANSES)
[25,26]
Se´lection des associations dont la confiance de´passe 80 % Construction d’une matrice d’adjacences de dimension n cas n cas, puis surveillance des groupes d’exposition ainsi obtenus, enfin de´tection des cas « atypiques »
SD : Standard Deviation l’e´cart-type de l’IC ; Expect (IC) : la valeur attendue a posteriori de l’IC ; n : le nombre minimum d’observations pour A [Tableau 2] ; Chi2 : la statistique du test de Khi2.
L. Faisandier et al. / Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131
Tableau 2 (Suite )
L. Faisandier et al. / Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131
nationale de se´curite´ sanitaire de l’alimentation, de l’environnement et du travail (Anses) est atteint lorsque SPRT2 2,94.
3.3.3. Approches baye´siennes Les approches baye´siennes sont base´es sur le the´ore`me de Bayes qui porte sur les probabilite´s conditionnelles dont, pour rappel, la formule est P (BjA) = P (A\B)/P (B) pour deux e´ve´nements A et B.
3.3.3.1. Bayesian Confidence Propagation Neural Network (BCPNN). La me´thode BCPNN fait appel a` deux lois de probabilite´s imbrique´es : le nombre d’e´ve´nements enregistre´s suit une loi binomiale et le parame`tre de la loi binomiale suit une loi de probabilite´ de´finie a priori dont les parame`tres sont estime´s par une approche baye´sienne. L’indicateur mesure´, appele´ information component (IC), est ge´ne´ralement trace´ sous forme de graphique pour surveiller la tendance en fonction du temps. Le Uppsala Monitoring Center utilise, ainsi, depuis 1998, de manie`re trimestrielle, la me´thode BCPNN [20] en routine, couple´e a` une strate´gie de filtrage des signaux [5].
3.3.3.2. Gamma Poisson Shrinker (GPS). La me´thode GPS, e´galement appele´e Empirical Bayes Screening (EBAM) ou me´thode de Dumouchel [27], mesure le degre´ d’association pour chaque couple me´dicament–symptoˆme avec le calcul de l’indicateur Empirical Bayesian Geometric Mean (EBGM). Les crite`res de ge´ne´ration de signal utilise´s par la Food and Drug Administration (FDA), par exemple, sont : EBGM 2 et A 2, avec A le nombre de couples me´dicament–symptoˆme d’inte´reˆt (Tableau 1).
3.3.3.3. Extensions des me´thodes GPS. Plusieurs extensions ont e´te´ de´veloppe´es et teste´es sur des bases de donne´es ; comme la me´thode Longitudinal Gamma Poisson Shrinker (LGPS) qui utilise la notion de personne-temps plutoˆt que l’estimation du nombre d’e´ve´nements attendus ou la me´thode Longitudinal Evaluation of Observational Profiles of Adverse events Related to Drugs (LEOPARD) qui permet de supprimer automatiquement les fausses associations me´dicament–symptoˆme cause´es par des biais protopathiques5 ou par les mauvaises classifications des dates des e´ve´nements [28]. La me´thode Multi-item Gamma Poisson Shrinker (MGPS) [29] permet d’ajuster les valeurs observe´es pour corriger les facteurs de confusion potentiels.
5
Dans les enqueˆtes e´pide´miologiques de type cas-te´moin ou de type transversal, le biais protopathique est a` craindre lorsqu’il est difficile d’e´tablir que l’exposition au facteur e´tudie´ a bien pre´ce´de´ la survenue de la pathologie. Dans les e´tudes cas te´moins en pharmacovigilance, le me´dicament suspecte´ peut avoir e´te´ prescrit du fait des symptoˆmes correspondant au de´but de l’affection e´tudie´e : « l’exposition » n’est en fait qu’un marqueur pre´coce (ou la conse´quence) du de´but de la maladie et non pas la cause.
125
3.3.4. Outils de surveillance temporelle utilise´s en surveillance syndromique La surveillance syndromique (ou non spe´cifique) est utilise´e, entre autres, pour la de´tection des e´pide´mies d’origine infectieuse ou malveillante (attaque biologique, chimique ou nucle´aire) [30–32]. Cette surveillance permet de comple´ter un dispositif de veille sanitaire pour le rendre plus ope´rationnel et re´actif. ` titre d’exemple, le syste`me des centres antipoison aux A ´Etats-Unis NPDS (ex-TESS) a mis en place une surveillance constitue´e de deux volets ; le premier volet est base´ sur la surveillance, heure par heure, du volume des appels rec¸us au sein des centres antipoison locaux et nationaux, le deuxie`me volet concerne la surveillance, heure par heure, des effets cliniques enregistre´s aupre`s des centres locaux. Ainsi, pour un centre antipoison donne´, le volume des appels est dit « inhabituel »lorsqu’il exce`de la moyenne des appels rec¸us les dernie`res 24 heures ajoute´e de 3 e´cart-types. Le volume des effets cliniques est « inhabituel » lorsqu’il exce`de la moyenne des effets cliniques rec¸us les dernie`res 24 heures ajoute´e de 2 e´cart-types. 3.3.4.1. La me´thode des limites historiques. La me´thode des limites historiques consiste a` comparer la valeur observe´e d’une semaine « s » de l’anne´e « n » a` une valeur attendue a` partir de la moyenne des valeurs observe´es la semaine e´quivalente des trois semaines pre´ce´dant la semaine « s » d’inte´reˆt de chaque anne´e de l’historique. Le seuil d’alerte est de´fini par la borne supe´rieure de l’intervalle de confiance a` 95 % de la valeur attendue. Lorsque la valeur observe´e de´passe le seuil, une alarme statistique est ge´ne´re´e. Par exemple, le syste`me d’alerte canicule et sante´ (Sacs) de l’InVS compare le nombre de passages aux urgences d’un jour sur une semaine donne´e (exemple : le mercredi) a` la moyenne des passages le meˆme jour au cours des trois semaines pre´ce´dentes, prenant ainsi en compte les variabilite´s observe´es entre les diffe´rents jours de la semaine. Si la valeur de´passe de 3 e´cart-types la moyenne, le syste`me ge´ne`re une alarme. 3.3.4.2. Les cartes de controˆle. Le principe des cartes de controˆle, tre`s utilise´ dans le domaine de la maıˆtrise statistique des processus (MSP), consiste a` donner un intervalle d’occurrences pour un e´ve´nement donne´. Une alarme statistique est ge´ne´re´e lorsque le nombre cumule´ d’e´ve´nements observe´s a` un instant t de´passe la borne supe´rieure de l’intervalle de confiance. Plusieurs mode`les statistiques peuvent eˆtre employe´s pour constituer une carte de controˆle (me´thode de lissage, re´gression. . .). Dans le domaine de la surveillance syndromique, les sommes cumulatives sont souvent utilise´es car base´es sur peu de donne´es historiques. Par exemple, une carte de controˆle de type CUSUM a e´te´ applique´e par le Center for Disease Control and prevention (CDC) dans le cadre du programme EARS [22,23]. Cette carte permet de de´tecter les e´ve´nements selon trois niveaux de sensibilite´ : un premier niveau ou` la moyenne et l’e´cart-type sont calcule´s sur les valeurs des sept jours pre´ce´dents (algorithme C1-MILD), deux autres niveaux ou` les indicateurs
126
L. Faisandier et al. / Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131
sont calcule´s sur les trois a` neuf jours pre´ce´dents (ignorant les deux jours les plus re´cents) (algorithmes C2-MEDIUM et C3-ULTRA). 3.3.5. L’extraction de re`gles associatives Les re`gles associatives font re´fe´rence aux modalite´s de variables, appele´es items, qui apparaissent de manie`re concomitante et fre´quente dans une base de donne´es. Par exemple, la re`gle « X > Y » sugge`re qu’il existe une relation forte entre les items X et Y. Bien que la majorite´ des travaux portent sur l’extraction de motifs fre´quents, il est possible de se´lectionner les motifs selon leur rarete´ par exemple. 3.3.5.1. Algorithme Apriori. Utilise´ en pharmacovigilance, l’algorithme Apriori consiste a` calculer un « support » et une « confiance »6 pour un me´dicament X et un effet inde´sirable Y [24] qui traduisent, respectivement, la probabilite´ d’associer Ya` X et la probabilite´ d’associer Y parmi tous les X. L’algorithme proce`de ensuite en deux e´tapes successives : se´lectionner les re`gles qui ont un support minimum, et a` partir de ces re`gles dites fre´quentes, se´lectionner celles dont la confiance de´passe un seuil minimum. Par exemple, le syste`me de pharmacovigilance australien (Database of Adverse Event Notifications [DAEN]) a identifie´ les signaux qualifie´s de bystanders (i.e. « spectateurs innocents » assimile´s au bruit de fond) [33]. 3.3.5.2. Extraction de motifs se´quentiels. Les motifs se´quentiels7 sont une adaptation des re`gles d’associations pour les se´ries temporelles [34]. Un exemple de motif est « < (XY)(Z) > N % » qui signifie que les e´ve´nements X et Y apparaissent ensemble, associe´s e´galement a` l’e´ve´nement Z, pour N % des enregistrements de la base. L’extraction de ces motifs est techniquement difficile, ne´cessitant un espace de stockage conse´quent. Afin d’assurer le passage a` l’e´chelle, de nombreuses me´thodes ont e´te´ de´veloppe´es comme GSP (Generalized Sequential Patterns), l’algorithme SPADE pour la gestion des donne´es en me´moire. Si le crite`re de fre´quence est de´terminant, le de´cideur peut parfois s’ave´rer eˆtre plus inte´resse´ par des connaissances qui sont repre´sentatives d’un comportement inattendu comme dans le cas des e´tudes de toxicovigilance. C’est pour ce type de besoin que les motifs inattendus ont e´te´ de´finis et des approches tels que USER (Unexpected Sequence Extracted Rules) ont e´te´ utilise´es. D’autres algorithmes sont depuis de´veloppe´s, telle une me´thode de repre´sentation des connaissances appele´e UTAR (Unexpected Temporal Association Rule) ainsi que son algorithme d’extraction des connaissances appele´ MUTARA (Mining UTAR’s given the Antecedent) et sa version ame´liore´e HUNT (Highlighting infrequent and UNexpected paTterns) [35]. Un autre algorithme de fouille de donne´es, appele´ MUTARC (Mining Unexpected Temporal Association Rules 6
Support (X, Y) = P (X, U, Y) et confiance (X, Y) = P (X) P (Y). http://www.lgi2p.ema.fr/poncelet/publications/papers/surveyMS.pdf http://www.lirmm.fr/poncelet/publications/papers/egc08haoyuan.pdf. 7
et
Classification) [36], a e´te´ de´veloppe´ sur une base de donne´es me´dico-administratives pour ge´ne´rer des re`gles d’association inattendues en prenant en compte la temporalite´.
3.3.5.3. Approche par Exposome. Le concept de l’Exposome, de´crit par Wild [37] puis par Rappaport [38], est de´crit comme « repre´sentant l’ensemble des expositions auxquelles un individu est soumis au cours de sa vie, incluant les substances toxiques, et offrant aux scientifiques une approche agnostique pour mener des investigations sur les causes environnementales des maladies chroniques ». ` titre illustratif, et de manie`re plus cible´e, le RNV3P a A de´veloppe´ un occupational exposome, e´tudiant ainsi les expositions professionnelles communes a` des individus atteints d’une meˆme pathologie [25,26]. La structure des groupes d’exposition ainsi constitue´s fait l’objet d’une surveillance temporelle.
3.3.6. Algorithme d’apprentissage supervise´ Sous l’hypothe`se que les informations contenues dans une base de donne´es soient des exemples applicatifs, les algorithmes d’apprentissage supervise´ sont des me´thodes « sur-mesure » qui visent a` produire, a` partir d’une approche probabiliste ge´ne´ralement, des re`gles et a` automatiser la prise de de´cision. Elles consistent a` dresser un cadre conceptuel et maıˆtrise´ d’un processus ; par exemple un arbre de de´cision. Par exemple, le RNV3P a de´veloppe´ un algorithme [26] qui mode´lise l’entretien me´decin-patient permettant de rechercher un lien entre le cursus laboris et la pathologie du patient. L’algorithme, appele´ « fonctions expertes », permet ainsi d’e´valuer le potentiel d’une association pathologie-nuisances a` e´merger. Cette approche pre´sente e´galement la particularite´ de prendre en compte la multiplicite´ des expositions. Les me´thodes de´veloppe´es dans cette section, et les crite`res de ge´ne´ration de signal teste´s ou mis en place par les dispositifs internationaux de vigilance, sont synthe´tise´s dans le Tableau 2.
3.4. Se´lection des signaux Le processus de se´lection des signaux diffe`re selon les dispositifs. En pharmacovigilance, les indicateurs les plus utilise´s sont une valeur seuil pour les mesures de disproportion, la statistique du Chi2 et un nombre minimum de cas observe´s. En l’absence de gold standard, une valeur seuil est de´finie a priori (exemple : PRR > 2), notamment pour les me´thodes de disproportion. Par ailleurs, l’observation d’un cas isole´ ne ` constitue pas un signal meˆme si la situation semble atypique. A l’inverse, la remonte´e du signal par les experts permet de prendre les mesures d’information et de pre´vention approprie´es. Mais le seuil du nombre de cas minimum reste difficile a` de´finir du fait de l’absence de gold standard. Les syste`mes de pharmacovigilance utilisent ge´ne´ralement le seuil suivant : A 3.
L. Faisandier et al. / Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131
3.5. E´valuation des signaux La ge´ne´ration d’un signal statistique ne´cessite d’eˆtre ve´rifie´ et valide´ dans la mesure ou` les connaissances cliniques et biologiques ne sont pas mesurables statistiquement. Ainsi, les re´sultats obtenus doivent eˆtre comple´te´s et affine´s avec une e´valuation statistique, e´pide´miologique et toxicologique. 3.5.1. E´valuation statistique Afin de re´duire la quantite´ de signaux ge´ne´re´s par les ´ methodes de de´tection automatise´e, certains syste`mes de vigilance ont mis en place une strate´gie de filtrage des signaux post-analyse [5]. Par exemple, le syste`me Vigibase adressait aux experts cliniciens tous les signaux statistiquement significatifs de´tecte´s avec la me´thode BCPNN, entre 1998 et 2001. En un trimestre, parmi 75 000 couples me´dicament–symptoˆme, 20 000 sont passe´es au-dessus du seuil de la me´thode BCPNN ; constituant une charge de travail conside´rable pour les experts puisque l’investigation des signaux ne´cessite une e´tude approfondie des cas et un retour au dossier des patients. En 2001, une nouvelle strate´gie consistait a` filtrer les e´ve´nements suivants : les e´ve´nements graves et les me´dicaments nouvellement introduits sur le marche´, les e´ve´nements dont l’IC augmente rapidement au cours du temps et une liste de mots-clefs d’inte´reˆt mise a` jour par les cliniciens. 3.5.2. E´valuation toxicologique L’e´valuation toxicologique des signaux ge´ne´re´s est soumise a` un comite´ d’experts qui e´value la pertinence et le caracte`re prioritaire des signaux statistiques ge´ne´re´s. Par exemple, la me´thode de priorisation des signaux utilise´e dans le re´seau Sentinel (Food and Drug Administration [FDA]) est base´e sur le jugement d’experts se re´unissant toutes les semaines a` partir des signaux ge´ne´re´s. Les signaux sont ainsi priorise´s selon les cate´gories suivantes : priorite´ e´leve´e, priorite´ faible, informations comple´mentaires requises, pas d’action indique´e. 3.5.3. E´valuation e´pide´miologique ` partir d’une hypothe`se fonde´e sur l’e´valuation statistique A et toxicologique des signaux, une e´valuation e´pide´miologique peut eˆtre re´alise´e afin d’e´valuer le niveau de preuve de la relation entre une pathologie et une exposition ; elle se pre´sente sous la forme d’une revue de litte´rature ou d’une e´tude e´pide´miologique. Ainsi, le RNV3P utilise un sche´ma de´cisionnel combinant a` la fois une e´valuation des e´tudes e´pide´miologiques et des donne´es toxicologiques (Tableau 3) [11]. 3.6. Priorisation des signaux Les signaux pertinents ne´cessitent d’eˆtre priorise´s afin de prendre rapidement des mesures de gestion approprie´es. Les signaux juge´s non prioritaires peuvent le cas e´che´ant faire l’objet d’une surveillance renforce´e, ne conduisant pas
127
ne´cessairement a` une mesure de gestion informative ou pre´ventive. Par exemple, Sante´ Canada priorise les effets inde´sirables selon trois couleurs. Les signaux classe´s « vert » sont ceux lie´s aux effets de´ja` connus et e´tiquete´s ou lie´s aux facteurs de confusion, ou meˆme a` des effets inde´sirables lie´s aux me´dicaments qui ne constituent pas une pre´occupation majeure en matie`re d’innocuite´. Les signaux classe´s « rouge » ou « jaune » requie`rent une e´valuation approfondie en vue de confirmer la pre´sence d’une association causale entre le produit de sante´ et le ou les effets inde´sirables pre´occupants et de de´terminer les mesures qui doivent eˆtre prises en vue d’atte´nuer le risque. 4. Discussion Les me´thodes fre´quentistes sont couramment utilise´es en pharmacovigilance pour de´tecter des couples me´dicament– symptoˆme e´mergents. Elles pre´sentent l’avantage de prendre en compte les biais de recrutement inhe´rents a` la base de donne´es, sans ne´cessite´ de les controˆler, et constituent une me´thode de comptage facile a` mettre en œuvre et a` interpre´ter. Ces me´thodes quantitatives sont e´galement appre´cie´es du fait de leur raisonnement simple et logique : un me´dicament couramment associe´ a` un effet inde´sirable pre´sente une fre´quence plus e´leve´e que les autres me´dicaments et effets inde´sirables. Des discussions ont porte´ sur l’exclusion des couples surrepre´sente´s ou sur des stratifications de la population, compte tenu de la taille volumineuse des bases de donne´es et de la puissance de calcul attendue [39]. Au vu des e´tudes comparatives, il semble qu’il n’existe pas de consensus pour l’utilisation de telle ou telle approche. Ne´anmoins, ces me´thodes diffe`rent selon les caracte´ristiques intrinse`ques des bases de donne´es et ne´cessitent d’eˆtre teste´es et compare´es afin d’e´valuer leur performance. Bien que leur efficacite´ ait e´te´ prouve´e, ces mesures de disproportion pre´sentent des lacunes [40]. D’une part, les filtrages pre´- et post-analyse ne´cessitent une ame´lioration du fait du volume important des signaux ge´ne´re´s et le fonctionnement en « boite noire » des approches baye´siennes ne facilite pas l’analyse du signal par les experts (pharmaciens ou toxicologues). D’autre part, le manque de valeur de re´fe´rence (gold standard) constitue un obstacle majeur. En effet, les seuils de de´tection ont une valeur indicative de´termine´e par les experts et non une significativite´ statistique. Cependant, diffe´rentes mesures peuvent eˆtre combine´es afin de re´duire le nombre de signaux « bruts » ge´ne´re´s ; comme par exemple la combinaison des mesures de Chi2, de PRR et une condition sur le nombre minimum de cas individuels observe´s. On note e´galement une sensibilite´ e´leve´e de ces analyses, du fait que les mesures de disproportion reposent sur une de´finition simpliste d’un e´ve´nement (couple me´dicament–symptoˆme), et non sur une approche qualitative. Cette de´finition d’un signal ne refle`te pas une ve´ritable relation de cause a` effet. C’est pourquoi, les travaux actuels s’orientent vers des approches multivarie´es capables de prendre en compte la multiplicite´ des produits et des symptoˆmes associe´s a` un cas et les interactions
128
L. Faisandier et al. / Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131
Tableau 3 Sche´ma de´cisionnel propose´ par le syste`me du RNV3P pour l’e´valuation e´pide´miologique et toxicologique des signaux ge´ne´re´s. E´tudes e´pide´miologiques
Niveau
Donne´es toxicologiques
Niveau
Absence d’e´tude recherchant ce lien de causalite´ dans la bibliographique
EX
Absence de donne´es toxicologiques disponibles en faveur d’une relation
TX
E´tudes e´pide´miologiques convergentes et ne´gatives
E0
Donne´es toxicologiques animales cohe´rentes et ne´gatives OU pour les cancers : test de ge´notoxicite´ ou cance´roge´nicite´ ne´gatifs
T0
Rapport(s) de cas OU e´tudes dont les conclusions divergent, sans e´tude de bonne qualite´ sugge´rant un lien significatif
E1
Absence de donne´es cohe´rentes en faveur d’une relation OU effets similaires de mole´cules apparente´es ou ayant des groupements chimiques identiques OU pour les cancers : substance mutage`ne ou cance´roge`ne sur un autre organe
T1
E´tudes aux conclusions divergentes, avec au moins une e´tude de bonne qualite´ avec lien statistiquement significatif
E2
Donne´es toxicologiques en faveur d’une association : e´tudes animales plutoˆt cohe´rentes sans e´le´ment de preuve emportant la conviction OU forte parente´ structurale avec une mole´cule reconnue pour donner la meˆme pathologie OU substance cance´rige`ne pour l’organe e´tudie´
T2
E´tudes e´pide´miologiques convergentes et positives OU me´ta-analyse en faveur d’un lien significatif OU e´tude de bonne qualite´ avec lien significatif et relation dose-effet ou dure´e-effet
E3
Donne´es toxicologiques convergentes et positives OU pour les cancers plusieurs e´tudes positives sur l’organe conside´re´ avec relation dose-effet ou mutation spe´cifique sur tumeur humaine
T3
me´dicamenteuses, sans pour autant conclure sur l’existence d’une relation causale. L’estimation du False Discovery Rate (FDR), de´fini comme l’espe´rance du taux de faux positifs [41], consiste a` estimer un seuil de de´tection pour les mesures de disproportion utilise´es en pharmacovigilance et a` lister les signaux selon une p-valeur de´rive´e des mesures de disproportion ou du test exact de Fisher. Cette estimation pre´sente l’inte´reˆt de prendre en compte l’existence de de´pendances entre effets inde´sirables et me´dicaments. La me´thode a e´te´ valide´e sur des donne´es simule´es et pre´sente l’avantage de ne plus se fonder sur la limite infe´rieure de l’intervalle de confiance a` 95 % dans le cas de la me´thode BCPNN, laquelle constitue une source d’impre´cisions d’autant plus importante que le nombre de cas observe´ est faible. Par manque de ressources et de moyens ne´cessaires a` une utilisation optimale, la FDA publie chaque trimestre une version publique de la base de donne´es AERS8. Cette ouverture de la base a permis a` d’autres e´quipes, notamment japonaises et italiennes, de tester et d’imple´menter des me´thodes standards de fouille de donne´es pour la de´tection des e´ve´nements inattendus [42–44]. Cette de´marche permet e´galement d’avoir recours a` l’expertise internationale des toxicologues et de pre´parer d’e´ventuelles collaborations futures. Les travaux de´veloppe´s jusqu’a` pre´sent [45] s’inte´ressent peu a` l’aspect multidimensionnel des e´ve´nements, i.e. la prise en compte de plusieurs me´dicaments et/ou de plusieurs symptoˆmes. Pourtant, les me´thodes symboliques, telles que l’extraction des motifs ou des re`gles d’associations [46–49], constituent une approche comple´mentaire aux me´thodes nume´riques existantes du fait de la repre´sentation synthe´tique
8 http://www.fda.gov/ScienceResearch/SpecialTopics/RegulatoryScience/ ucm228210.htm.
du contenu de la base de donne´es [50,51]. Des travaux re´cents citent des me´thodes relatives a` l’extraction de motifs se´quentiels9 adapte´es aux se´ries temporelles. L’e´volution des me´thodes de de´tection automatise´e dans le domaine de la pharmacovigilance, et leur extension au domaine de la toxicovigilance, s’orientent vers des approches capables de prendre en compte la dimension multivarie´e des expositions et des symptoˆmes [52–54] et d’observer les changements structurels au cours du temps. Dans cette perspective, les me´thodes les plus prometteuses sont les me´thodes de re´gression logistique de type Least Absolute Shrinkage and Selection Operator (LASSO) conside´rant, de fait, les notifications individuelles comme des ensembles de variables binaires d’exposition et d’e´ve`nements inde´sirables (survenue ou non des diffe´rents e´ve´nements inde´sirables) [55,56] ou les approches empiriques baye´siennes base´es sur des algorithmes d’appren` titre illustratif, l’algorithme tissage non supervise´s [57,58]. A WSARE (what’s strange about recent events?) [59] a pour objectif de de´tecter des groupes de cas (i.e. patterns) pre´sentant des caracte´ristiques anormales et enregistre´s re´cemment dans la base de donne´es des cas admis dans les services d’urgence hospitalie`re aux E´tats-Unis. La re`gle de de´cision e´tant spe´cifique des patterns inhabituels recherche´s, les re´sultats ont montre´ un faible nombre de signaux faux positifs et des de´lais de de´tection courts. Il est cependant ne´cessaire de souligner l’importance de l’expert qui initie l’enregistrement d’un cas dans la base de donne´es. En effet, les me´thodes de de´tection identifient plus souvent des pratiques de codage he´te´roge`nes que de re´els signaux inhabituels. L’expert occupe donc une position centrale dans les syste`mes de recueil des informations et dans l’interpre´tation des signaux bruts ge´ne´re´s.
9
http://www.lgi2p.ema.fr/poncelet/publications/papers/surveyMS.pdf.
L. Faisandier et al. / Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131
5. Conclusion et perspectives Dans le cadre du programme de de´tection automatise´e du signal applique´ a` la Base nationale des cas d’intoxications (BNCI), des approches telles que celles utilise´es en pharmacovigilance pourraient eˆtre utilise´es [6], compare´es et possiblement de´ploye´es a` la prise en compte de la multi-exposition et/ou de la multi-symptomatologie. Applique´e au domaine de la toxicovigilance, la de´tection automatise´e des signaux pourrait s’inscrire dans une de´marche d’ame´lioration de la prise en charge des e´ve´nements sanitaires inde´sirables non identifie´s ou en recrudescence au sein d’une population spe´cifique par exemple, la de´tection d’usages non conventionnels dangereux, la de´tection d’e´ve´nements lie´s a` la multi-exposition (notamment du fait d’interactions entre substances ou agents) ou a` des circonstances particulie`res d’exposition. D’autres approches que celles de´veloppe´es dans ce travail permettraient potentiellement de traiter les composantes multiples des e´ve´nements (agents, substances, symptoˆmes, circonstances, etc.) telles que des me´thodes de classification (analyse des correspondances multiples par exemple), ou encore telles que les re´seaux de neurones, les mode`les dynamiques baye´siens [60] ou le de´veloppement d’algorithmes probabilistes. Par ailleurs, il semble judicieux de de´velopper plusieurs approches sur un meˆme e´chantillon de donne´es afin de pouvoir comparer le potentiel de de´tection de chacune des me´thodes. La de´tection de signal a` partir de la BNCI ne´cessite, au pre´alable, une e´valuation de la qualite´ des donne´es (taux de remplissage, taux d’aberrations, etc.), ainsi qu’une caracte´risation des pratiques de codage. En effet, la de´tection et l’exploitation des termes utilise´s, se´mantiquement proches, pre´sente un enjeu important en termes de de´tection de signal. Lorsque cette information est disponible, elle permet de rassembler les effets inde´sirables code´s avec des termes diffe´rents mais pourtant tre`s proches ou de rassembler les ` titre symptoˆmes sous la forme de toxidromes (text mining). A illustratif, un syndrome atropinique ou anticholinergique lie´ a` une consommation accidentelle de Datura stramonium pre´sente l’association de signes cliniques anticholinergiques centraux {confusion, de´sorientation, hallucinations visuelles, agitation, irritabilite´, de´lire, troubles mne´siques, agressivite´} ou pe´riphe´riques {mydriase, vision trouble, bouche se`che, nause´es, constipation, dysurie, anhidrose, tachycardie, crise de glaucome aigu}. Par conse´quent, disposer de ces informations permettrait d’agre´ger les cas et de renforcer le signal et, de ce fait consolider les conclusions de l’analyse. L’exploitation des donne´es de la Base nationale des produits et compositions (BNPC) rendrait possible une approche par substance plutoˆt que par produit du fait de la disponibilite´ d’informations de´taille´es relatives aux agents telle que la composition des produits commercialise´s ou encore la date de premie`re mise sur le marche´. Pour comple´ter l’analyse des signaux ge´ne´re´s par ces me´thodes, il est possible de lancer une recherche web (web mining) dont les objectifs seraient multiples : e´valuer la porte´e du signal, retrouver des cas cliniques observe´s dans d’autres pays mais n’ayant pas fait l’objet d’une alarme, du fait du
129
nombre de notifications faibles, pre´venir des risques en termes ` titre d’exemple, on peut citer les de sante´ publique. A algorithmes et outils de´veloppe´s pour atteindre ces ambitions ; tels que GET WELL [61] et Google Trends [62]. Enfin, des approches spatiales et spatio-temporelles ne sont pas exclues des perspectives de travail, comme le de´montrent certaines e´tudes relevant du domaine de spatial data mining [63,64]. L’utilisation de ce type d’approche permettrait e´galement de de´tecter la recrudescence d’e´ve´nements localise´s, des pratiques ou des circonstances inhabituelles lie´es a` l’utilisation d’un produit ou d’une substance au niveau de´partemental ou re´gional. De´claration d’inte´reˆts Les auteurs de´clarent ne pas avoir de conflits d’inte´reˆts en relation avec cet article. Remerciements Les remerciements sont adresse´s aux membres du groupe de travail « De´tection automatise´e du signal en toxicovigilance » coordonne´ par l’InVS pour les relectures et les enrichissements apporte´s a` ce travail ; Ismaı¨l Ahmed (CESP Inserm), Dominique J Bicout (TIMC ENVL), Sandra Bringay (Lirmm), Anne Fouillet (InVS), Daniel Eilstein (InVS), Robert Garnier (CAPTV Paris), Franck Golliot (Cire Languedoc-Roussillon), Jacques Manel (CAPTV Nancy), Pascale Tubert-Bitter (CESP Inserm). Les auteurs remercient e´galement Farida Mihoud (InVS) pour la relecture de l’anglais ainsi que les relecteurs pour leur contribution a` l’ame´lioration du manuscrit. Re´fe´rences [1] Villa A, Cochet A, Guyodo G. Les intoxications signale´es aux centres antipoison en 2006. Rev Prat 2008;58:825–31. [2] Sakaeda T, Tamon A, Kadoyama K, Okuno Y. Data mining of the public version of the FDA adverse event reporting system. Int J Med Sci 2013;10:796–803. [3] Warns-Petit E, Morignat E, Artois M, Calavas D. Unsupervised clustering of wildlife necropsy data for syndromic surveillance. BMC Vet Res 2010;6:56. [4] Lindquist M. Data quality management in pharmacovigilance. Drug Saf 2004;27:857–70. [5] Lindquist M. Use of triage strategies in the WHO signal-detection process. Drug Saf 2007;30:635–7. [6] Chazard E. Automated detection of adverse drug events by data mining of electronic health records.The`se de doctorat Biostatistiques Universite´ de Lille 2; 2011. [7] Lindquist M. VigiBase, the WHO global ICSR database system: basic facts. Drug Inf J 2008;42:409–19. [8] Heeley E, Waller P, Moseley J. Testing and implementing signal detection impact analysis in a regulatory setting: results of a pilot study. Drug Saf 2005;28:901–6. [9] Bonneterre V, Bicout DJ, de Gaudemaris R. Application of pharmacovigilance methods in occupational health surveillance: comparison of seven disproportionality metrics. Saf Health Work 2012;3:92–100. [10] Bonneterre V, Faisandier L, Bicout D, Bernardet C, Piollat J, Ameille J, et al. Programmed health surveillance and detection of emerging diseases in occupational health: contribution of the French national occupational
130
[11]
[12]
[13] [14]
[15]
[16] [17]
[18]
[19] [20]
[21]
[22]
[23]
[24]
[25]
[26]
[27]
[28]
[29]
[30]
L. Faisandier et al. / Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131 disease surveillance and prevention network (RNV3P). Occup Environ Med 2010;67:178–86. Bonneterre V. De´tection et investigation de maladies professionnelles potentiellement e´mergentes a` partir du Re´seau national de vigilance et de pre´vention des pathologies professionnelles (RNV3P).The`se de doctorat Mode`les, me´thodes et algorithmes pour la biologie, la sante´ et l’environnement Universite´ de Grenoble; 2010. Alvarez Y, Hidalgo A, Maignen F, Slattery J. Validation of statistical signal detection procedures in eudravigilance post-authorization data: a retrospective evaluation of the potential for earlier signaling. Drug Saf 2010;33:475–87. Slattery J, Alvarez Y, Hidalgo A. Choosing thresholds for statistical signal detection with the proportional reporting ratio. Drug Saf 2013;36:687–92. Kimura T, Matsushita Y, Yang YH, Choi NK, Park BJ. Pharmacovigilance systems and databases in Korea, Japan and Taiwan. Pharmacoepidemiol Drug Saf 2011;20:1237–45. Kubota K, Koide D, Hirai T. Comparison of data mining methodologies using Japanese spontaneous reports. Pharmacoepidemiol Drug Saf 2004;13:387–94. Kawahara A. Future perspectives for pharmacovigilance in Japan. J Health Sci 2009;55:593–600. Giezen TJ, Mantel-Teeuwisse AK, Meyboom RHB, Straus SMJM, Leufkens HGM, Egberts TCG. Mapping the safety profile of biologicals: a disproportionality analysis using the WHO adverse drug reaction database, VigiBase. Drug Saf 2010;33:865–78. Scholl JHG, van Puijenbroek EP. Hearing impairment associated with oral terbinafine use. A case series and case/non-case analysis in the Netherlands. Drug Saf 2012;25:685–91. Evans S. Sequential probability ratio tests applied to public health problems. Control Clin Trials 2003;24:67S. Hedenmalm K, Sundstro¨m A, Spigset O. Alopecia associated with treatment with selective serotonin reuptake inhibotors (SSRIs). Pharmacoepidemiol Drug Saf 2006;15:719–25. Pizzoglio V, Ahmed I, Auriche P, Tubert-Bitter P, Haramburu F, Kreft-Jaı¨s C, et al. Implementation of an automated signal detection method in the French pharmacovigilance database: a feasibility study. Eur J Clin Pharmacol 2012;68:793–9. Sibanda T, Sibanda N. The CUSUM chart method as a tool for continuous monitoring of clinical outcomes using routinely collected data. BMC Med Res Methodol 2007;7:46. Fricker RD, Hegler BL, Dunfee DA. Comparing syndromic surveillance detection methods: EARS’ versus a CUSUM-based methodology. Stat Med 2008;27:3407–29. Kuo MH, Kushniruk AW, Borycki EM, Greig D. Application of the Apriori algorithm for adverse drug reaction detection. Stud Health Technol Inform 2009;148:95–101. Faisandier L, Bonneterre V, de Gaudemaris R, Bicout DJ. Occupational exposome: a network-based approach for characterizing occupational health problems. J Biomed Inf 2011;44:545–52. Faisandier L. De la surveillance a` la de´tection des proble`mes de sante´ au travail potentiellement e´mergents dans un contexte de multi-exposition : de´veloppement de me´thodes applique´es au Re´seau national de vigilance et de pre´vention des pathologies professionnelles.The`se de doctorat Mode`les, me´thodes et algorithmes pour la biologie, la sante´ et l’environnement Universite´ de Grenoble; 2011. Dumouchel W. Bayesian data mining in large frequency tables, with an application to the FDA spontaneous reporting system. Am Stat 1999;53:177–202. Schuemie MJ. Methods for drugs safety signal detection in longitudinal observational databases: LPGS and LEOPARD. Pharmacoepidemiol Drug Saf 2011;20:292–9. Szarfman A, Machado SG, O’Neill RT. Use of screening algorithms and computer systems to efficiently signal higher-than-expected combinations of drugs and events in the US FDA’s spontaneous reports database. Drug Saf 2002;25:381–92. Astagneau P, Ancelle T. La surveillance e´pide´miologique. Surveillance syndromique (Chapitre 12). E´d. Lavoisier; 2011.
[31] Josseran L, Fouillet A, Caille`re N, Brun-Ney D, Ilef D, Brucker G, et al. Assessment of a syndromic surveillance system based on morbidity data: results from the Oscour Network during a Heat Wave. Plos One 2010;5:e11984. [32] Unkel S, Farrington CP, Garthwaite H. Statistical methods for the prospective detection of infectious outbreaks: a review. J R Stat Soc 2012;175(Part 1):49–82. [33] Purcell P, Barty S. Statistical techniques for signal generation: the Australian experience. Drug Saf 2002;25:415–21. [34] Masseglia F. Algorithmes et applications pour l’extraction de motifs se´quentiels dans le domaine de la fouille de donne´es : de l’incre´mental au temps re´el.PhD dissertation universite´ de Versailles Saint-Quentin France; 2002. [35] Jin HW, Chen J, He H, Kelman C, McAullay D, O’Keefe CM. Signaling potential adverse drug reactions from administrative health databases. IEEE T Knowl Data En 2010;22:839–54. [36] Jin HW, Chen J, He H, Williams GJ, Kelman C, O’Keefe CM. Mining unexpected temporal associations: application in detecting adverse drug reactions. IEEE Trans Inf Technol Biomed 2008;12:488–500. [37] Wild CP. Complementing the Genome with an ‘‘Exposome’’: the outstanding challenge of environmental exposure measurement in molecular epidemiology. Cancer Epidemiol Biomarkers Prev 2005;14:1847–50. [38] Rappaport SM. Implications of the exposome for exposure science. Expo Sci Environ Epidemiol 2011;21(1):5–9. [39] Hammond IW, Gibbs TG, Seifert HA, Rich DS. Database size and power to detect safety signals in pharmacovigilance. Expert Opin Drug Saf 2007;6:713–21. [40] Stephenson WP, Hauben M. Data mining for signals in spontaneous reporting databases: proceed with caution. Pharmacoepidemiol Drug Saf 2007;16:359–65. [41] Ahmed I, Dalmasso C, Haramburu F, Thiessard F, Broe¨t P, Tubert-Bitter P. False discovery rate estimation for frequentist pharmacovigilance signal detection methods. Biometrics 2010;66:301–9. [42] Tamura T, Sakaeda T, Kadoyama K, Okuno Y. Aspirin- and clopidogrelassociated bleeding complications: data mining of public version of the FDA adverse event reporting system, AERS. Int J Med Sci 2012;9:441–6. [43] Kadoyama K, Sakaeda T, Tamon A, Okuno Y. Adverse event profils of platinum agents: data mining of the public version of the FDA adverse event reporting system, AERS, and reproductibility of clinical observations. Biol Pharm Bull 2012;35:967–70. [44] Sakaeda T, Kadoyama K, Okuno Y. Adverse event profile of tigecycline: data mining of the public version of the U.S. Food and Drug Administration Adverse Event Reporting System. Int J Med Sci 2011;8:487–91. [45] Harpaz R, Dumouchel W, Shah NH, Madigan D, Ryan P, Friedman C. Novel data-mining methodologies for adverse drug event discovery and analysis. Clin Pharmacol Ther 2012;91:1010–21. [46] Hugueney B. Cadre ge´ne´ral et algorithmes de constructions pour les repre´sentations symboliques de se´ries temporelles. Rev Modulad 2006;34: 1–12. [47] Bousquet C, Henegar C, Lillo-Le Loue¨t A, Degoulet P, Jaulent M-C. Implementation of automated signal generation in pharmacovigilance using a knowledge-based approach. Med Inform 2005;74:563–71. [48] Marascu A-M. Extraction de motifs se´quentiels dans les flux de donne´es.The`se de doctorat Informatique Universite´ de Nice – Sophia Antipolis; 2009. [49] Lillo-Le Loue¨t A, Toussaint Y, Villerd J. A qualitative approach to signal mining in pharmacovigilance using formal concept analysis. Stud Health Technol Inform 2010;160:969–73. [50] Villerd J, Toussaint Y, Lillot-Le Loue¨t A. Comple´mentarite´ des me´thodes nume´riques et symboliques en pharmacovigilance;Manuscrit publie´ dans 21e Journe´es francophones d’inge´nierie des connaissances 2010;221–32. [51] Bousquet C, Amardheil F, Daube J-M, Delamarre D, Duclos C, Lanne SG, et al. Towards a better signal detection and knowledge management in pharmacovigilance: the VigiTermes Project. IRBM 2011;32:158–61. [52] Descotes J, Testud F. Toxicovigilance: a new approach for the hazard identification and risk assessment of toxicants in human beings. Toxicol Appl Pharmacol 2005;207:S599–603.
L. Faisandier et al. / Revue d’E´pide´miologie et de Sante´ Publique 63 (2015) 119–131 [53] Almenoff JS, Pattishall EN, Gibbs TG, Dumouchel W, Evans SJW, Yuen N. Novel statistical tools for monitoring the safety of marketed drugs. Clinl Pharmacol Therap 2007;82:157–66. [54] Harpaz R, Chase HS, Friedman C. Mining multi-item drug adverse effect associations in spontaneous reporting systems. BMC Bioinform 2010;11 (Suppl. 9):S7. [55] Tibshirani R. Regression shrinkage and selection via the lasso. J R Stat Soc 1997;58:267–88. [56] Caster O, Nore´n GN, Madigan D, Bate A. Large-scale regression-based pattern discovery: the example of screening the WHO global drug safety database. Stat Anal Data Mining 2010;3:197–208. [57] Neill DB, Cooper GF. A multivariate bayesian scan statistics for early event detection and characterization. Mach Learn 2010;79:261–82. [58] Fram DM, Almenoff JS, Dumouchel W. Empirical bayesian data mining for discovering patterns in post-marketing drug safety. In: Proceedings of the ninth ACM SIGKDD international conference on Knowledge discovery and data mining; 2003. p. 359–68.
131
[59] Wong W-K, Moore A, Cooper G. WSARE: what’s strange about recent events? J Urban Health 2003;80:i66. [60] Feldt S, Waddell J, Hetrick VL, Zocholwski M. Functional clustering algorithm for the analysis of dynamic network data. Phys Rev E Stat Nonlin Soft Matter Phys 2009;79:056104. [61] Hulth A, Rydevik G. GET WELL: an automated surveillance system for gaining new epidemiological knowledge. BMC Public Health 2011; 11:252. [62] Carneiro HA, Mylonakis E. Google trends: a web-based tool for real time surveillance of disease outbreaks. Clin Infect Dis 2009;49:1557–64. [63] Gaudart J, Giorgi R, Poudiougou B, Toure´ O, Ranque S, Doumbo O, et al. De´tection de clusters spatiaux sans point source pre´de´fini : utilisation de cinq me´thodes et comparaison de leurs re´sultats. Rev Epidemiol Sante Pub 2007;55:297–306. [64] Li D, Xia S, Sui H, Zhang X. Change detection based on spatial data mining. ISPRS Workshop on updating geo-spatial databases with imagery; 2007;95–102.