Aspects sémantiques de la description des trajectoires de patients

Aspects sémantiques de la description des trajectoires de patients

ITBM-RBM 2000 ; 21 : 3 18-22 0 2000 fiditions scientifiques et mkdicales Contribution originale Elsevier SAS. Tous droits r&ervCs Aspects sbmanti...

962KB Sizes 2 Downloads 123 Views

ITBM-RBM 2000 ; 21 : 3 18-22 0 2000 fiditions scientifiques et mkdicales

Contribution originale

Elsevier

SAS. Tous droits

r&ervCs

Aspects sbmantiques de la description des trajectoires de patients A. Burgun*, P. Le Beux Laboratoire d’informatique cedex, France (Rey

r&dicale,

le 1~ mars 2000 ; r&is6

faculte’

de t&de&e

le ler juin 2000 ; accept6

de Rennes,

avenue

le ler septembre

du Professeur-Uon-Bernard,

35043

Rennes

2000)

R&urn6 Les terminologies medicales contrMes repksentent des composants fondamentaux des syst&mes d’information m6dicaux permettant le partage d’information. Le d&eloppement des kseaux de sank5 et des bases d’information partagees pose le probkme de I’int&op&abilit6 skmantique entre des systemes distribu& h&&ogGnes. Cobjectif est d’analyser I’int&op&abilit6 s6mantique dans le domaine de la repr6sentation des processus de prise en charge et des trajectoires de patients. Les reprksentations conceptuelles sous-jacentes tiennent compte des besoins et altentes des diffkrents utilisateurs. 0 2000 Editions scientifiques et medicales Elsevier SAS interopCrabillt6 skmantique / partage contr6Me I trajectoire de soins

d’information

Summary - Aspects of the representation

/ systeme d’information

en sant6 I terminologie

of patients’ paths in the healthcare process.

Controlled medical terminologies play a central role in medical information systems which allows sharing of information. Development of community health information networks raises the issue of semantic interoperability between distributed and heterogeneous systems. The main objective of this paper is to analyse semantic interoperability from the point of view of the health care process representations. The underlying conceptual representations need to address the requirements of their intended users. 0 2000 Editions scientifiques et m&dicales Elsevier SAS controlled terminology interoperability

I health information

INTRODUCTION “Terminologies are now sojbvare” tcrit Rector dans un article rCcent [l]. Les terminologies mtdicales reprbentent aujourd’hui des composants fondamentaux de l’intCgration des dossiers mkdicaux Clectroniques, des systb mes d’aide B la dkcision et des systbmes documentaires [2, 31. L’intCret d’intCgrer ces diffkents systbmes rkside

* Correspondance et tirh ri part : A. Burgun, dbpartement tion mkdicale, CHU de Pontchaillou, rue Hem+le-Guilloux, Rennes cedex, France.

d’informa35033

system I information

sharing I patient care path I semantic

dans le rapprochement des bases de don&es patients et des bases de connaissances, pour apporter les connaissances utiles B la decision dans le contexte de la prise en charge d’un patient, et d’enrichir les connaissances par les donnCes patients. Dans les terminologies mkdicales, on peut distinguer quatre niveaux de connaissances : conceptuel, linguistique, infkrentiel et pragmatique. Le niveau conceptuel est central et conditionne la rep&entation des autres niveaux de connaissance. Le dkveloppement de bases conceptuelles partageables en mkdecine facilite la communication entre les acteurs du systbme de santC et permet la coexistence et I’interopCrabilitC entre systkmes et contribue B unifier un projet multipartenaire.

Aspects sCmantiquesde la description des trajectoires de patients

11s’integre dam le developpement de systemes d’information en Sante plus fiables et plus coherents. L’idte de <
Les informations recueillies 101-sdes contacts du patient avec le systhme de soins Le recueil des informations doit se baser sur des standards. Ces sysdmes terminologiques doivent avoir certaines caracteristiques : contenir le vocabulaire du domaine, faciliter l’orientation dans la base de concepts, gerer la polyhierarchie, donner une definition des objets, permettre des granularitCs multiples, autoriser differentes vues d’un mCme concept views, prendre en compte le contexte, &tre Cvolutivif [6]. Un certain nombre de standards sont diffuses et utilises dans des contextes varies. L’Unified Medical Language System de la National Library of Medicine en est un exemple [7]. Le codage des informations mtdicales dans Agora Data est base sur la Classification internationale des maladies (CIM), dixibme revision [8]. Le fait que la CIM soit integree dans I’UMLS ouvre toutes les possibilites d’utiliser l’UMLS, en particulier &tre implemente entre la base Agora et des bases documentaires ou des bases de connaissances.

La modClisation des trajectoires en tant que telles Pour cela, il serait interessant de nommer les attributs des trajectoires, transformant les don&es numeriques en symboles.

DONNdES NUMikIQUES

ET SYMBOLIQUES

Variables semi-quantitatives Qu’il s’agisse d’epidemiologie descriptive, d’estimation ou de comparaison, d’enqdtes specifiques ou de travail portant sur des donnees exhaustives, les phenomenes Ctudies par l’tpidtmiologiste sont d&its sous la forme de

319

variables, c’est-a-dire d’items pouvant prendre des valeurs differentes. Certains phenombnes sont don&s en termes de presence ou d’absence : on est vivant ou mort, on exerce la profession X ou la profession Z. Les variables correspondantes sont des variables qualitatives et peuvent &tre nommees. Les valeurs susceptibles d’etre prises par la variable sont les modalites de cette variable. D’autres phenomenes s’expriment sous la forme d’une grandeur mesurable. Les variables correspondantes sont dites <.Une variable quantitative peut Ctre transformee en variable qualitative en regroupant en classes les valeurs qu’elle peut prendre. Les criteres choisis pour Ctablir les classes sont fonction de l’objectif d’analyse fix& L’ensemble de ces classes represente une Cchelle de classification [9]. L’age est une variable quantitative qui prend une succession de valeurs pour les differents individus de la population et qu’on peut transformer en variable qualitative. Ainsi, pour ce qui conceme l’age d’une population, on pourra denombrer le nombre de jeunes et de vieux apres avoir determine l’age a partir duquel on devient >ou <est donnee par un point de rep&e arbitraire, des references statistiques, des references culturelles ou les autres concepts du m&me champ semantique [lo].

Les modificateurs L’Ctude des modificateurs qui ont CtCrecenses a partir des don&es recueillies lors du test sur le vocabulaire medical mene par la National Library of Medicine et le AHCPR illustre la place des variables semi-quantitatives dans le langage medical. Ce test, le Large Scale Vocabulary Test (LSVT), avait pour objectif de determiner si le vocabulaire utile en medecine ttait present dans la base UMLS [ll]. Au total, sur les 41 127 termes soumis, 11 387 etaient plus precis que les termes existant dans le Metathesaurus UMLS. Ces precisions supplementaires ttaient souvent likes a l’utilisation de modificateurs. A partir des 4 700 termes qui differaient simplement par la presence d’un modificateur, une liste de modificateurs apparaissant plus de cinq fois a CtCCtablie. Cette liste fait reference a plusieurs categories semantiques : localisation anatomique, concepts qualitatifs, concepts temporels, concepts quantitatifs, concepts spatiaux, concepts fonctionnels ou Ctiologie [ 121. Dans le projet Myth, la categoric <>contient 44 descripteurs utilises pour d&ire

320

A. Burgun,

des procedures medicales. On trouve parmi ces descripteurs : periode de 24 heures, aigu, retard& premier temps d’une procedure en plusieurs Ctapes, recent, secondaire, urgent. D’autres descripteurs precisent le moment de l’intervention dans la vie du patient [ 131. Ces donnees concordent avec les resultats du projet Maoussc [ 141. Plus de 2 000 actes du Catalogue des actes medicaux ont CtC d&its selon ce modble base sur huit dimensions de description : la nature de l’acte (extrese, incision, etc.), la topographie (partie de l’organisme sur laquelle Porte l’action), l’instrument, la voie d’abord, dimensions auxquelles on rajoute en fonction du type d’action : le materiel mobilist, un complement de topographie, le processus physiologique, la pathologie. L’utilisateur peut completer la description selon ce modble en ajoutant des moditicateurs. On constate que 960 instances de modificateurs ont CtC necessaires (on peut avoir plusieurs modificateurs pour un m&me acte). Dans 678 cas, correspondant a 58 modificateurs differents, ces modificateurs correspondaient a des donnees semi-quantitatives (par exemple lesion inferieure a 4 cm2) ou temporelles (recent, reintervention, temporaire, etc.). Ces modificateurs modifient le sens intrinseque du terme. 11sdoivent Ctre pris en compte.

Exemples en sbmiologie medicale Les variables semi-quantitatives donnees a priori sans definition donnent lieu a interpretations multiples. Cette variete d’interpretations est a l’origine de malentendus pas toujours d&oil& et de reponses non adequates des systbmes d’aide a la decision ou des systemes documentaires. Le systbme d’aide au diagnostic medical ADM constitue une vaste base de connaissances mtdicales initiee il y a une vingtaine d’annees pour repondre a deux objectifs principaux : aider les medecins a porter des diagnostics et leur offrir un accbs rapide a l’information medicale en utilisant les reseaux telematiques [ 151. La base de connaissances actuelle couvre l’ensemble de la medecine. Elle comporte les descriptions de 15 600 maladies, syndromes et formes cliniques. Elle est associte a un dictionnaire de donnees, ou lexique, riche de 110 000 entites et a un dictionnaire de 45 000 mots ou segments lexicaux. Les fonctionnalites du systeme comprennent : evocation diagnostique, strategie de demandes d’examens complementaires, interaction entre maladie et prise de mtdicament, prise en compte de circonstances particulibres comme la grossesse et l’allaitement, support documentaire. Ce systeme a CtC aliment6 par un grand nombre de mtdecins, ce qui donne lieu a une certaine hCtCrogenCitC de description des maladies. Nous fournissons ici quelques exemples de variables semi-quantitatives en semiologie medicale tires du systeme ADM.

P. Le Beux

La notion de polyadenopathie est utilisee de faGon diverse. Quand on interroge la base ADM avec <>,le sysdme propose des symptomes de la m&me famille : polyadenopathie gtneralisee (utilise dam 5 1 descriptions de maladies), polyadenopathie regionale (26), micropolyadenopathie (12), polyadenopathie cervicale (lo), polyadtnopathie superficielle (9), polyadb nopathie profonde sous-diaphragmatique (3), polyadtnopathie symetrique (2). Le terme 4 polyadenopathie >>en tant que tel est utilise tantbt pour des adenopathies tres localides, pouvant Ctre uniques comme dans la description du cancer primitif de la langue portion mobile (c’est la seule description de cancer ORL utilisant cet item dans 1’ADM) ou pour des atteintes de plusieurs territoires ganglionnaires. Cet exemple montre que, alors qu’on peut estimer que la definition du concept adenopathie est partagee par les medecins, la notion de polyadenopathie doit &tre definie de fagon explicite dans les systbmes que nous utilisons. La notion d’elements <>est arbitraire et fortement dependante du contexte. Ainsi, on trouve dans l’ADM, les items : - vesicule nombre grand > 20 - vesicule nombre moyen 10 a 20 - vesicule nombre petit < 20 - vesicule isolee /I vesicule nombre unique. Cela signifie que certains medecins considerent qu’il y a un petit nombre de ces elements lorsque qu’ils sont moins de 20, tandis que d’autres considtrent qu’un petit nombre correspond a moins de dix elements... avec de surcroit dans cet exemple un problbme de couverture du domaine : quid des 20 elements exactement ? La qualification de la taille <>ou (t petite B souleve les m&mes problbmes. Dans l’exemple ci-dessous, <>n’a pas de place a priori puisque jusqu’a cinq millimbtres on parle de <>et a partir de cinq millimbtres, on parle de < 5 mm) { 23 descriptions). Passer d’une notion comme <est une dtmarche de categorisation. Utiliser des categories realise une Cconomie cognitive (on simplifie le monde complexe) [16] et facilite l’expression : il est plus facile de s’exprimer et de se faire &outer d’un public avec des variables qualitatives que quantitatives, natremie normale ou anormale est plus <>que natremie en meq. Cependant, ces exemples montrent que la communication, le partage, la comprehension de ces informations ne vont pas de soi. Ce probleme a tte illustre par des exemples en

Aspects

skmantiques

de la description

des trajectoires

de patients

321

sank! ? Une approche semantique doit prendre en compte le contexte. C’est ce que Kayser appelle l’adaptation sCmantique : on transforme un mot ou une expression en un contenu semantique en tenant compte du contexte [17]. Cela se retrouve pour la dimension temporelle en fonction de la pathologie, par exemple la notion de guerison rapide n’a de sens que dans le contexte d’une maladie don&.

Rdponse ontologique

semiologie medicale mais on devrait le retrouver dans le champ de la description des trajectoires de patients.

DON&ES SPATIOTEMPORELLES ET DESCRIPTION DES TRAJECTOIRES Trois types de reponses peuvent etre donnts au probleme de representation des trajectoires de patients.

RCponse statistique Elle consiste a decrire la population CtudiCe selon la distribution des parametres CtudiCs et a en deduire ce qui est petit, grand, frequent, rare, etc. 11reste neanmoins : - a expliciter les items pour reduire 1’ambiguYte. Une barriere principale au partage semantique est le manque de documentation des bases de donntes et bases de connaissances. 11faut done rendre explicites toutes les assertions sous-jacentes. 11 faut mettre en oeuvre quelques regles simples comme documenter tout choix, donner une delinition de chaque terme, donner des exemples, Cviter les expressions ambigues, etc. ; - a donner de facon Claire et pragmatique les criteres d’inclusion d’un individu dans une categoric. Cela se distingue de la definition des items dans la mesure ou on a besoin ici, non pas d’une definition classique de l’item mais des criteres permettant de decider si l’individu appartient a la categoric ou non. De man&e similaire aux critbres donnes dans le DSM ou dans les manuels des CLIN. Quelle que soit la definition de la maladie schizophrenie par exemple, on veut pouvoir dire si ce patient presente les critbres permettant de porter le diagnostic ; - a traduire les resultats numeriques obtenus de facon symbolique partag& De la meme facon qu’on qualifie le nombre de lesions dermatologiques de grand, moyen ou petit, sur quels criteres dirons-nous qu’un patient a un grand nombre, un nombre moyen ou petit de contacts avec le systeme de

Elle consiste a rep&enter les objets du monde et les Cvtnements de facon unifiee. Cela est done du ressort du developpement des ontologies dans le domaine de la Sante. L’objectif est de : - rendre les systemes interopCrants ; - assurer la qua&C des bases de donnees partagees ; - faciliter le travail d’analyse des bases constituees et peut-&tre permettre des exploitations multiples ; - integrer le recueil d’information sur les trajectoires patients dans un processus plus large de representation unifiee dans le champ de la same ; - faciliter la maintenance des systemes specifiques et leur convergence progressive, par exemple entre les recueils en soins primaires et les autres types de prise en charge. Le Comite europeen de normalisation (CENZTC25 1) a initie un travail sur la representation des situations cliniques. Ce travail a abouti 1 la d&%&ion d’amhetypes de situations, dont les tableaux II et 111donnent deux exemples tires de http:// zeus.eulogos.ithetypes/archetypes-list.htm. Un evenement est d&tit de facon standardi& en faisant r6femnce a une terminologie contr616e.Cette terminologie contr6lee est generique rnais doit etre suffisamment flexible pour s’adapter a des contextes professionnels sp6ciIiques. Des travaux de psychologie cognitive suggenentque pour rkpondre aux besoins reels des utilisateurs, on examine le contexte naturel dam lequel les pmfessionnels de santeacquiktent, compmnnent, utilisent et negccient la connaissancedam leur pratique, au lieu de l’approche <
RCponse normative Elle consiste a developper des systemes de representation tenant compte des referentiels de prise en charge, des recommandations de bonne pratique, des references medicales opposables, des protocoles divers. C’est done la comparaison d’une pratique a ce referentiel qui permet de qualifier cette pratique. Elle se heurte a trois obstacles : - la mtthodologie de construction du referentiel : le referentiel doit-il &n-eun objectif, et dans ce cas quelles sont les motivations qui l’orientent et le fixent ? Le referentiel doit-il &tre le reflet d’une pratique, et si oui quels moyens mettre en ceuvre pour l’elaborer ? Quel doit etre le role des differents partenaires dans ce processus ?

322

A. Burgun,

P. Le Beux

Aprtts des travaux initiaux sur les terminologies m&kales proprement dites (signes, maladies, a&es), les initiatives de partage d’information entre partenaires du systkmede sant15et d’analyse des pratiques conduisent a explorer la terminologie et les representationsconceptuelles des tmjectoires de patients. On imagine desexpressionscomprisespar tous les partenaims, mettant des mots sur les trajectoims, permettant de park de lombalgique avec prise en charge chronique par g&&aliste et paroxysmes hospitaliers, comme on parle de douleur chronique avec paroxysmes nocturnes. Ces travaux posent le probleme de la catkgorisation des don&es quantitatives avec passagedu nurrkrique au symbolique. 11sse hem-tent au poids d’une conception normative des pratiques medicales.

RdFfiRENCES

- l’evolution du referentiel dans le temps ; - la perception du rtferentiel par les professionnels de sank? et les partenaires d’un projet de partage d’information, perception qui reste subjective. Et l’on peut relever le fait selon lequel, alors que l’on Ctudie les trajectoires des patients dans le systeme de Sante, ce sont les attitudes des mtdecins a l’egard des patients qui conditionnent au moins en partie ces trajectoires. 11importe dans une approche normative d’enregistrer : - les situations dans lesquelles surviennent les contacts du patient avec le systkmede soins : premi&e plainte, suivi d’une pathologie admss6epar un confrere, et autres situations ; - le degre de certitude exprime par le medecin ; - ce que decide le medecin lors de la visite afin de le comparer a ce que fera le patient.

CONCLUSION Un certain nombre de travaux concernant les ontologies dans le secteur santt sont en tours. 11sconstituent une condition fondamentale au partage d’information.

1 Rector AL. Thesauri and formal classifications: terminologies for people and machines. Methods Inf Med 1998 ; 37 : 501-9. 2 Fieschi M, Botti G, Butgun A, Joubert M, Volot F, Degoulet P, et al. Integration semantique et serveuts de terminologies dam les syst&mes d’infomiation de sant& Tecbnologie et Sante 19% ; 27 : 108-15. 3 Degoulet P, Sauquet D, Jaulent MC, Zapletal E, Lavril M. Rationale and design considerations for a semantic mediator in health information systems. Methods Inf Med 1998 ; 37 : 5 18-26. 4 Rossi Mori A, Consorti F, Galeazzi E. Standards to support development of terminological systems for healthcare telematics. Methods Inf Med 1998 ; 37 : 551-63. 5 Happe A, Burgun A, Le Duff F, Simaga F, Bremond M, Le Beux P Internet for pooling and sharing patients data in order to analyse the health care process: the Agora Data project. Communication Mednet 98. European Congress of the Internet in Medicine; London, UK ; 1998 Nov. 16. , Cimino JJ. Desiderata for controlled medical vocabularies in the twenty-first century. Methods Inf Med 1998 ; 37 : 394-403. UMLS Knowledge Sources Tenth Experimental Edition. Bethesda, MD: National Library of Medicine; 1999. Organisation mondiale de la Sante. Classification statistique intemationale des maladies et des problemes de Sante connexes. Dixieme revision. Geneve : Organisation mondiale de la same. 9 Jeniceck M, Cleroux R. Epidemiologic, principes, techniques, applications. Paris : Maloine, 1984. 10 Botti G, Burgun A, Le Beux P, Fieschi M. Pour une bonne representation des informations et des connaissances mtdicales dans les systemes d’information de Sante. ISIS 1999 ; 2/3 : 13-26. 11 Humphreys BL, McCray AT, Cheh ML. Evaluating the coverage of contded health data terminologies: report on the results of the NLM/AHCPR large scale vocabulary test. J Am Med Inform Asscc 1997 ; 4 : 484-500. 12 McCray AT, Browne AC. Discovering the modifiers in a terminology data set. Proceedings AMIA Annual Fall Symposium; 1998. p. 780-4. 13 Multilingual hypertextual thesaurus for healthcam. http&eus.eulogos.it/itb/ 14 Burgun A, Denier P, Bcdenreider 0, Botti G, Delamarre D, Pouliquen B, et al. A Web terminology server using UMLS for the description of medical procedures. J Am Med Inform Assoc 1997 ; 4 : 356-63. 15 Lenoir P, Roger MJ, Frangeul C, Chales G. Creation, development and maintenance of the data-base of a computer-assisted diagnostic system ADM. Med Inform 1981 ; 6 : 51-6. 16 Rosch E. Principles of categorization in Cognition and Categorization. Hillsdale, NJ: L. Erlbaum Associates; 1978. 17 Kayser D. Ontologically yours, conceptual structures: theory, tools and applications. Lectures Notes in Artificial Intelligence. Proceedings ICCS 98; 1998. p. 35-48. 18 Pate1 VL, Kushniik AW. Understanding, navigating and communicating knowledge: issues and challenges. Methods Inf Med 1998 ; 37 : 460-70.