medicina nuclear basada en la evidencia
Evidencias en Medicina Nuclear Evidences in Nuclear Medicine S. ÁLVAREZ RUIZa, J. CORTÉSa, E. GOÑIa, P. ALCORTAa, J.I. ALONSOa Y E. AÑORBEb a
Sevicio de Medicina Nuclear. Hospital Santiago Apóstol. Vitoria. España. Servicio de Radiología. Hospital Santiago Apóstol. Vitoria. España.
b
INTRODUCCIÓN
El objetivo de la sección que iniciamos es proporcionar a los lectores de la Revista Española de Medicina Nuclear (REMN) breves resúmenes periódicos comentados de los mejores artículos publicados a intervalos de tiempo determinados. Inicialmente este intervalo será de un semestre natural, pero nuestro propósito es que sea trimestral. Secciones como ésta ya existen en muchas revistas de especialidades y generales, e incluso hay revistas únicamente dedicadas a este propósito (Evidence-Based Medicine, ACP Journal Club, etc.). Como ellas, por medio de la aplicación de criterios de lectura crítica pretendemos conseguir artículos con un alto nivel de evidencia. Es decir, artículos metodológicamente válidos y clínicamente relevantes en el campo de la Medicina Nuclear. La necesidad de esta selección se fundamenta en la imposibilidad, por parte de un profesional normal, de abarcar la ingente cantidad de literatura científica que se publica diariamente, la mayoría con un nivel de calidad metodológica menor que la deseable. En efecto, un trabajo de Reid et al1 revisando el cumplimiento de 7 criterios de calidad metodológica en artículos de pruebas diagnósticas publicados en 4 revistas de primera línea, mostró que únicamente el 44 % de ellos cumplió 3 ó más criterios de calidad en el período analizado (1990-1993) y sólo el 6 % cumplía más de 6 criterios. En otro trabajo, Lijmer et al2 revisan 184 trabajos publicados entre 1996 y 1997, que evaluaban 218 tests diagnósticos. Observan que cumplen los 8 criterios de calidad que analizaron
Correspondencia: SOLEDAD ÁLVAREZ Servicio de Medicina Nuclear Hospital Santiago Apóstol C/ Olaguibel, 29 01004 Vitoria
sólo el 6,8 % de los artículos. Esto no es una cuestión académica ni de mera corrección formal. Se ha demostrado empíricamente que el incumplimiento de los estándares de calidad genera una sobrevaloración de la utilidad de los tests diagnósticos2,3. En el campo de la Medicina Nuclear, un reciente artículo muestra cómo el sesgo de verificación modifica significativamente los resultados de efectividad diagnóstica en la aplicación de la 18F-FDG en el cáncer de pulmón4.
MÉTODO
1. Búsqueda de artículos. No pretende ser exhaustiva, pero sí específica por el contenido y por el tipo de información y calidad que ofrezcan los artículos. a) Bases: Medline y Embase. b) Términos de búsqueda generales relacionados con la medicina nuclear: Isotop* or scintigraph* or radionuclide or nuclear medicine or Tc or technetium or SPECT or SPET or single photon or 18F or PET or positron or FDG; campos: Title/Abstract. c) Límites: fecha de publicación; tipo de estudio: clinical Trial, meta-analysis, randomized controlled trial, review, classical article, comparative study, controlled clinical trial, evaluation studies, journal article, multicenter study, english, french, Spanish. d) Combinar (AND) estos resultados con términos más restrictivos o con filtros metodológicos o clínicos: sensitivity OR specificity; campos: Title/Abstract. 2. Selección. El tipo de estudio más apropiado para la evaluación de una prueba diagnóstica es el transversal: selección prospectiva o transversal de pacientes provenientes de un conjunto mezclado enfermos-no enfermos sin que se conozca el diagnóstico (tal como suele ocurrir en clínica) y a los que se reali-
Rev Esp Med Nucl. 2008;27(1):63-72
63
Álvarez Ruiz S et al. Evidencias en Medicina Nuclear
Tabla 1
Tabla 3
TABLA DE 2X2 DE EFECTIVIDAD DIAGNÓSTICA
CRITERIOS PARA LA VALORACIÓN DE UN ARTÍCULO SOBRE DIAGNÓSTICO
Prueba de referencia Prueba problema
+
–
+ –
VP (a) FN (c) a+c
FP (b) VN (d) b+d
a+b c+d N=a+b+c+d
a + c: enfermos según la prueba de referencia (prevalencia de enfermedad o probabilidad preprueba); a + b: casos con la prueba problema positiva; b + d: no enfermos según la prueba de referencia; c + d: casos con la prueba problema negativa; FN: falsos negativos (enfermos con la prueba negativa); FP: falsos positivos (no enfermos con la prueba positiva); VN: verdaderos negativos (no enfermos con la prueba negativa); VP: verdaderos positivos (enfermos con la prueba positiva). Sensibilidad: VP/VP + FN. Especificidad: VN/VN + FP. Valor predictivo positivo: VP/VP + FP. Valor predictivo negativo: VN/VN + FN. Tabla 2 CLASIFICACIÓN DE LOS NIVELES DE EVIDENCIA CORRESPONDIENTE A LOS DISTINTOS TIPOS DE DISEÑO DE ESTUDIOS DE PRUEBAS DIAGNÓSTICAS Nivel I Estudios de validación de criterios diagnósticos (previamente desarrollados) en series de pacientes consecutivos con aplicación sistemática de un gold standard apropiado (diseño transversal) Revisiones sistemáticas de estudios de nivel I Nivel II Desarrollo de criterios diagnósticos en pacientes consecutivos con aplicación sistemática de un gold standard apropiado Revisiones sistemáticas de estudios de nivel II Nivel III Estudios de pacientes no consecutivos sin aplicación sistemática de un gold standard apropiado Revisiones sistemáticas de estudios de nivel III Nivel IV Estudios de casos-controles Gold standard no apropiado Nivel V Opinión de expertos Fuente: Centre for Evidence-Based Medicine, Oxford, UK. Disponible en: www.cebm.net
za la prueba problema y la estándar. A partir de este diseño pueden calcularse sensibilidad y especificidad y también valores predictivos (tabla 1) ya que se trata de una muestra representativa cuya prevalencia puede conocerse. En la tabla 2 se muestra una clasificación del nivel de evidencia de los tipos de investigación que se pueden realizar para la evaluación de pruebas diagnósticas. 64
¿Son válidos los resultados del estudio acerca de la efectividad de una prueba diagnóstica? ¿Existió una comparación ciega e independiente de la prueba a estudio con un estándar de referencia? ¿Fue la prueba diagnóstica evaluada en un espectro adecuado de pacientes (como en los que se aplicará la prueba diagnóstica en la práctica clínica)? ¿Fue el estándar de referencia aplicado, independientemente del resultado de la prueba a estudio? ¿Demuestran estos resultados (válidos) una adecuada capacidad de la prueba para distinguir los pacientes que tienen y no tienen la enfermedad? ¿Se presentan los resultados de efectividad del examen o se proporcionan los datos necesarios para su cálculo? ¿Puedo aplicar estos resultados válidos e importantes en la asistencia a mis pacientes? ¿Es la prueba disponible, reproducible, segura y precisa en nuestro medio? ¿Podemos hacer una estimación de la probabilidad pretest de nuestro paciente? ¿Afectará la probabilidad postest resultante el manejo de mi paciente y le ayudará a estar mejor?
a) Lectura y cribado del listado de títulos. En esta fase se excluyen los artículos no relacionados con la Medicina Nuclear, los casos clínicos y series de casos, las cartas al director, los editoriales, los resúmenes de congresos, los publicados en revistas no accesibles. Obtención de los resúmenes del resto. b) Lectura y cribado de los resúmenes. Se excluyen los que no tienen la Medicina Nuclear como tema central, los que no aportan resultados de sensibilidad, especificidad o cocientes de probabilidad, las revisiones no sistemáticas, los estudios de laboratorio o en animales, los estudios de casos y controles, los estudios retrospectivos (con excepciones), los que muestran sesgos evidentes de selección o verificación y los estudios que no son de aplicación clínica directa. c) Obtención del texto completo de los que queden. Lectura crítica y selección de los que cumplan criterios de calidad, tengan resultados aplicables y muestren relevancia clínica. Los principales objetivos de la lectura crítica son: valorar la validez interna (veracidad o aproximación a la verdad) de los resultados del estudio y valorar la validez externa (utilidad o aplicabilidad clínica de los resultados). Para evaluar estos aspectos adaptaremos la guía modificada que aparece en la 2.ª edición del libro Evidence-Based Medicine de Sackett et al5 (tabla 3).
Rev Esp Med Nucl. 2008;27(1):63-72
Álvarez Ruiz S et al. Evidencias en Medicina Nuclear
Tabla 4 SESGOS POTENCIALES EN LOS ESTUDIOS SOBRE PRUEBAS DIAGNÓSTICAS
Sesgo de selección
Modo de producción
Consecuencias
Espectro clínico o comorbilidad de la enfermedad no totalmente representado
Sobrestima la S y E si se eligen casos graves y se infraestima si son leves
Representar el espectro completo en la muestra. Pacientes consecutivos. Análisis de subgrupos
Sobrestima S y E
Seguimiento clínico de los enfermos con manejo predefinido
Sesgo del gold standard no apropiado No se dispone de una apropiada y se usa una imperfecta
Forma de evitarlo
Sesgo de incorporación
Elementos de la prueba diagnóstica Sobrestima S y E forman parte del gold standard
Separación clara de la prueba diagnóstica y el gold standard
Sesgo de revisión o valoración ciega
La interpretación de la prueba diagnóstica y del gold standard se realiza conociendo el resultado de la otra
Sobrestima S y E
Enmascaramiento e independencia de las personas que interpretan las pruebas
Sesgo de verificación diagnóstica
El resultado de la prueba diagnóstica condiciona la realización o no del gold standard
Sobrestima S e infraestima E
Realización del gold standard a todos los pacientes del estudio o establecer seguimiento como segundo standard
E: especificidad; S: sensibilidad. Tomada de Cabello López JB et al6.
3. Confección de un resumen de los mejores artículos que incluya un título explicativo, los principales datos de calidad metodológica, sesgos (tabla 4)6, nivel de evidencia, resultados principales y un comentario sobre la aplicabilidad e importancia clínica. Adaptaremos el tipo de resumen que se utiliza en la revista Evidence-Based Medicine. Se hará una reseña breve de algunos otros artículos seleccionados a texto completo.
BIBLIOGRAFÍA 1. Reid MC, Lachs MS, Feinstein AR. Use of methodological standards in diagnostic test research. Getting better but still not good. JAMA. 1995;274:645-51. 2. Lijmer JG, Mol BW, Heisterkamp S, Bonsel GJ, Prins MH, van der Meulen JHP, et al. Empirical evidence of design-related bias in studies of diagnostic test. JAMA. 1999;282:1061-6. 3. Mower WR. Evaluating bias and variability in diagnostic test reports. Ann Emerg Med. 1999;33:85-91. 4. Lauer MS, Murthy SC, Blackstone EH, Okereke IC, Rice TW. [18F]Fluorodeoxiglucose uptake by positron emission tomography for diagnosis of suspected lung cancer. Arch Intern Med. 2007;167:161-5. 5. Sackett DL, Straus SE, Richardson WS, Rosenberg W, Haynes RB. Evidence-based medicine. How to practice and teach EBM. 2nd ed. London: Churchill Livingstone; 2000. 6. Cabello López JB, Pozo Rodríguez F. Estudios de evaluación de las pruebas diagnósticas en cardiología. Rev Esp Cardiol. 1997; 50:507-19.
SELECCIÓN DE ARTÍCULOS PUBLICADOS ENTRE ENERO Y JUNIO DE 2007
Se ha realizado una revisión bibliográfica de los artículos publicados del 1 de enero al 30 de junio de 2007 mediante un buscador informático (Ovid-Medline, Ovid Technologies). Los términos de búsqueda empleados han sido: [Isotop* or scintigraph* or radionuclide or nuclear medicine or Tc or technetium or SPECT or SPET or single photon or 18F or PET or positron or FDG; campos: Title/Abstract. Límites: fecha de publicación: 2007/03/01 to 2007/06/30; tipo de estudio: clinical Trial, meta-analysis, randomized controlled trial, review, classical article, comparative study, controlled clinical trial, evaluation studies, journal article, multicenter study, english, french, Spanish] AND [sensitivity OR specificity; campos: Title/Abstract]. Se han obtenido 515 artículos. Tras la lectura de los títulos se rechazaron 371 artículos. Se revisaron los resúmenes de los 144 artículos restantes, aceptándose 20 para la lectura del texto completo. Los 124 artículos restantes fueron rechazados por los siguientes motivos: 1. Revisiones no sistemáticas: 15. 2. Estudios preclínicos o notas técnicas: 19. 3. Temas no relacionados con la Medicina Nuclear: 8.
Rev Esp Med Nucl. 2008;27(1):63-72
65
Álvarez Ruiz S et al. Evidencias en Medicina Nuclear
4. 5. 6. 7. 8. 9.
Sesgos de selección y/o verificación: 33. Ausencia de gold standard: 11. Casos o estudios de caso-control: 7. Escaso número de pacientes: 17. Revista no localizable o artículo sin resumen: 4. Otras causas: 10.
Se hizo una lectura completa de los 20 artículos restantes realizando resumen y comentario de 8 de ellos. El resto no pasaron el filtro de la lectura crítica, casi todos ellos debido a que acumulaban sesgos de selección y verificación. De los 8 artículos comentados hemos incluido 2 con diseño de caso-control porque resultan ilustrativos para el comentario de cuestiones metodológicas, pero teniendo en cuenta que proporcionan una evidencia de nivel intermedio-bajo.
RESÚMENES COMENTADOS
1. Los hallazgos de 18F-FDG PET-TC son específicos para detectar metástasis mediastínicas en cáncer de pulmón no microcítico, incluso en una población con tuberculosis endémica.
Artículo fuente: Kim YK, Lee KS, Kim BT, Choi JY, Kim H, Kwon OJ, et al. Mediastinal nodal staging of nonsmall cell lung cancer using integrated 18F-FDG PET/CT in a tuberculosis-endemic country. Cancer. 2007;109:1068-77. Comentario
En el momento del diagnóstico, aproximadamente el 25 % de los cánceres de pulmón no microcítico tienen enfermedad candidata a cirugía1. En cáncer de pulmón no microcítico la selección de tratamiento apropiado para pacientes en estadios precoces es un importante objetivo de cara al manejo. Una inadecuada estadificación ganglionar podría llevar a indicar cirugía en pacientes con enfermedad localmente avanzada no detectada o por el contrario, a no indicarla en pacientes en estadios precoces que se beneficiarían de ella. Por esta razón, el propósito fundamental de los métodos de estadificación es minimizar el número de falsos positivos y falsos negativos. En esta población donde la tuberculosis es una enfermedad endémica, el valor predictivo negativo fue del 87 % (probabilidad de falso negativo del 13 %),
Objetivo
Evaluar la eficacia diagnóstica de 18F-FDG PET-TC para detectar metástasis mediastínicas en cáncer de pulmón no microcítico en una población con tuberculosis endémica
Tipo de estudio
Prospectivo. Transversal
Ámbito
Hospital terciario. Seúl. Corea
Pacientes
674 con cáncer de pulmón no microcítico remitidos para estadificación quirúrgica (32 % con TBC activa o residual): 169 T1, 417 T2, 43 T3, 45 T4
Prueba evaluada
18F-FDG PET/TC tras estadificación convencional. Criterio de positividad: aumento de FDG focal sin signos de calcificación benigna ni atenuación > 70 houselhold
Prueba de referencia
Todos quirúrgica: 121 mediastinoscopia, 309 mediastinoscopia + toracotomía y 244 toracotomía
Valoración de los resultados Ciega en 18F-FDG PET/TC Tipo de resultado
Variable cualitativa. S, E, VPP, VPN
Sesgos
Verificación: los resultados de la PET influyeron en la decisión de realizar toracotomía y probablemente en el muestreo de estaciones ganglionares (poco importante pues la gran mayoría recibieron toracotomía y el resto una alternativa aceptable [mediastinoscopia])
Nivel de evidencia
I-II
E: especificidad; PET/TC: tomografía por emisión de positrones/tomografía computarizada; S: sensibilidad; TBC: tuberculosis; VPN: valor predictivo negativo; VPP: valor predictivo positivo. Resultados VP
VN
FP
110 473 21 Si positivo foco FDG con o sin calcificación:
FN
Prev
S (%)
E (%)
VPP (%)
VPN (%)
70
27 %
61 % 71 %
96 % 84 %
84 % 62 %
87 % 0 88.7 %
E: especificidad; FN: falso negativo; FP: falso positivo; S: sensibilidad; TBC: tuberculosis; VN: verdaderos negativos; VP: verdaderos positivos; VPN; valor predictivo negativo; VPP: valor predictivo positivo.
66
Rev Esp Med Nucl. 2008;27(1):63-72
Álvarez Ruiz S et al. Evidencias en Medicina Nuclear
por lo que se hará una toracotomía en estos pacientes, ahorrando la mediastinoscopia. El valor predictivo positivo es del 84 % (probabilidad de falso positivo 16 %), lo que indica que en estos pacientes debe hacerse una mediastinoscopia para tomar una decisión final (teniendo en cuenta que privaríamos de la cirugía curativa al 16 % de los pacientes de forma inadecuada). La principal causa de la relativa baja sensibilidad es que los autores consideran que una captación nodal positiva con calcificación o alta atenuación es benigna. En conclusión, aún en las poblaciones con enfermedad granulomatosa endémica, tomografía por emisión de positrones/tomografía computarizada (PET/TC) es recomendable para la estadificación mediastínica con vistas a tomar decisiones de cara a la resección quirúrgica.
BIBLIOGRAFÍA 1. Mountain CF, Dresler CM. Regional lymph node classification for lung cancer staging. Chest. 1997;111:1718-23.
2. La 18F-FDG PET tiene una alta sensibilidad en la detección de metástasis a distancia en cáncer colorrectal, pero muy baja en la de metástasis ganglionares. Artículo fuente: Llamas-Elvira JM, RodríguezFernández A, Gutiérrez-Sáinz J, Gómez-Río M, Bellon-Guardia, Ramos-Font C, et al. Fluorine–18 fluorodeoxyglucose PET in the preoperative staging of colorectal cancer. Eur J Nucl Med Mol Imaging. 2007;34:859-67.
Objetivo
Evaluar la utilidad de FDG-PET en la estadificación inicial de pacientes con cáncer colorrectal en comparación con la estadificación convencional
Tipo de estudio
Prospectivo. Transversal
Ámbito
Hospital terciario. Granada. España
Pacientes
104 pacientes consecutivos remitidos al servicio de cirugía con diagnóstico de cáncer de colon (48) o recto (56). Cincuenta y tres hombres y 51 mujeres. Catorce excluidos de cirugía curativa por la extensión de la enfermedad: grupo de estudio 90 pacientes
Prueba evaluada
18F-FDG PET tras estadificación convencional. Criterio de positividad: aumento de FDG focal (valoración cualitativa)
Prueba de referencia
Estudio patológico de tumor y ganglios o exploración quirúrgica con biopsia o autopsia (90 casos), seguimiento y clínica (14 casos)
Valoración de los resultados Ciega en 18F-FDG PET y TC Tipo de resultado
Variable cualitativa: para metástasis ganglionares (N0/N1) y para metástasis a distancia (M0/M1). S, E, VPP, VPN
Sesgos
Verificación y posible incorporación en la estadificación M (las metástasis a distancia encontradas forman parte del diagnóstico final y deciden manejo)
Nivel de evidencia
I-II
PET: tomografía por emisión de positrones; TC: tomografía computarizada; VPN: valor predictivo negativo; VPP: valor predictivo positivo. Resultados en la detección de metástasis ganglionares
PET TC
VP
VN
FP
FN
Prev
S (%)
E (%)
VPP (%)
VPN (%)
10 12
40 40
2 2
38 36
53 53
21 25
95 95
83 85.7
51 54
E: especificidad; PET: tomografía por emisión de positrones; S: sensibilidad; TC: tomografía computarizada; VN: verdaderos negativos; VP: verdaderos positivos; VPN: valor predictivo negativo; VPP: valor predictivo positivo. Resultados en la detección de metástasis a distancia
PET TC
VP
VN
FP
FN
Prev
S (%)
E (%)
VPP (%)
VPN (%)
16 8
80 82
6 4
2 10
17 17
89 44
93 95
73 67
98 89
E: especificidad; PET: tomografía por emisión de positrones; S: sensibilidad; TC: tomografía computarizada; VN: verdaderos negativos; VP: verdaderos positivos; VPN: valor predictivo negativo; VPP: valor predictivo positivo. Rev Esp Med Nucl. 2008;27(1):63-72
67
Álvarez Ruiz S et al. Evidencias en Medicina Nuclear
Comentario
La precisa estadificación del cáncer colorrectal es fundamental para un pronóstico certero, pero fundamentalmente para tomar decisiones terapéuticas. La realización de cirugía curativa, quimio o radioterapia neoadyuvante o adyuvante o terapias paliativas, dependen en gran medida del estadio del tumor en el momento del diagnóstico1. Las técnicas habituales de imagen (ecografía, TC, resonancia magnética nuclear [RMN]) tienen una baja sensibilidad para la detección de metástasis ganglionares y además las cifras son ampliamente variables según los estudios2. Por lo tanto la estadificación N sólo puede conseguirse con el estudio histopatológico postquirúrgico. Como se muestra en este estudio prospectivo, la PET-FDG no mejora los resultados de las otras pruebas convencionales y no cabe utilizarlo de forma generalizada para este propósito. Quizá les ha faltado a los autores detallar si los ganglios detectados con TC y PET concuerdan o por el contrario la PET añade nuevos casos de metástasis ganglionares a los detectados por la TC (pruebas complementarias que añaden valor diagnóstico). La existencia de metástasis a distancia puede excluir la cirugía en ausencia de complicaciones locales. La posibilidad de abordar metástasis hepáticas resecables con o sin terapia neoadyuvante reductora previa exige la exclusión segura de otras metástasis a distancia3. Afortunadamente la FDG-PET tiene una alta sensibilidad y especificidad para la detección del estadio M. Esto, unido a la relativa baja prevalencia de metástasis a distancia de la muestra estudiada proporciona un alto valor predictivo negativo para decidir el tratamiento curativo. En la población estudiada es necesario realizar 104 FDG-TC para detectar 8 pacientes adicionales con metástasis respecto a la TC. Parece, pues, lo sensato hacer una selección de pacientes a los que realizar FDG-PET (metástasis hepáticas abordables, alta probabilidad de metástasis según TC, etc.) para optimizar recursos y evitar falsos positivos. En esta línea, dado el relativo bajo valor predictivo positivo sería necesario comprobar todos los positivos para no privar a algunos pacientes del tratamiento adecuado. BIBLIOGRAFÍA 1. Cohen AM. Preoperative evaluation of patients with primary colon cancer. Cancer. 1992;70:1328-72. 2. Beets-Tan RGH,Beets GL. Rectal cancer: review with emphasis on MR imaging. Radiology. 2004;232:335-46.
68
3. Adam R, Avisar E, Ariche A, Giachetti S,Azoulay D, Castaing D. Five-year survival following hepatic resection alter neoadyuvant therapy for non resectable colorectal cancer. Ann Surg Oncol. 2001;8:347-53.
3. La SPECT (tomografía por emisión de fotón único) de perfusión miocárdica es útil en el diagnóstico de cardiopatía isquémica en mujeres postmenopáusicas sintomáticas. Artículo fuente: Mieres JH, Makaryus AN, Cacciabaudo JM, Donalson D, Green SJ, Heller GV, et al. Value of electrocardiographically gated single-photon emission computed tomographyc myocardial perfusion scintigraphy in a cohort of symptomatic postmenopausal women. Am J Cardiol. 2007;99:1096-9. Comentario
Hoy se sabe que tradicionalmente la cardiopatía isquémica ha sido infraestimada en las mujeres, a pesar de que es la primera causa de muerte en los países occidentales y de que la proporción de mujeres que mueren por infarto de miocardio es mayor que la de hombres1. De igual modo, la representación de mujeres en los estudios sobre pruebas diagnósticas ha sido escasa, lo que puede limitar la aplicabilidad clínica. Por eso este estudio tiene interés. Y también porque, aunque con una muestra reducida, es un estudio prospectivo, con aplicación generalizada de un buen gold standard y se han evaluado las pruebas a ciegas. Los resultados muestran que la gated-SPECT de perfusión miocárdica es también útil en el diagnóstico de cardiopatía isquémica en mujeres sintomáticas postmenopáusicas sin antecedentes conocidos de esta enfermedad. Sin embargo, tenemos que tener presente, a la hora de aplicar los resultados, que se trata de pacientes con una alta prevalencia de enfermedad coronaria demostrada por angiografía (estenosis significativa en el 62 %) y que esto viene probablemente condicionado por la alta proporción de mujeres con angina típica incluidas (74 %). La angina típica en las mujeres es un modo de presentación de cardiopatía isquémica menos frecuente que en los hombres. Lo expuesto nos puede hacer pensar en la posibilidad de que se haya producido un sesgo de selección hacia pacientes más graves o con mayor probabilidad pretest individual, a pesar de cumplir criterios de probabilidad intermedia según la American College of Cardiology/American Heart Association (ACC/AHA). Los autores apuntan la utilización de
Rev Esp Med Nucl. 2008;27(1):63-72
Álvarez Ruiz S et al. Evidencias en Medicina Nuclear
Objetivo
Evaluar el valor clínico de la gated-SPECT en una cohorte de mujeres post-menopáusicas con síntomas sugestivos de enfermedad isquémica cardíaca
Tipo de estudio
Estudio prospectivo de comparación de resultados
Ámbito
Hospital universitario. Manhasset. New Cork
Pacientes
Criterio de inclusión: 42 mujeres post-menopáusicas sintomáticas (angina atípica 26 % y típica 74 %), riesgo pre-test intermedio (clasificación ACC/AHA), presencia de factores de riesgo, no evidencia por historia ni ECG de infarto, ni existencia de revascularización, enfermedad valvular ni fallo cardíaco congestivo
Prueba evaluada
Gated-SPECT reposo 201 Tl/stress 99mTc MIBI o protocolo en 1 día 99mTc MIBI (n = 2)
Prueba de referencia
Angiografía coronaria
Valoración de resultados
No se reflejan criterios de interpretación gammagráficos. Sí se indica que fue ciega (3 observadores ciegos respecto a historia y prueba de esfuerzo)
Tipo de resultado
S y E, no se dan los intervalos de confianza, ni datos de VPP ni VPN, si bien es posible hallarlos
Sesgos
Puede pensarse en la existencia de un sesgo de selección dada la alta prevalencia de enfermedad coronaria, quizás determinado o en relación con el hecho de que se evalúe el triple de pacientes con angina típica respecto a atípica
Nivel de evidencia
II
ACC: American College of Cardiology; AHA: American Heart Association; ECG: electrocardiograma; SPECT: tomografía por emisión de fotón único. Resultados expuestos en el trabajo:
Prueba esfuerzo ECG Gated-SPECT perfusión
Prevalencia (%)
Sensibilidad (%)
Especificidad (%)
62 62
66,7 88 0
68,8 87,5
ECG: electrocardiograma; SPECT: tomografía por emisión de fotón único. Resultados de la gated-SPECT hallados a partir de los expuestos en el estudio: VP
VN
FP
FN
VPP (%)
VPN (%)
23
14
2
3
88,5
82,3
FN: falso negativo; SPECT: tomografía por emisión de fotón único; VN: verdadero negativo; VP: verdadero positivo; VPN: valor predictivo negativo; VPP: valor predictivo positivo.
la gated-SPECT en pacientes sintomáticas, puesto que tiene mayor efectividad que la prueba de esfuerzo elctrocardiográfica (ECG). Pero para generalizar esta utilización serían necesarios estudios de costebeneficio, no sólo en términos económicos. En este estudio se realiza también un seguimiento a través de entrevista telefónica estructurada, para determinar el tiempo libre de eventos una media de 5 ± 3 años, concluyendo que las pacientes con SPECT negativa presentaban una supervivencia libre de eventos significativamente mayor que las pacientes con SPECT positiva. BIBLIOGRAFÍA 1.
Lloyd-Jones DM, Larson MG, Beiser A, Levy D. Lifetime risk of developing coronary Herat disease. Lancet. 1999;353:89-92.
4. ¿La SPECT de transporadores de dopamina ( I-FP-CIT) es útil para el diagnóstico de la demencia por cuerpos de Lewy? Artículo fuente: McKeith I, O’Brien J, Walker Z, Tatsch K, Booij J, Darcourt J, et al. Sensitivity and specificity of dopamine transporter imaging with 123I-FPCIT SPECT in dementia with Lewy bodies: a phase III, multicentre study. Lancet Neurol. 2007;6: 305-13. 123
Comentario
La demencia por cuerpos de Lewy (DCL) presenta una severa degeneración del sistema dopaminérgico nigroestriatal. Este hecho (ausente en otros tipos de demencias como la enfermedad de Alzheimer [EA]) ofrece un potencial marcador biológico de diagnóstico.
Rev Esp Med Nucl. 2008;27(1):63-72
69
Álvarez Ruiz S et al. Evidencias en Medicina Nuclear
Objetivo
Evaluar la eficacia del 123I-FP-CIT SPECT en el diagnóstico de la enfermedad por cuerpos de Lewy
Tipo de estudio
Estudio prospectivo en fase III. Caso-control. Preclínico
Ámbito
Estudio multicéntrico con participación de más de 40 países europeos
Pacientes
326 pacientes que cumplieron los estrictos criterios de inclusión: diagnóstico previo de demencia por cuerpos de Lewy probable (94), posible (57) o no Lewy (147)
Prueba evaluada
SPECT cerebral con 123I-FP-CIT
Prueba de referencia
Diagnóstico clínico: de demencia por cuerpos de Lewy probable, posible o no Lewy (consenso entre un panel de expertos). No incluye comparación con estándar de referencia histopatológico
Valoración de resultados
El análisis visual del 123I-FP-CIT SPECT fue realizado en un único centro de revisión por tres lectores ciegos al resultado clínico. Se evaluó la concordancia entre ellos
Tipo de resultado
Parámetros de eficacia diagnóstica: sensibilidad, especificidad, valor predictivo positivo y negativo (media e intervalo de confianza del 95 %)
Sesgos
Gold standard inapropiado (la clínica no es un diagnóstico de referencia en las demencias). De selección: en un estudio caso control (número arbitrario de pacientes con diagnóstico preestablecido) no se puede hablar de prevalencia ni de valores predictivos
Nivel de evidencia
III-IV
Resultados: sensibilidad, especificidad, valor predictivo positivo (VPP) y negativo (VPN) del 123I-FP-CIT SPECT para diferenciar entre pacientes con probable demencia por cuerpos de Lewy (DCL) y pacientes sin DCL (intervalo de confianza al 95 %) Sensibilidad (%)
Especificidad (%)
VPP (%)
VPN (%)
77,7 (64,1-88,3)
90,4 (82,1-95,5)
82,4 (68,1-91,7)
87,5 (79,4-93,4)
Resultados: proporción de 123I-FP-CIT SPECT patológicos en relación con los grupos clínicos de posible demencia por cuerpos de Lewy (DCL), probable DCL y no DCL (intervalo de confianza al 95 %) Probable DCL (%)
Posible DCL (%)
No DCL (%)
77,7 (64,1-88,3)
38,2 (22,2-48,6)
9,6 (4,5-17,9)
El objetivo del estudio de McKeith et al es evaluar la eficacia del 123I-FP-CIT SPECT en el diagnóstico de la enfermedad por cuerpos de Lewy. Con una elevadísima concordancia en la interpretación visual del 123I-FP-CIT SPECT se obtuvo una alta tasa de concordancia entre la captación estriatal alterada (SPECT patológica) y el diagnóstico clínico de probable demencia por cuerpos de Lewy (sensibilidad: 77,7 %, especificidad: 90,4 %). Pero, por el momento estas prometedoras cifras no deberían ser aplicadas en clínica por diversas razones: a) el diseño del estudio de casos y controles (3 grupos de pacientes ya diagnosticados con el gold standard que en este caso es la clínica) no permite una aplicación directa de los resultados, pues no son muestra ni prevalencia representativa; b) la muestra incluyó diferentes tipos de demencia con los que habitualmente se plantea el diagnóstico diferencial de la DCL (EA y demencia vascular), pero excluyen la enfermedad de Parkinson que tiene un comportamiento gammagráfico similar y c) más importante, el gold standard aplicado no es 70
adecuado, dado que la clínica tiene una limitada capacidad de distinguir una demencia de otra como reconocen los autores. OTROS ARTÍCULOS DE INTERÉS
Revisados por: S. Álvarez, J. Cortés y E. Goñi. Exactitud de la SPECT en la diferenciación de la demencia frontotemporal de la enfermedad de Alzheimer
Artículo fuente: Mc Neill R, Sare GM, Manoharan M, Testa HJ, Mann DM, Neary D, et al. Accuracy of single-photon emission computed tomography in differentiating frontotemporal dementia from Alzheimer’s disease. J Neurol Neursurgery Psychiatry. 2007; 78:350-5. Clínicamente es difícil diferenciar la demencia frontotemporal (DFT) de otras demencias corticales, por lo que comúnmente se confunde con la EA.
Rev Esp Med Nucl. 2008;27(1):63-72
Álvarez Ruiz S et al. Evidencias en Medicina Nuclear
El objetivo del estudio de McNeill et al es evaluar la eficacia diagnóstica de la SPECT de perfusión cerebral en la DFT y su diagnóstico diferencial de la EA. La muestra estudiada incluye sujetos con demencia de inicio precoz y realiza una comparación enmascarada de los estudios SPECT realizados en la evaluación inicial de pacientes con DFT (n = 25) y EA (n = 31) cuyo diagnóstico se ha confirmado en el estudio necrópsico posterior. Los resultados del trabajo de McNeill son obvios y, como era de esperar, muestran que un patrón de hipoperfusión frontal incrementa la probabilidad de que un paciente sufra una DFT (sensibilidad 80 %, especificidad 65 %), mientras que un patrón de hipoperfusión parietal es un fuerte predictor negativo de la DFT (cociente de probabilidad de un resultado negativo [CP-] 0,35 intervalo de confianza [IC] 95 %: 0,16-0,5). A pesar de los resultados, del adecuado gold standard y de la cuidada ejecución, se trata de un diseño de casos-controles retrospectivo, por lo que la evidencia es baja (de nivel IV). Los autores declaran, además, que la batería de criterios clínicos tiene mejor efectividad diagnóstica que la SPECT, por lo que ésta sólo debería ser un complemento en el diagnóstico. Infección de prótesis: diagnóstico después de artroplastia total con gammagrafía con anticuerpos monoclonales marcados con 99mTc-meta-análisis
Artículo fuente: Pakos EE, Trikalinos TA, Fotopoulos AD, Ioannidis JPA. Prótesis infection: diagnosis after total joint arthroplasty with antigranulocyte scintigraphy with 99mTc-labeled monoclonal antibodies-A meta-analysis. Radiology. 2007;242:101-8. La infección sigue siendo una complicación grave de las prótesis articulares. El diagnóstico es difícil y necesariamente multidisciplinar, por lo que es importante conocer lo que puede contribuir cada prueba al diagnóstico final. El objetivo del trabajo que comentamos es conocer la utilidad de la gammagrafía con anticuerpos monoclonales antigranulocitos-Tc99m en la identificación de infección de prótesis de cadera y rodilla. Y lo hace a partir de una revisión sistemática y metaanálisis de estudios recopilados en PubMed y EMBASE con criterios previamente establecidos. Seleccionan 13 artículos que consideran válidos y que suman 522 pa-
cientes. Los resultados suma ponderados proporcionan una sensibilidad del 90 % y una especificidad del 80 %. Estos resultados son similares y aún superiores a los de los leucocitos marcados con HMPAO-TC99m o 111In-oxina. El nivel de evidencia y fiabilidad del metaanálisis depende del rigor con que ha sido realizado y de la calidad de los estudios individuales que lo componen. Aunque los autores tienen en cuenta y recopilan todos los datos de diseño y metodología, en última instancia incluyen estudios de muy diferente calidad, por lo que los resultados finales son de nivel de evidencia intermedio (nivel III). Papel de 18F-FDG PET en el carcinoma diseminado con primario desconocido
Artículo fuente: Sève P, Billotey C, Broussolle C, Dumontet C, Mackey JR. The role of 2-deoxy-2[F-18]fluoro-D-glucose positron emisión tomography in disseminated carcinoma of unknown primary site. Cancer. 2007;109:292-9. Alrededor de un 2-5 % de todos los cánceres se manifiestan con metástasis de un tumor no identificable al inicio del diagnóstico. Este hecho constituye un problema diagnóstico, debido al largo proceso de búsqueda con diversas pruebas que lleva a un consumo de tiempo que en último término retrasa el tratamiento específico. El objetivo del trabajo de Sève et al ha sido estimar la sensibilidad y especificidad de la FDG-PET en la detección de los cánceres metastáticos con primario desconocido. Para ello han realizado una revisión sistemática de la literatura en habla inglesa desde 1998 hasta 2006. Se seleccionan 10 estudios que incluyen 221 pacientes con la característica común de que se les hubiera realizado un estudio sistemático con pruebas de imagen y de laboratorio y de que la prueba de confirmación fuera la histopatología o el seguimiento. En los resultados se comprueba que la FDG-PET detectó la lesión primaria en el 41 % de los pacientes. Hubo, además, 22 falsos positivos, 8 falsos negativos y 100 verdaderos negativos (considerando estos últimos como los pacientes en los que no se llegó a encontrar el primario ni con PET ni por otros medios). La sensibilidad fue de 91,9 % y la especificidad de 81,9 %. Los autores concluyen que la evidencia disponible confirma que la FDG-PET es útil en el diagnóstico de cánceres metastáticos con primario desconocido, cuando este conocimiento suponga
Rev Esp Med Nucl. 2008;27(1):63-72
71
Álvarez Ruiz S et al. Evidencias en Medicina Nuclear
una modificación importante de la terapéutica: pacientes con metástasis única y posibilidad de terapia con fines curativos. En efecto, esa es la evidencia disponible, pero como los estudios incluidos son de nivel de evidencia III-IV, los resultados de la revisión son también de ese nivel. Indudablemente, la PET-FDG detecta tumores primarios, pero probablemente el rendimiento puede no ser el obtenido por los autores.
Utilidad de 18F-FDG PET/TC en la valoración de recaída en cáncer de ovario: correlación con hallazgos clínicos o histológicos
Artículo fuente: Chung HH, Kang WJ, KIM JW, Park NH, Song YS, Chung JK, et al. Role of [18F]FDG PET/CT in the assessment of suspected recurrent ovarian cancer: correlation with clinical or histological findings. Eur J Nucl Med Mol Imaging. 2007;34: 480-6. La mayor parte de las mujeres con cáncer de ovario tienen enfermedad avanzada en el momento del diagnóstico. Esto condiciona un alto riesgo de recaída que es preciso monitorizar tras el tratamiento inicial.
72
En esta línea, el trabajo de Chung et al se plantea como objetivo evaluar la utilidad de la 18F-FDG PET/TC en la detección de recaída en cáncer de ovario como mínimo 21 meses después del tratamiento de primera línea. Incluyen prospectivamente 77 mujeres consecutivas con sospecha de recaída (CA-125 elevado 42, pruebas de imagen anormales 29 y otras 6), pero con pruebas diagnósticas no concluyentes. El gold standard utilizado fue la comprobación anatomopatológica tras biopsia o cirugía, o el seguimiento clínico. De las mujeres incluidas, en 45 (58,4 %) se confirmó la recaída. Los resultados de la PET/TC fueron: sensibilidad 93,3 %, especificidad 96,9 %, valor predictivo positivo 97,7 % y valor predictivo negativo 91,2 %. Es evidente la utilidad de la FDG PET/TC par el diagnóstico de recaída de cáncer de ovario en mujeres con datos de sospecha clínica, analítica o de imagen. Los autores incluso sugieren la sustitución de la segunda revisión quirúrgica tras el tratamiento inicial por la PET/TC. Los únicos argumentos que se le pueden oponer es que en el artículo la muestra de pacientes está insuficientemente descrita y, además, no se menciona el tiempo de seguimiento para la confirmación de negativos, por lo que la sensibilidad y el valor predictivo negativo podrían estar sobrestimados.
Rev Esp Med Nucl. 2008;27(1):63-72