En estadística , la heterogeneidad (entre) estudios es un fenómeno que ocurre comúnmente cuando se intenta realizar un metanálisis . En un escenario simplista, los estudios cuyos resultados se van a combinar en el metanálisis se realizarían todos de la misma manera y con los mismos protocolos experimentales. Las diferencias entre los resultados solo se deberían a un error de medición (y, por lo tanto, los estudios serían homogéneos ). La heterogeneidad de los estudios denota la variabilidad en los resultados que va más allá de lo que se esperaría (o podría explicarse) debido solo al error de medición. [1]
El metanálisis es un método que se utiliza para combinar los resultados de diferentes ensayos con el fin de obtener una síntesis cuantitativa. El tamaño de los ensayos clínicos individuales suele ser demasiado pequeño para detectar los efectos del tratamiento de forma fiable. El metanálisis aumenta la potencia de los análisis estadísticos al agrupar los resultados de todos los ensayos disponibles.
Cuando se intenta utilizar un metanálisis para estimar un efecto combinado de un grupo de estudios similares, los efectos encontrados en los estudios individuales deben ser lo suficientemente similares como para que uno pueda estar seguro de que una estimación combinada será una descripción significativa del conjunto de estudios. Sin embargo, las estimaciones individuales del efecto del tratamiento variarán por casualidad; se espera cierta variación debido al error de observación . Cualquier variación excesiva (ya sea aparente o detectable o no) se denomina heterogeneidad (estadística) . [2] La presencia de cierta heterogeneidad no es inusual, por ejemplo, también se encuentran comúnmente efectos análogos incluso dentro de los estudios, en ensayos multicéntricos (heterogeneidad entre centros ).
Las razones de la variabilidad adicional suelen ser diferencias en los estudios mismos, las poblaciones investigadas, los esquemas de tratamiento, las definiciones de los puntos finales u otras circunstancias ("diversidad clínica"), o la forma en que se analizaron los datos, qué modelos se emplearon o si las estimaciones se han ajustado de alguna manera ("diversidad metodológica"). [1] Diferentes tipos de medidas de efectos (por ejemplo, odds ratio vs. riesgo relativo ) también pueden ser más o menos susceptibles a la heterogeneidad. [3]
En caso de que se pueda identificar el origen de la heterogeneidad y se pueda atribuir a ciertas características del estudio, el análisis puede estratificarse (considerando subgrupos de estudios, que entonces serían, con suerte, más homogéneos) o extendiendo el análisis a una metarregresión , teniendo en cuenta las variables moderadoras (continuas o categóricas ) . Desafortunadamente, el metanálisis basado en la literatura a menudo no permite recopilar datos sobre todos los moderadores (potencialmente) relevantes. [4]
Además, la heterogeneidad suele tenerse en cuenta mediante el uso de un modelo de efectos aleatorios , en el que la heterogeneidad constituye entonces un componente de varianza . [5] El modelo representa la falta de conocimiento sobre por qué los efectos del tratamiento pueden diferir al tratar las diferencias (potenciales) como incógnitas. El centro de esta distribución simétrica describe el promedio de los efectos, mientras que su ancho describe el grado de heterogeneidad. La opción obvia y convencional de distribución es una distribución normal . Es difícil establecer la validez de cualquier supuesto distribucional, y esta es una crítica común a los metanálisis de efectos aleatorios. Sin embargo, las variaciones de la forma distribucional exacta pueden no hacer mucha diferencia, [6] y las simulaciones han demostrado que los métodos son relativamente robustos incluso bajo supuestos distribucionales extremos, tanto en la estimación de la heterogeneidad, [7] como en el cálculo de un tamaño de efecto general. [8]
La inclusión de un efecto aleatorio en el modelo tiene el efecto de hacer que las inferencias sean (en cierto sentido) más conservadoras o cautelosas, ya que una heterogeneidad (no nula) generará mayor incertidumbre (y evitará el exceso de confianza) en la estimación de los efectos generales. En el caso especial de una varianza de heterogeneidad cero, el modelo de efectos aleatorios se reduce nuevamente al caso especial del modelo de efectos comunes . [9]
Sin embargo, los modelos de metaanálisis comunes no deberían aplicarse ciegamente o ingenuamente a conjuntos de estimaciones recopiladas. En caso de que los resultados que se fusionarán difieran sustancialmente (en sus contextos o en sus efectos estimados), un promedio metaanalítico derivado puede eventualmente no corresponder a un estimador razonable . [10] [11] Cuando los estudios individuales muestran resultados contradictorios, es probable que haya algunas razones por las cuales los resultados difieren; por ejemplo, dos subpoblaciones pueden experimentar diferentes vías farmacocinéticas . [12] En tal escenario, sería importante conocer y considerar las covariables relevantes en un análisis.
Las pruebas estadísticas para detectar una varianza de heterogeneidad distinta de cero se realizan a menudo con base en la prueba Q de Cochran [13] o procedimientos de prueba relacionados. Sin embargo, este procedimiento común es cuestionable por varias razones, a saber, la baja potencia de dichas pruebas [14], especialmente en el caso muy común de que solo se combinen unas pocas estimaciones en el análisis, [15] [7], así como la especificación de la homogeneidad como la hipótesis nula que luego solo se rechaza en presencia de evidencia suficiente en su contra. [16]
Si bien el objetivo principal de un metanálisis suele ser la estimación del efecto principal , la investigación de la heterogeneidad también es crucial para su interpretación. Existe una gran cantidad de estimadores ( frecuentistas y bayesianos ) . [17] La estimación bayesiana de la heterogeneidad generalmente requiere la especificación de una distribución previa apropiada . [9] [18]
Si bien muchos de estos estimadores se comportan de manera similar en el caso de una gran cantidad de estudios, surgen diferencias en particular en su comportamiento en el caso común de solo unas pocas estimaciones. [19] Con frecuencia se obtiene una estimación incorrecta de varianza entre estudios de cero, lo que conduce a una suposición falsa de homogeneidad. En general, parece que la heterogeneidad se subestima sistemáticamente en los metanálisis. [7]
La varianza de la heterogeneidad se denota comúnmente por τ², o la desviación estándar (su raíz cuadrada) por τ. La heterogeneidad probablemente se interprete más fácilmente en términos de τ, ya que este es el parámetro de escala de la distribución de heterogeneidad , que se mide en las mismas unidades que el efecto general en sí. [18]
Otra medida común de heterogeneidad es I², una estadística que indica el porcentaje de varianza en un metanálisis que es atribuible a la heterogeneidad del estudio (de manera similar a un coeficiente de determinación ). [20] I² relaciona la magnitud de la varianza de la heterogeneidad con el tamaño de las varianzas de las estimaciones individuales ( errores estándar al cuadrado ); sin embargo, con esta normalización, no es del todo obvio qué constituiría exactamente cantidades "pequeñas" o "grandes" de heterogeneidad. Para una heterogeneidad constante (τ), la disponibilidad de estudios más pequeños o más grandes (con errores estándar correspondientemente diferentes asociados) afectaría la medida I²; por lo tanto, la interpretación real de un valor I² no es sencilla. [21] [22]
La consideración conjunta de un intervalo de predicción junto con un intervalo de confianza para el efecto principal puede ayudar a obtener una mejor idea de la contribución de la heterogeneidad a la incertidumbre en torno a la estimación del efecto. [5] [23] [24] [25]