Este artículo necesita citas adicionales para su verificación . ( marzo de 2012 ) |
Los valores predictivos positivos y negativos ( VPP y VPN respectivamente) son las proporciones de resultados positivos y negativos en estadísticas y pruebas diagnósticas que son resultados positivos verdaderos y negativos verdaderos , respectivamente. [1] El VPP y el VPN describen el rendimiento de una prueba diagnóstica u otra medida estadística. Un resultado alto puede interpretarse como un indicador de la precisión de dicha estadística. El VPP y el VPN no son intrínsecos a la prueba (como lo son la tasa de positivos verdaderos y la tasa de negativos verdaderos ); también dependen de la prevalencia . [2] Tanto el VPP como el VPN se pueden derivar utilizando el teorema de Bayes .
Aunque a veces se utilizan como sinónimos, un valor predictivo positivo generalmente se refiere a lo que establecen los grupos de control, mientras que una probabilidad posterior a la prueba se refiere a una probabilidad para un individuo. Aun así, si la probabilidad previa a la prueba del individuo de la condición objetivo es la misma que la prevalencia en el grupo de control utilizado para establecer el valor predictivo positivo, los dos son numéricamente iguales.
En la recuperación de información , la estadística PPV a menudo se denomina precisión .
El valor predictivo positivo (VPP), o precisión , se define como
donde un " verdadero positivo " es el evento en el que la prueba hace una predicción positiva y el sujeto tiene un resultado positivo bajo el patrón oro , y un " falso positivo " es el evento en el que la prueba hace una predicción positiva y el sujeto tiene un resultado negativo bajo el patrón oro. El valor ideal del VPP, con una prueba perfecta, es 1 (100%), y el peor valor posible sería cero.
El VPP también se puede calcular a partir de la sensibilidad , la especificidad y la prevalencia de la afección:
Véase el teorema de Bayes.
El complemento del PPV es la tasa de falsos descubrimientos (FDR):
El valor predictivo negativo se define como:
donde un " negativo verdadero " es el evento en el que la prueba arroja una predicción negativa y el sujeto tiene un resultado negativo según el patrón oro, y un " negativo falso " es el evento en el que la prueba arroja una predicción negativa y el sujeto tiene un resultado positivo según el patrón oro. Con una prueba perfecta, es decir, que no arroja falsos negativos, el valor del VPN es 1 (100%), y con una prueba que no arroja verdaderos negativos, el valor del VPN es cero.
El VPN también se puede calcular a partir de la sensibilidad , la especificidad y la prevalencia :
El complemento del VPN es eltasa de falsas omisiones (FOR):
Aunque a veces se utilizan como sinónimos, un valor predictivo negativo generalmente se refiere a lo que establecen los grupos de control, mientras que una probabilidad negativa posterior a la prueba se refiere más bien a una probabilidad para un individuo. Aun así, si la probabilidad previa a la prueba del individuo de la condición objetivo es la misma que la prevalencia en el grupo de control utilizado para establecer el valor predictivo negativo, entonces los dos son numéricamente iguales.
El siguiente diagrama ilustra cómo se relacionan el valor predictivo positivo , el valor predictivo negativo , la sensibilidad y la especificidad .
Condición prevista | Fuentes: [3] [4] [5] [6] [7] [8] [9] [10] | ||||
Población total = P + N | Positivo previsto (PP) | Predicción negativa (PN) | Información , información de la casa de apuestas (BM) = TPR + TNR − 1 | Umbral de prevalencia (PT) = √ TPR × FPR - FPR/TPR-FPR | |
Estado actual | Positivo (P) [a] | Verdadero positivo (VP), acierto [b] | Falso negativo (FN), error, subestimación | Tasa de verdaderos positivos (TPR), recuperación , sensibilidad (SEN), probabilidad de detección, tasa de aciertos, potencia =TP/PAG = 1 − FNR | Tasa de falsos negativos (FNR), tasa de error tipo II [c] = Enero 2016/PAG = 1 − TPR |
Negativo (N) [d] | Falso positivo (FP), falsa alarma, sobreestimación | Verdadero negativo (VN), rechazo correcto [e] | Tasa de falsos positivos (FPR), probabilidad de falsa alarma, error tipo I de repercusión [f] = FP/norte = 1 − TNR | Tasa de verdaderos negativos (TNR), especificidad (SPC), selectividad =Tennesse/norte = 1 − FPR | |
Prevalencia = PAG/P + N | Valor predictivo positivo (VPP), precisión = TP/PÁGINAS = 1 − FDR | Tasa de falsas omisiones (FOR) = Enero 2016/PN = 1 − VPN | Razón de verosimilitud positiva (LR+) = Reanimación térmica/FPR | Razón de verosimilitud negativa (LR−) = FNR/TNR | |
Precisión (ACC) = TP + TN/P + N | Tasa de falsos descubrimientos (FDR) = FP/PÁGINAS = 1 − VPP | Valor predictivo negativo (VPN) = Tennesse/PN = 1 − PARA | Marcación (MK), deltaP (Δp) = PPV + VAN − 1 | Razón de posibilidades diagnóstica (DOR) = LR+/LR− | |
Precisión equilibrada (BA) = TPR + TNR/2 | Puntuación F 1 = 2 PPV × TPR/PPV + TPR = 2 TP/2 TP + FP + FN | Índice de Fowlkes-Mallows (FM) = √ PPV × TPR | Coeficiente de correlación de Matthews (MCC) = √ TPR × TNR × PPV × NPV - √ FNR × FPR × FOR × FDR | Puntuación de amenaza (TS), índice de éxito crítico (CSI), índice de Jaccard = TP/TP + FN + FP |
Cabe señalar que los valores predictivos positivos y negativos solo se pueden estimar utilizando datos de un estudio transversal u otro estudio poblacional en el que se puedan obtener estimaciones de prevalencia válidas . Por el contrario, la sensibilidad y la especificidad se pueden estimar a partir de estudios de casos y controles .
Supongamos que la prueba de detección de sangre oculta en heces (FOB) se utiliza en 2030 personas para detectar cáncer de intestino:
Resultado de la prueba de detección de sangre oculta en heces | |||||
Población total (población) = 2030 | Resultado de la prueba positivo | Resultado de la prueba negativo | Precisión (ACC) = (TP + TN) / población = (20 + 1820) / 2030 ≈ 90,64% | Puntuación F 1 = 2 × precisión × recuperación/precisión + recuperación ≈ 0,174 | |
Pacientes con cáncer de intestino (confirmado mediante endoscopia ) | Estado actual positivo (PA) = 30 (2030 × 1,48%) | Verdadero positivo (VP) = 20 (2030 × 1,48 % × 67 %) | Falso negativo (FN) = 10 (2030 × 1,48% × (100% − 67%) ) | Tasa de verdaderos positivos (TPR), recuperación , sensibilidad = TP / PA = 20 / 30 ≈ 66,7% | Tasa de falsos negativos (FNR), tasa de errores = FN / PA = 10 / 30 ≈ 33,3% |
Condición actual negativa (AN) = 2000 (2030 × (100% − 1,48%) ) | Falso positivo (FP) = 180 (2030 × (100% − 1,48%) × (100% − 91%) ) | Verdadero negativo (VN) = 1820 (2030 × (100% − 1,48%) × 91%) | Tasa de falsos positivos (FPR), repercusión , probabilidad de falsa alarma = FP / AN = 180 / 2000 = 9,0% | Especificidad , selectividad, tasa de verdaderos negativos (TNR) = TN / AN = 1820 / 2000 = 91% | |
Predominio = AP / poblacion = 30 / 2030 ≈ 1,48% | Valor predictivo positivo (VPP), precisión = VP / (VP + FP) = 20 / (20 + 180) = 10% | Tasa de falsas omisiones (FOR) = FN / (FN + TN) = 10 / (10 + 1820) ≈ 0,55% | Razón de verosimilitud positiva (LR+) = Reanimación térmica/FPR = (20/30) / (180/2000) ≈ 7,41 | Razón de verosimilitud negativa (LR−) = FNR/TNR = (10/30) / (1820/2000) ≈ 0,366 | |
Tasa de falsos descubrimientos (FDR) = FP / (TP + FP) = 180 / (20 + 180) = 90,0% | Valor predictivo negativo (VPN) = TN / (FN + TN) = 1820 / (10 + 1820) ≈ 99,45% | Razón de posibilidades diagnósticas (DOR) = LR+/LR− ≈ 20,2 |
El pequeño valor predictivo positivo (VPP = 10%) indica que muchos de los resultados positivos de este procedimiento de prueba son falsos positivos. Por lo tanto, será necesario hacer un seguimiento de cualquier resultado positivo con una prueba más confiable para obtener una evaluación más precisa de la presencia de cáncer. No obstante, una prueba de este tipo puede ser útil si es económica y conveniente. La fortaleza de la prueba de detección FOB reside en su valor predictivo negativo, que, si es negativo para un individuo, nos da una alta confianza en que su resultado negativo es verdadero.
Cabe señalar que el VPP no es intrínseco a la prueba, sino que también depende de la prevalencia. [2] Debido al gran efecto de la prevalencia sobre los valores predictivos, se ha propuesto un enfoque estandarizado, en el que el VPP se normaliza a una prevalencia del 50%. [11] El VPP es directamente proporcional [ dudoso – discutir ] a la prevalencia de la enfermedad o afección. En el ejemplo anterior, si el grupo de personas examinadas hubiera incluido una mayor proporción de personas con cáncer de intestino, entonces el VPP probablemente sería más alto y el VPN más bajo. Si todos en el grupo tuvieran cáncer de intestino, el VPP sería del 100% y el VPN del 0%. [ cita requerida ]
Para superar este problema, el VPN y el VPP sólo se deben utilizar si la razón entre el número de pacientes en el grupo de la enfermedad y el número de pacientes en el grupo de control sano utilizado para establecer el VPN y el VPP es equivalente a la prevalencia de las enfermedades en la población estudiada o, en caso de que se comparen dos grupos de enfermedades, si la razón entre el número de pacientes en el grupo de la enfermedad 1 y el número de pacientes en el grupo de la enfermedad 2 es equivalente a la razón de las prevalencias de las dos enfermedades estudiadas. De lo contrario, las razones de verosimilitud positivas y negativas son más precisas que el VPN y el VPP, porque las razones de verosimilitud no dependen de la prevalencia. [ cita requerida ]
Cuando un individuo que se somete a la prueba tiene una probabilidad previa a la prueba de tener una afección diferente a la de los grupos de control utilizados para establecer el VPP y el VPN, el VPP y el VPN se distinguen generalmente de las probabilidades positivas y negativas posteriores a la prueba , y el VPP y el VPN se refieren a las establecidas por los grupos de control, y las probabilidades posteriores a la prueba se refieren a las del individuo examinado (según se estima, por ejemplo, mediante razones de verosimilitud ). Preferiblemente, en tales casos, se debe estudiar un grupo grande de individuos equivalentes, a fin de establecer valores predictivos positivos y negativos separados para el uso de la prueba en tales individuos. [ cita requerida ]
El teorema de Bayes confiere limitaciones inherentes a la precisión de las pruebas de detección en función de la prevalencia de la enfermedad o la probabilidad previa a la prueba. Se ha demostrado que un sistema de prueba puede tolerar caídas significativas en la prevalencia, hasta un cierto punto bien definido conocido como el umbral de prevalencia , por debajo del cual la confiabilidad de una prueba de detección positiva cae precipitadamente. Dicho esto, Balayla et al. [12] demostraron que las pruebas secuenciales superan las limitaciones bayesianas mencionadas anteriormente y, por lo tanto, mejoran la confiabilidad de las pruebas de detección. Para un valor predictivo positivo deseado , donde , que se acerca a una constante , el número de iteraciones de prueba positivas necesarias es:
dónde
Cabe destacar que el denominador de la ecuación anterior es el logaritmo natural de la razón de verosimilitud positiva (LR+). Además, tenga en cuenta que un supuesto crítico es que las pruebas deben ser independientes. Como describen Balayla et al. [12] , repetir la misma prueba puede violar este supuesto de independencia y, de hecho, "Un método más natural y confiable para mejorar el valor predictivo positivo sería, cuando esté disponible, utilizar una prueba diferente con parámetros completamente diferentes después de obtener un resultado positivo inicial". [12 ]
El VPP se utiliza para indicar la probabilidad de que, en caso de que el resultado de una prueba sea positivo, el paciente realmente tenga la enfermedad especificada. Sin embargo, puede haber más de una causa de una enfermedad y una única causa potencial puede no siempre dar lugar a la enfermedad manifiesta que se observa en un paciente. Existe la posibilidad de mezclar las condiciones objetivo relacionadas del VPP y el VPN, como interpretar el VPP o el VPN de una prueba como si tuviera una enfermedad, cuando ese valor de VPP o VPN en realidad se refiere solo a una predisposición a tener esa enfermedad. [13]
Un ejemplo es el hisopado faríngeo microbiológico utilizado en pacientes con dolor de garganta . Por lo general, las publicaciones que indican el VPP de un hisopado faríngeo informan sobre la probabilidad de que esta bacteria esté presente en la garganta, en lugar de que el paciente esté enfermo a causa de la bacteria encontrada. Si la presencia de esta bacteria siempre resultara en dolor de garganta, entonces el VPP sería muy útil. Sin embargo, las bacterias pueden colonizar a los individuos de una manera inofensiva y nunca provocar una infección o enfermedad. Los dolores de garganta que se producen en estos individuos son causados por otros agentes, como un virus. En esta situación, el estándar de oro utilizado en el estudio de evaluación representa solo la presencia de bacterias (que podrían ser inofensivas) pero no una enfermedad bacteriana causal de dolor de garganta. Se puede demostrar que este problema afectará al valor predictivo positivo mucho más que al valor predictivo negativo. [14] Para evaluar las pruebas diagnósticas en las que el estándar de oro solo analiza las causas potenciales de la enfermedad, se puede utilizar una extensión del valor predictivo denominada valor predictivo etiológico. [13] [15]
{{cite book}}
: CS1 maint: multiple names: authors list (link)