En probabilidad y estadística , el percentil 97,5 de la distribución normal estándar es un número que se utiliza habitualmente para los cálculos estadísticos. El valor aproximado de este número es 1,96 , lo que significa que el 95% del área bajo una curva normal se encuentra dentro de aproximadamente 1,96 desviaciones estándar de la media . Debido al teorema del límite central , este número se utiliza en la construcción de intervalos de confianza aproximados del 95% . Su ubicuidad se debe a la convención arbitraria pero común de utilizar intervalos de confianza con una probabilidad del 95% en la ciencia y las estadísticas frecuentistas, aunque a veces se utilizan otras probabilidades (90%, 99%, etc.). [1] [2] [3] [4] Esta convención parece ser particularmente común en las estadísticas médicas, [5] [6] [7] pero también es común en otras áreas de aplicación, como las ciencias de la tierra, [8] las ciencias sociales y la investigación empresarial. [9]
No existe un nombre único aceptado para este número; también se lo conoce comúnmente como " desviación normal estándar ", " puntaje normal " o " puntaje Z " para el punto de percentil 97,5, el punto 0,975 o simplemente su valor aproximado, 1,96.
Si X tiene una distribución normal estándar, es decir, X ~ N(0,1),
y como la distribución normal es simétrica,
Una notación para este número es z .975 . [10] A partir de la función de densidad de probabilidad de la distribución normal estándar, el valor exacto de z .975 se determina mediante
El uso de este número en estadística aplicada se remonta a la influencia del clásico libro de texto de Ronald Fisher , Métodos estadísticos para investigadores , publicado por primera vez en 1925:
"El valor para el cual P = .05, o 1 en 20, es 1.96 o casi 2; es conveniente tomar este punto como un límite para juzgar si una desviación debe considerarse significativa o no". [11]
En la Tabla 1 del mismo trabajo, dio el valor más preciso 1,959964. [12] En 1970, el valor truncado a 20 decimales se calculó como
Por lo tanto, el valor aproximado comúnmente utilizado de 1,96 es preciso en más de una parte en 50 000, lo que es más que adecuado para el trabajo aplicado.
Algunas personas incluso utilizan el valor 2 en lugar de 1,96, informando un intervalo de confianza del 95,4 % como intervalo de confianza del 95 %. Esto no se recomienda, pero se observa ocasionalmente. [15]
Solicitud | Llamada de función |
---|---|
Sobresalir | INV.NORM.S.(0,975) |
MATLAB | normaminv(0,975) |
R | norma q(0,975) |
Python ( SciPy ) | scipy.stats.norm.ppf(0,975) |
SAS | probit(0,025); |
Programa estadístico SPSS | x = CALCULAR IDF.NORMAL(0.975,0,1). |
Estado | anormal(0,975) |
Lenguaje Wolfram ( Mathematica ) | InverseCDF[Distribución normal[0, 1], 0,975] [16] [17] |
Por qué 95% de confianza? ¿Por qué no otro nivel de confianza ? El uso del 95% es en parte una convención, pero también se utilizan niveles como 90%, 98% y, a veces, 99,9%.
Aunque la elección del coeficiente de confianza es algo arbitraria, en la práctica se suelen utilizar intervalos del 90%, 95% y 99%, siendo el 95% el más utilizado.
se pueden elegir otros límites más estrictos o más flexibles, los estadísticos suelen preferir el intervalo del 95 por ciento.
En la práctica aplicada moderna, casi todos los intervalos de confianza se expresan en el nivel del 95%.
proporcione los siguientes encabezados e información: [...] resultados: resultados principales con intervalos de confianza del 95 % (para estudios cuantitativos) y, cuando corresponda, el nivel exacto de significación estadística y el número necesario para tratar o dañar
simplificar, adoptamos la convención común de las ciencias de la tierra de un intervalo de confianza del 95%.
La mayoría de los investigadores utilizan un intervalo de confianza del 95 por ciento.