Distribución F

Distribución de probabilidad continua
Pescador-Snedecor
Función de densidad de probabilidad
Función de distribución acumulativa
Parámetrosd 1 , d 2 > 0 grados de libertad
Apoyo incógnita ( 0 , + ) {\displaystyle x\en (0,+\infty )\;} si , de lo contrario d 1 = 1 estilo de visualización d_{1}=1 incógnita [ 0 , + ) {\displaystyle x\in[0,+\infty )\;}
PDF ( d 1 incógnita ) d 1 d 2 d 2 ( d 1 incógnita + d 2 ) d 1 + d 2 incógnita B ( d 1 2 , d 2 2 ) {\displaystyle {\frac {\sqrt {\frac {(d_{1}x)^{d_{1}}d_{2}^{d_{2}}}{(d_{1}x+d_{2})^{d_{1}+d_{2}}}}}{x\,\mathrm {B} \!\left({\frac {d_{1}}{2}},{\frac {d_{2}}{2}}\right)}}\!}
CDF I d 1 incógnita d 1 incógnita + d 2 ( d 1 2 , d 2 2 ) {\displaystyle I_{\frac {d_{1}x}{d_{1}x+d_{2}}}\left({\tfrac {d_{1}}{2}},{\tfrac {d_{2}}{2}}\right)}
Significar d 2 d 2 2 {\displaystyle {\frac {d_{2}}{d_{2}-2}}\!}
para d 2 > 2
Modo d 1 2 d 1 d 2 d 2 + 2 {\displaystyle {\frac {d_{1}-2}{d_{1}}}\;{\frac {d_{2}}{d_{2}+2}}}
para d 1 > 2
Diferencia 2 d 2 2 ( d 1 + d 2 2 ) d 1 ( d 2 2 ) 2 ( d 2 4 ) {\displaystyle {\frac {2\,d_{2}^{2}\,(d_{1}+d_{2}-2)}{d_{1}(d_{2}-2)^{2 }(d_{2}-4)}}\!}
para d 2 > 4
Oblicuidad ( 2 d 1 + d 2 2 ) 8 ( d 2 4 ) ( d 2 6 ) d 1 ( d 1 + d 2 2 ) {\displaystyle {\frac {(2d_{1}+d_{2}-2){\sqrt {8(d_{2}-4)}}}{(d_{2}-6){\sqrt {d_{1}(d_{1}+d_{2}-2)}}}}\!}
para d 2 > 6
Exceso de curtosisver texto
Entropía En Γ ( d 1 2 ) + En Γ ( d 2 2 ) En Γ ( d 1 + d 2 2 ) + {\displaystyle \ln \Gamma \left({\tfrac {d_{1}}{2}}\right)+\ln \Gamma \left({\tfrac {d_{2}}{2}}\right)-\ln \Gamma \left({\tfrac {d_{1}+d_{2}}{2}}\right)+\!}
( 1 d 1 2 ) ψ ( 1 + d 1 2 ) ( 1 + d 2 2 ) ψ ( 1 + d 2 2 ) {\displaystyle \left(1-{\tfrac {d_{1}}{2}}\right)\psi \left(1+{\tfrac {d_{1}}{2}}\right)-\left(1+{\tfrac {d_{2}}{2}}\right)\psi \left(1+{\tfrac {d_{2}}{2}}\right)\!}
+ ( d 1 + d 2 2 ) ψ ( d 1 + d 2 2 ) + En d 2 d 1 {\displaystyle +\left({\tfrac {d_{1}+d_{2}}{2}}\right)\psi \left({\tfrac {d_{1}+d_{2}}{2}}\right)+\ln {\frac {d_{2}}{d_{1}}}\!} [1]
MGFNo existe, momentos crudos definidos en el texto y en [2] [3]
CFver texto

En teoría de probabilidad y estadística , la distribución F o F -ratio , también conocida como distribución F de Snedecor o distribución Fisher-Snedecor (en honor a Ronald Fisher y George W. Snedecor ), es una distribución de probabilidad continua que surge con frecuencia como la distribución nula de una estadística de prueba , más notablemente en el análisis de varianza ( ANOVA ) y otras pruebas F. [2] [3] [4] [5]

Definición

La distribución F con d 1 y d 2 grados de libertad es la distribución de

incógnita = 1 / d 1 2 / d 2 {\displaystyle X={\frac {U_{1}/d_{1}}{U_{2}/d_{2}}}}

donde y son variables aleatorias independientes con distribuciones de chi-cuadrado con respectivos grados de libertad y . 1 {\textstyle U_{1}} 2 {\textstyle U_{2}} d 1 {\textstyle d_{1}} d 2 {\textstyle d_{2}}

Se puede demostrar que la función de densidad de probabilidad (pdf) para X está dada por

F ( incógnita ; d 1 , d 2 ) = ( d 1 incógnita ) d 1 d 2 d 2 ( d 1 incógnita + d 2 ) d 1 + d 2 incógnita B ( d 1 2 , d 2 2 ) = 1 B ( d 1 2 , d 2 2 ) ( d 1 d 2 ) d 1 2 incógnita d 1 2 1 ( 1 + d 1 d 2 incógnita ) d 1 + d 2 2 {\displaystyle {\begin{aligned}f(x;d_{1},d_{2})&={\frac {\sqrt {\frac {(d_{1}x)^{d_{1}}\,\,d_{2}^{d_{2}}}{(d_{1}x+d_{2})^{d_{1}+d_{2}}}}}{x\operatorname {B} \left({\frac {d_{1}}{2}},{\frac {d_{2}}{2}}\right)}}\\[5pt]&={\frac {1}{\operatorname {B} \left({\frac {d_{1}}{2}},{\frac {d_{2}}{2}}\right)}}\left({\frac {d_{1}}{d_{2}}}\right)^{\frac {d_{1}}{2}}x^{{\frac {d_{1}}{2}}-1}\left(1+{\frac {d_{1}}{d_{2}}}\,x\right)^{-{\frac {d_{1}+d_{2}}{2}}}\end{alineado}}}

para valores reales x > 0. Aquí está la función beta . En muchas aplicaciones, los parámetros d 1 y d 2 son números enteros positivos , pero la distribución está bien definida para valores reales positivos de estos parámetros. B {\displaystyle \mathrm {B}}

La función de distribución acumulativa es

F ( incógnita ; d 1 , d 2 ) = I d 1 incógnita / ( d 1 incógnita + d 2 ) ( d 1 2 , d 2 2 ) , {\displaystyle F(x;d_{1},d_{2})=I_{d_{1}x/(d_{1}x+d_{2})}\left({\tfrac {d_{1}}{2}},{\tfrac {d_{2}}{2}}\right),}

donde I es la función beta incompleta regularizada .

La expectativa, la varianza y otros detalles sobre F( d 1 , d 2 ) se dan en el recuadro lateral; para d 2  > 8, el exceso de curtosis es

gamma 2 = 12 d 1 ( 5 d 2 22 ) ( d 1 + d 2 2 ) + ( d 2 4 ) ( d 2 2 ) 2 d 1 ( d 2 6 ) ( d 2 8 ) ( d 1 + d 2 2 ) . {\displaystyle \gamma _{2}=12{\frac {d_{1}(5d_{2}-22)(d_{1}+d_{2}-2)+(d_{2}-4)(d_{2}-2)^{2}}{d_{1}(d_{2}-6)(d_{2}-8)(d_{1}+d_{2}-2)}}.}

El momento k -ésimo de una distribución F( d 1 , d 2 ) existe y es finito solo cuando 2 k < d 2 y es igual a

μ X ( k ) = ( d 2 d 1 ) k Γ ( d 1 2 + k ) Γ ( d 1 2 ) Γ ( d 2 2 k ) Γ ( d 2 2 ) . {\displaystyle \mu _{X}(k)=\left({\frac {d_{2}}{d_{1}}}\right)^{k}{\frac {\Gamma \left({\tfrac {d_{1}}{2}}+k\right)}{\Gamma \left({\tfrac {d_{1}}{2}}\right)}}{\frac {\Gamma \left({\tfrac {d_{2}}{2}}-k\right)}{\Gamma \left({\tfrac {d_{2}}{2}}\right)}}.} [6]

La distribución F es una parametrización particular de la distribución beta prima , también llamada distribución beta de segundo tipo.

La función característica se enumera incorrectamente en muchas referencias estándar (por ejemplo, [3] ). La expresión correcta [7] es

φ d 1 , d 2 F ( s ) = Γ ( d 1 + d 2 2 ) Γ ( d 2 2 ) U ( d 1 2 , 1 d 2 2 , d 2 d 1 ı s ) {\displaystyle \varphi _{d_{1},d_{2}}^{F}(s)={\frac {\Gamma \left({\frac {d_{1}+d_{2}}{2}}\right)}{\Gamma \left({\tfrac {d_{2}}{2}}\right)}}U\!\left({\frac {d_{1}}{2}},1-{\frac {d_{2}}{2}},-{\frac {d_{2}}{d_{1}}}\imath s\right)}

donde U ( a , b , z ) es la función hipergeométrica confluente de segundo tipo.

Caracterización

Una variable aleatoria de la distribución F con parámetros y surge como la relación de dos variables de chi-cuadrado escaladas apropiadamente : [8] d 1 {\displaystyle d_{1}} d 2 {\displaystyle d_{2}}

X = U 1 / d 1 U 2 / d 2 {\displaystyle X={\frac {U_{1}/d_{1}}{U_{2}/d_{2}}}}

dónde

En los casos en que se utiliza la distribución F , por ejemplo en el análisis de varianza , la independencia de y podría demostrarse aplicando el teorema de Cochran . U 1 {\displaystyle U_{1}} U 2 {\displaystyle U_{2}}

De manera equivalente, dado que la distribución chi-cuadrado es la suma de variables aleatorias normales estándar independientes , la variable aleatoria de la distribución F también puede escribirse

X = s 1 2 σ 1 2 ÷ s 2 2 σ 2 2 , {\displaystyle X={\frac {s_{1}^{2}}{\sigma _{1}^{2}}}\div {\frac {s_{2}^{2}}{\sigma _{2}^{2}}},}

donde y , es la suma de los cuadrados de las variables aleatorias de distribución normal y es la suma de los cuadrados de las variables aleatorias de distribución normal . s 1 2 = S 1 2 d 1 {\displaystyle s_{1}^{2}={\frac {S_{1}^{2}}{d_{1}}}} s 2 2 = S 2 2 d 2 {\displaystyle s_{2}^{2}={\frac {S_{2}^{2}}{d_{2}}}} S 1 2 {\displaystyle S_{1}^{2}} d 1 {\displaystyle d_{1}} N ( 0 , σ 1 2 ) {\displaystyle N(0,\sigma _{1}^{2})} S 2 2 {\displaystyle S_{2}^{2}} d 2 {\displaystyle d_{2}} N ( 0 , σ 2 2 ) {\displaystyle N(0,\sigma _{2}^{2})}

En un contexto frecuentista , una distribución F escalada da por lo tanto la probabilidad , con la distribución F en sí, sin ninguna escala, aplicándose donde se toma igual a . Este es el contexto en el que la distribución F aparece más generalmente en las pruebas F : donde la hipótesis nula es que dos varianzas normales independientes son iguales, y las sumas observadas de algunos cuadrados seleccionados apropiadamente se examinan luego para ver si su razón es significativamente incompatible con esta hipótesis nula. p ( s 1 2 / s 2 2 σ 1 2 , σ 2 2 ) {\displaystyle p(s_{1}^{2}/s_{2}^{2}\mid \sigma _{1}^{2},\sigma _{2}^{2})} σ 1 2 {\displaystyle \sigma _{1}^{2}} σ 2 2 {\displaystyle \sigma _{2}^{2}}

La cantidad tiene la misma distribución en las estadísticas bayesianas, si se toma una distribución previa de Jeffreys invariante al reescalamiento no informativa para las probabilidades previas de y . [9] En este contexto, una distribución F escalada da la probabilidad posterior , donde las sumas observadas y ahora se toman como conocidas. X {\displaystyle X} σ 1 2 {\displaystyle \sigma _{1}^{2}} σ 2 2 {\displaystyle \sigma _{2}^{2}} p ( σ 2 2 / σ 1 2 s 1 2 , s 2 2 ) {\displaystyle p(\sigma _{2}^{2}/\sigma _{1}^{2}\mid s_{1}^{2},s_{2}^{2})} s 1 2 {\displaystyle s_{1}^{2}} s 2 2 {\displaystyle s_{2}^{2}}

  • Si y ( distribución Chi cuadrado ) son independientes , entonces X χ d 1 2 {\displaystyle X\sim \chi _{d_{1}}^{2}} Y χ d 2 2 {\displaystyle Y\sim \chi _{d_{2}}^{2}} X / d 1 Y / d 2 F ( d 1 , d 2 ) {\displaystyle {\frac {X/d_{1}}{Y/d_{2}}}\sim \mathrm {F} (d_{1},d_{2})}
  • Si ( distribución gamma ) son independientes, entonces X k Γ ( α k , β k ) {\displaystyle X_{k}\sim \Gamma (\alpha _{k},\beta _{k})\,} α 2 β 1 X 1 α 1 β 2 X 2 F ( 2 α 1 , 2 α 2 ) {\displaystyle {\frac {\alpha _{2}\beta _{1}X_{1}}{\alpha _{1}\beta _{2}X_{2}}}\sim \mathrm {F} (2\alpha _{1},2\alpha _{2})}
  • Si ( distribución beta ) entonces X Beta ( d 1 / 2 , d 2 / 2 ) {\displaystyle X\sim \operatorname {Beta} (d_{1}/2,d_{2}/2)} d 2 X d 1 ( 1 X ) F ( d 1 , d 2 ) {\displaystyle {\frac {d_{2}X}{d_{1}(1-X)}}\sim \operatorname {F} (d_{1},d_{2})}
  • Equivalentemente, si , entonces . X F ( d 1 , d 2 ) {\displaystyle X\sim F(d_{1},d_{2})} d 1 X / d 2 1 + d 1 X / d 2 Beta ( d 1 / 2 , d 2 / 2 ) {\displaystyle {\frac {d_{1}X/d_{2}}{1+d_{1}X/d_{2}}}\sim \operatorname {Beta} (d_{1}/2,d_{2}/2)}
  • Si , entonces tiene una distribución beta prima : . X F ( d 1 , d 2 ) {\displaystyle X\sim F(d_{1},d_{2})} d 1 d 2 X {\displaystyle {\frac {d_{1}}{d_{2}}}X} d 1 d 2 X β ( d 1 2 , d 2 2 ) {\displaystyle {\frac {d_{1}}{d_{2}}}X\sim \operatorname {\beta ^{\prime }} \left({\tfrac {d_{1}}{2}},{\tfrac {d_{2}}{2}}\right)}
  • Si entonces tiene la distribución chi-cuadrado X F ( d 1 , d 2 ) {\displaystyle X\sim F(d_{1},d_{2})} Y = lim d 2 d 1 X {\displaystyle Y=\lim _{d_{2}\to \infty }d_{1}X} χ d 1 2 {\displaystyle \chi _{d_{1}}^{2}}
  • F ( d 1 , d 2 ) {\displaystyle F(d_{1},d_{2})} es equivalente a la distribución T-cuadrada de Hotelling escalada . d 2 d 1 ( d 1 + d 2 1 ) T 2 ( d 1 , d 1 + d 2 1 ) {\displaystyle {\frac {d_{2}}{d_{1}(d_{1}+d_{2}-1)}}\operatorname {T} ^{2}(d_{1},d_{1}+d_{2}-1)}
  • Si entonces . X F ( d 1 , d 2 ) {\displaystyle X\sim F(d_{1},d_{2})} X 1 F ( d 2 , d 1 ) {\displaystyle X^{-1}\sim F(d_{2},d_{1})}
  • Si es la distribución t de Student , entonces: X t ( n ) {\displaystyle X\sim t_{(n)}} X 2 F ( 1 , n ) X 2 F ( n , 1 ) {\displaystyle {\begin{aligned}X^{2}&\sim \operatorname {F} (1,n)\\X^{-2}&\sim \operatorname {F} (n,1)\end{aligned}}}
  • La distribución F es un caso especial de la distribución de Pearson tipo 6
  • Si y son independientes, con Laplace( μ , b ) entonces X {\displaystyle X} Y {\displaystyle Y} X , Y {\displaystyle X,Y\sim } | X μ | | Y μ | F ( 2 , 2 ) {\displaystyle {\frac {|X-\mu |}{|Y-\mu |}}\sim \operatorname {F} (2,2)}
  • Si entonces ( distribución z de Fisher ) X F ( n , m ) {\displaystyle X\sim F(n,m)} log X 2 FisherZ ( n , m ) {\displaystyle {\tfrac {\log {X}}{2}}\sim \operatorname {FisherZ} (n,m)}
  • La distribución F no central se simplifica a la distribución F si . λ = 0 {\displaystyle \lambda =0}
  • La distribución F doblemente no central se simplifica a la distribución F si λ 1 = λ 2 = 0 {\displaystyle \lambda _{1}=\lambda _{2}=0}
  • Si es el cuantil p para y es el cuantil para , entonces Q X ( p ) {\displaystyle \operatorname {Q} _{X}(p)} X F ( d 1 , d 2 ) {\displaystyle X\sim F(d_{1},d_{2})} Q Y ( 1 p ) {\displaystyle \operatorname {Q} _{Y}(1-p)} 1 p {\displaystyle 1-p} Y F ( d 2 , d 1 ) {\displaystyle Y\sim F(d_{2},d_{1})} Q X ( p ) = 1 Q Y ( 1 p ) . {\displaystyle \operatorname {Q} _{X}(p)={\frac {1}{\operatorname {Q} _{Y}(1-p)}}.}
  • La distribución F es un ejemplo de distribuciones de razón.
  • La distribución W [10] es una parametrización única de la distribución F.

Véase también

Referencias

  1. ^ Lazo, AV; Rathie, P. (1978). "Sobre la entropía de distribuciones de probabilidad continuas". IEEE Transactions on Information Theory . 24 (1). IEEE: 120–122. doi :10.1109/tit.1978.1055832.
  2. ^ ab Johnson, Norman Lloyd; Samuel Kotz; N. Balakrishnan (1995). Distribuciones univariadas continuas, volumen 2 (segunda edición, sección 27) . Wiley. ISBN 0-471-58494-0.
  3. ^ abc Abramowitz, Milton ; Stegun, Irene Ann , eds. (1983) [junio de 1964]. "Capítulo 26". Manual de funciones matemáticas con fórmulas, gráficos y tablas matemáticas . Serie de Matemáticas Aplicadas. Vol. 55 (Novena reimpresión con correcciones adicionales de la décima impresión original con correcciones (diciembre de 1972); primera ed.). Washington DC; Nueva York: Departamento de Comercio de los Estados Unidos, Oficina Nacional de Normas; Dover Publications. pág. 946. ISBN 978-0-486-61272-0. LCCN  64-60036. MR  0167642. LCCN  65-12253.
  4. ^ NIST (2006). Manual de estadística de ingeniería: distribución F
  5. ^ Mood, Alexander; Franklin A. Graybill; Duane C. Boes (1974). Introducción a la teoría de la estadística (tercera edición). McGraw-Hill. págs. 246-249. ISBN 0-07-042864-6.
  6. ^ Taboga, Marco. "La distribución F".
  7. ^ Phillips, PCB (1982) "La verdadera función característica de la distribución F", Biometrika , 69: 261–264 JSTOR  2335882
  8. ^ DeGroot, MH (1986). Probabilidad y estadística (2.ª ed.). Addison-Wesley. pág. 500. ISBN 0-201-11366-X.
  9. ^ Box, GEP; Tiao, GC (1973). Inferencia bayesiana en análisis estadístico . Addison-Wesley. pág. 110. ISBN. 0-201-00622-7.
  10. ^ Mahmoudi, Amin; Javed, Saad Ahmed (octubre de 2022). "Enfoque probabilístico para la evaluación de proveedores en múltiples etapas: medición del nivel de confianza en el enfoque de prioridad ordinal". Decisión y negociación grupal . 31 (5): 1051–1096. doi :10.1007/s10726-022-09790-1. ISSN  0926-2644. PMC 9409630 . PMID  36042813. 
  11. ^ Sun, Jingchao; Kong, Maiying; Pal, Subhadip (22 de junio de 2021). "La distribución seminormal modificada: propiedades y un esquema de muestreo eficiente" (PDF) . Comunicaciones en estadística: teoría y métodos . 52 (5): 1591–1613. doi :10.1080/03610926.2021.1934700. ISSN  0361-0926. S2CID  237919587.
  • Tabla de valores críticos de la distribución F
  • Los primeros usos de algunas palabras de las matemáticas: la entrada sobre la distribución F contiene una breve historia
  • Calculadora gratuita para pruebas F
Retrieved from "https://en.wikipedia.org/w/index.php?title=F-distribution&oldid=1247905502"