Problema de Behrens-Fisher

Problema matemático

Problema sin resolver en estadística :

¿Es necesaria una aproximación análoga al argumento de Fisher para resolver el problema de Behrens-Fisher?

(más problemas sin resolver en estadística)

En estadística , el problema de Behrens-Fisher , llamado así en honor a Walter-Ulrich Behrens y Ronald Fisher , es el problema de estimación de intervalos y prueba de hipótesis relativo a la diferencia entre las medias de dos poblaciones distribuidas normalmente cuando no se supone que las varianzas de las dos poblaciones sean iguales, basándose en dos muestras independientes .

Especificación

Una de las dificultades que presenta el análisis del problema de Behrens-Fisher y las soluciones propuestas es que existen muchas interpretaciones diferentes de lo que se entiende por "problema de Behrens-Fisher". Estas diferencias no sólo afectan a lo que se considera una solución pertinente, sino incluso al enunciado básico del contexto que se está considerando.

Contexto

Sean X ₁ , ..., X _n e Y ₁ , ..., Y _m muestras iid de dos poblaciones que provienen de la misma familia de distribuciones de ubicación-escala. Se supone que los parámetros de escala son desconocidos y no necesariamente iguales, y el problema es evaluar si los parámetros de ubicación pueden tratarse razonablemente como iguales. Lehmann ^[1] afirma que "el problema de Behrens-Fisher" se utiliza tanto para esta forma general de modelo cuando la familia de distribuciones es arbitraria, como para cuando se hace la restricción a una distribución normal . Si bien Lehmann analiza una serie de enfoques para el problema más general, principalmente basados en no paramétricos, ^[2] la mayoría de las otras fuentes parecen utilizar "el problema de Behrens-Fisher" para referirse solo al caso en el que se supone que la distribución es normal: la mayor parte de este artículo hace esta suposición.

Requisitos de las soluciones

Se han presentado soluciones al problema de Behrens-Fisher que utilizan un punto de vista de inferencia clásico o bayesiano y cualquiera de las dos soluciones sería teóricamente inválida juzgada desde el otro punto de vista. Si la consideración se limita únicamente a la inferencia estadística clásica, es posible buscar soluciones al problema de inferencia que sean fáciles de aplicar en un sentido práctico, dando preferencia a esta simplicidad sobre cualquier inexactitud en las declaraciones de probabilidad correspondientes. Cuando se requiere exactitud en los niveles de significación de las pruebas estadísticas, puede haber un requisito adicional de que el procedimiento haga el máximo uso de la información estadística en el conjunto de datos. Es bien sabido que se puede obtener una prueba exacta descartando aleatoriamente datos del conjunto de datos más grande hasta que los tamaños de muestra sean iguales, reuniendo los datos en pares y tomando las diferencias, y luego usando una prueba t ordinaria para probar si la diferencia de medias es cero: claramente esto no sería "óptimo" en ningún sentido.

La tarea de especificar estimaciones de intervalos para este problema es una en la que un enfoque frecuentista no logra proporcionar una solución exacta, aunque existen algunas aproximaciones. Los enfoques bayesianos estándar tampoco logran proporcionar una respuesta que pueda expresarse como fórmulas simples y directas, pero los métodos computacionales modernos de análisis bayesiano sí permiten encontrar soluciones esencialmente exactas. ^{[ cita requerida ]} Por lo tanto, el estudio del problema se puede utilizar para dilucidar las diferencias entre los enfoques frecuentista y bayesiano para la estimación de intervalos.

Esquema de diferentes enfoques

Enfoque de Behrens y Fisher

En 1935, Ronald Fisher introdujo la inferencia fiducial ^[3]^[4] para aplicarla a este problema. Hizo referencia a un artículo anterior de Walter-Ulrich Behrens de 1929. Behrens y Fisher propusieron encontrar la distribución de probabilidad de

T\equiv {{\bar {x}}_{1}-{\bar {x}}_{2} \sobre {\sqrt {s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2}}}}

donde y son las dos medias muestrales , y s ₁ y s ₂ son sus desviaciones estándar . Véase la distribución de Behrens-Fisher . Fisher aproximó la distribución de esta ignorando la variación aleatoria de los tamaños relativos de las desviaciones estándar, ${\bar {x}}_{1}$ ${\bar {x}}_{2}$

{s_{1}/{\sqrt {n_{1}}} \sobre {\sqrt {s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2}}}}.

La solución de Fisher provocó controversia porque no tenía la propiedad de que la hipótesis de medias iguales fuera rechazada con probabilidad α si las medias fueran de hecho iguales. Desde entonces se han propuesto muchos otros métodos para tratar el problema y se ha investigado su efecto sobre los intervalos de confianza resultantes. ^[5]

Solución t aproximada de Welch

Un método ampliamente utilizado es el de BL Welch , ^[6] quien, como Fisher, estuvo en el University College de Londres . La varianza de la diferencia de medias

{\bar {d}}={\bar {x}}_{1}-{\bar {x}}_{2}

resultados en

s_{\bar {d}}^{2}={\frac {s_{1}^{2}}{n_{1}}}+{\frac {s_{2}^{2}}{n_{2}}}.

Welch (1938) aproximó la distribución de mediante la distribución de Pearson de tipo III (una distribución de chi-cuadrado escalada ) cuyos dos primeros momentos coinciden con los de . Esto se aplica al siguiente número de grados de libertad (gl), que generalmente no es entero: $s_{\bar {d}}^{2}$ $s_{\bar {d}}^{2}$

\nu \approx {(\gamma _{1}+\gamma _{2})^{2} \sobre \gamma _{1}^{2}/(n_{1}-1)+\gamma _{2}^{2}/(n_{2}-1)}\quad {\text{ donde }}\gamma _{i}=\sigma _{i}^{2}/n_{i}.

Bajo la hipótesis nula de igualdad de expectativas, μ ₁ = μ ₂ , la distribución del estadístico de Behrens–Fisher T , que también depende de la razón de varianzas σ ₁² / σ ₂² , podría ahora aproximarse mediante la distribución t de Student con estos ν grados de libertad. Pero este ν contiene las varianzas poblacionales σ _i² , y estas son desconocidas. La siguiente estimación solo reemplaza las varianzas poblacionales por las varianzas muestrales:

{\hat {\nu }}\approx {\frac {(g_{1}+g_{2})^{2}}{g_{1}^{2}/(n_{1}-1)+g_{2}^{2}/(n_{2}-1)}}\quad {\text{ donde }}g_{i}=s_{i}^{2}/n_{i}.

Esta es una variable aleatoria. No existe una distribución t con un número aleatorio de grados de libertad. Sin embargo, la T de Behrens-Fisher se puede comparar con un cuartil correspondiente de la distribución t de Student con estos números estimados de grados de libertad, , que generalmente no es un número entero. De esta manera, el límite entre la región de aceptación y rechazo del estadístico de prueba T se calcula en función de las varianzas empíricas s _i² , de manera que sea una función suave de estas. ${\hat {\nu }}$ ${\hat {\nu }}$

Este método tampoco da exactamente la tasa nominal, pero por lo general no se aleja demasiado de la realidad. ^{[ cita requerida ]} Sin embargo, si las varianzas de la población son iguales, o si las muestras son bastante pequeñas y se puede suponer que las varianzas de la población son aproximadamente iguales, es más preciso utilizar la prueba t de Student . ^{[ cita requerida ]}

Otros enfoques

Se han propuesto varios enfoques diferentes para el problema general, algunos de los cuales pretenden "resolver" alguna versión del problema. Entre ellos se encuentran: ^[7]

el de Chapman en 1950, ^[8]
la de Prokof'yev y Shishkin en 1974, ^[9]
el de Dudewicz y Ahmed en 1998. ^[10]
el de Chang Wang en 2022. ^[11]

En la comparación de métodos seleccionados de Dudewicz, ^[7] se encontró que el procedimiento de Dudewicz-Ahmed se recomienda para uso práctico.

Soluciones exactas a los problemas comunes y generalizados de Behrens-Fisher

Durante varias décadas, se creyó comúnmente que no existía una solución exacta al problema común de Behrens-Fisher. ^{[ cita requerida ]} Sin embargo, se demostró en 1966 que tiene una solución exacta. ^[12] En 2018, se demostró la función de densidad de probabilidad de una distribución generalizada de Behrens-Fisher de m medias y m errores estándar distintos de m muestras de distintos tamaños de distribuciones normales independientes con medias y varianzas distintas y el artículo también examinó sus aproximaciones asintóticas. ^[13] Un artículo de seguimiento mostró que la prueba t pareada clásica es un problema central de Behrens-Fisher con un coeficiente de correlación poblacional distinto de cero y derivó su función de densidad de probabilidad correspondiente resolviendo su problema de Behrens-Fisher no central asociado con un coeficiente de correlación poblacional distinto de cero. ^[14] También resolvió un problema de Behrens-Fisher no central más general con un coeficiente de correlación poblacional distinto de cero en el apéndice. ^[14]

Variantes

Se ha estudiado una variante menor del problema de Behrens-Fisher. ^[15] En este caso, el problema consiste en hacer inferencias acerca de la media común, suponiendo que las dos medias poblacionales son de hecho las mismas: por ejemplo, se podría requerir un intervalo de confianza para la media común.

Generalizaciones

Una generalización del problema involucra distribuciones normales multivariadas con matrices de covarianza desconocidas, y se conoce como el problema multivariado de Behrens-Fisher . ^[16]

El problema no paramétrico de Behrens-Fisher no supone que las distribuciones sean normales. ^[17]^[18] Las pruebas incluyen la prueba de Cucconi de 1968 y la prueba de Lepage de 1971.

Notas

^ Lehmann (1975) pág. 95
^ Lehmann (1975) Sección 7
^ Fisher, RA (1935). "El argumento fiducial en la inferencia estadística". Anales de eugenesia . 8 (4): 391–398. doi :10.1111/j.1469-1809.1935.tb02120.x. hdl : 2440/15222 .
^ "Argumento fiducial de RA Fisher y teorema de Bayes por Teddy Seidenfeld" (PDF) .
^ "Sezer, A. et al. Comparación de intervalos de confianza para el problema de Behrens-Fisher Comm. Stats. 2015".
^ Welch (1938, 1947)
^ ab Dudewicz, Ma, Mai y Su (2007)
^ Chapman, DG (1950). "Algunas pruebas de dos muestras". Anales de estadística matemática . 21 (4): 601–606. doi : 10.1214/aoms/1177729755 .
^ Prokof'yev, VN; Shishkin, AD (1974). "Clasificación sucesiva de conjuntos normales con varianzas desconocidas". Ingeniería de radio. Electron. Phys . 19 (2): 141–143.
^ Dudewicz y Ahmed (1998, 1999)
^ Wang, Chang (2022). "Una nueva prueba t no asintótica para problemas de Behrens-Fisher". arXiv : 2210.16473 [math.ST].
^ Kabe, DG (diciembre de 1966). "Sobre la distribución exacta de la estadística de Fisher-Behren'-Welch". Metrika . 10 (1): 13–15. doi :10.1007/BF02613414. S2CID 120965543.
^ Xiao, Yongshun (22 de marzo de 2018). "Sobre la solución de un problema generalizado de Behrens-Fisher". Revista de Estadística Teórica del Lejano Oriente . 54 (1): 21–140. doi :10.17654/TS054010021 . Consultado el 21 de mayo de 2020 .
^ ab Xiao, Yongshun (12 de diciembre de 2018). "Sobre la solución de un problema de Behrens-Fisher no central con un coeficiente de correlación poblacional distinto de cero". Revista del Lejano Oriente de Estadística Teórica . 54 (6): 527–600. doi :10.17654/TS054060527. S2CID 125245802 . Consultado el 21 de mayo de 2020 .
^ Young, GA, Smith, RL (2005) Fundamentos de inferencia estadística , CUP. ISBN 0-521-83971-8 (página 204)
^ Belloni y Didier (2008)
^ Brunner, E. (2000). "Problema no paramétrico de Behrens-Fisher: teoría asintótica y aproximación de muestras pequeñas". Revista biométrica . 42 : 17–25. doi :10.1002/(SICI)1521-4036(200001)42:1<17::AID-BIMJ17>3.0.CO;2-U.
^ Konietschke, Frank (2015). "nparcomp: Un paquete de software R para comparaciones múltiples no paramétricas e intervalos de confianza simultáneos". Journal of Statistical Software . 64 (9). doi : 10.18637/jss.v064.i09 . Consultado el 26 de septiembre de 2016 .

Referencias

Behrens, WU (1929). "Ein Beitrag zur Fehlerberechnung bei wenigen Beobachtungen" [Una contribución a la estimación de errores con pocas observaciones]. Landwirtschaftliche Jahrbücher . 68 . Berlín: Wiegandt y Hempel: 807–37.
Belloni, A.; Didier, G. (2008). "Sobre el problema de Behrens–Fisher: un algoritmo globalmente convergente y un estudio de muestras finitas de las pruebas de Wald, LR y LM". Anales de estadística . 36 (5): 2377–2408. arXiv : 0811.0672 . doi :10.1214/07-AOS528. S2CID 15968707.
Chang, CH; Pal, N (2008). "Una revisión del problema de Behrens–Fisher: comparación de cinco métodos de prueba". Communications in Statistics - Simulation and Computation . 37 (6): 1064–1085. doi :10.1080/03610910802049599. S2CID 32811488.
Dudewicz, EJ; Ahmed, SU (1998). "Nueva solución exacta y asintóticamente óptima para el problema de Behrens–Fisher, con tablas". American Journal of Mathematical and Management Sciences . 18 (3–4): 359–426. doi :10.1080/01966324.1998.10737471.
Dudewicz, EJ; Ahmed, SU (1999). "Nuevos procedimientos estadísticos y tablas heterocedásticas exactas y asintóticamente óptimas, II". American Journal of Mathematical and Management Sciences . 19 (1–2): 157–180. doi : 10.1080/01966324.1999.10737478 .
Dudewicz, EJ; Ma, Y.; Mai, SE; Su, H. (2007). "Soluciones exactas al problema de Behrens-Fisher: elección eficiente asintóticamente óptima y de muestra finita entre". Journal of Statistical Planning and Inference . 137 (5): 1584–1605. doi :10.1016/j.jspi.2006.09.007.
Fisher, RA (1935). "El argumento fiducial en la inferencia estadística". Anales de eugenesia . 8 (4): 391–398. doi :10.1111/j.1469-1809.1935.tb02120.x. hdl : 2440/15222 .
Fisher, RA (1941). "El enfoque asintótico de la integral de Behrens con tablas adicionales para la prueba d de significancia". Anales de eugenesia . 11 : 141–172. doi : 10.1111/j.1469-1809.1941.tb02281.x .
Fraser, DAS; Rousseau, J. (2008). "Estudiantización y obtención de valores p precisos". Biometrika . 95 (1): 1–16. doi :10.1093/biomet/asm093.
Lehmann, EL (1975) No paramétricos: métodos estadísticos basados en rangos , Holden-Day ISBN 0-8162-4996-6 , McGraw-Hill ISBN 0-07-037073-7
Ruben, H. (2002) "Una solución simple, conservadora y robusta del problema de Behrens-Fisher", Sankhyā:The Indian Journal of Statistics , Serie A, 64 (1),139–155.
Pardo, JA; Pardo, MD (2007). "Un estudio de simulación de una nueva familia de estadísticas de prueba para el problema de Behrens–Fisher". Kybernetes . 36 (5–6): 806–816. doi :10.1108/03684920710749866.
Sawilowsky, Shlomo S (2002). "Fermat, Schubert, Einstein y Behrens–Fisher: La diferencia probable entre dos medias cuando σ1 ≠ σ2". Revista de métodos estadísticos aplicados modernos . 1 (2). doi : 10.22237/jmasm/1036109940 .
Welch, BL (1938). "La significación de la diferencia entre dos medias cuando las varianzas de la población son desiguales". Biometrika . 29 (3/4): 350–62. doi :10.2307/2332010. JSTOR 2332010.
Welch, BL (1947), "La generalización del problema de "Student" cuando están implicadas varias varianzas poblacionales diferentes", Biometrika , 34 (1–2): 28–35, doi :10.1093/biomet/34.1-2.28, MR 0019277, PMID 20287819
Voinov, V.; Nikulin, M. (1995). "Sobre el problema de las medias de poblaciones normales ponderadas". Questiio . 19 (2): 7–20.
Zheng, SR; Shi, NZ; Ma, WQ (2010). "Inferencia estadística sobre la diferencia o razón de medias de poblaciones normales heterocedásticas". Revista de planificación e inferencia estadística . 140 (5): 1236–1242. doi :10.1016/j.jspi.2009.11.010.

Enlaces externos

Dong, BL (2004) El problema de Behrens-Fisher: un enfoque de verosimilitud empírica Documento de trabajo de econometría EWP0404, Universidad de Victoria

[1] Lehmann (1975) pág. 95

[2] Lehmann (1975) Sección 7

[3] Fisher, RA (1935). "El argumento fiducial en la inferencia estadística". Anales de eugenesia . 8 (4): 391–398. doi :10.1111/j.1469-1809.1935.tb02120.x. hdl : 2440/15222 .

[4] "Argumento fiducial de RA Fisher y teorema de Bayes por Teddy Seidenfeld" (PDF) .

[5] "Sezer, A. et al. Comparación de intervalos de confianza para el problema de Behrens-Fisher Comm. Stats. 2015".

[6] Welch (1938, 1947)

[DMMS-7] Dudewicz, Ma, Mai y Su (2007)

[8] Chapman, DG (1950). "Algunas pruebas de dos muestras". Anales de estadística matemática . 21 (4): 601–606. doi : 10.1214/aoms/1177729755 .

[9] Prokof'yev, VN; Shishkin, AD (1974). "Clasificación sucesiva de conjuntos normales con varianzas desconocidas". Ingeniería de radio. Electron. Phys . 19 (2): 141–143.

[10] Dudewicz y Ahmed (1998, 1999)

[:0-11] Wang, Chang (2022). "Una nueva prueba t no asintótica para problemas de Behrens-Fisher". arXiv : 2210.16473 [math.ST].

[12] Kabe, DG (diciembre de 1966). "Sobre la distribución exacta de la estadística de Fisher-Behren'-Welch". Metrika . 10 (1): 13–15. doi :10.1007/BF02613414. S2CID 120965543.

[13] Xiao, Yongshun (22 de marzo de 2018). "Sobre la solución de un problema generalizado de Behrens-Fisher". Revista de Estadística Teórica del Lejano Oriente . 54 (1): 21–140. doi :10.17654/TS054010021 . Consultado el 21 de mayo de 2020 .

[Xiao2018b-14] Xiao, Yongshun (12 de diciembre de 2018). "Sobre la solución de un problema de Behrens-Fisher no central con un coeficiente de correlación poblacional distinto de cero". Revista del Lejano Oriente de Estadística Teórica . 54 (6): 527–600. doi :10.17654/TS054060527. S2CID 125245802 . Consultado el 21 de mayo de 2020 .

[15] Young, GA, Smith, RL (2005) Fundamentos de inferencia estadística , CUP. ISBN 0-521-83971-8 (página 204)

[16] Belloni y Didier (2008)

[Brunner2000-17] Brunner, E. (2000). "Problema no paramétrico de Behrens-Fisher: teoría asintótica y aproximación de muestras pequeñas". Revista biométrica . 42 : 17–25. doi :10.1002/(SICI)1521-4036(200001)42:1<17::AID-BIMJ17>3.0.CO;2-U.

[nparcomp-18] Konietschke, Frank (2015). "nparcomp: Un paquete de software R para comparaciones múltiples no paramétricas e intervalos de confianza simultáneos". Journal of Statistical Software . 64 (9). doi : 10.18637/jss.v064.i09 . Consultado el 26 de septiembre de 2016 .