En estadística , el problema de Behrens-Fisher , llamado así en honor a Walter-Ulrich Behrens y Ronald Fisher , es el problema de estimación de intervalos y prueba de hipótesis relativo a la diferencia entre las medias de dos poblaciones distribuidas normalmente cuando no se supone que las varianzas de las dos poblaciones sean iguales, basándose en dos muestras independientes .
Una de las dificultades que presenta el análisis del problema de Behrens-Fisher y las soluciones propuestas es que existen muchas interpretaciones diferentes de lo que se entiende por "problema de Behrens-Fisher". Estas diferencias no sólo afectan a lo que se considera una solución pertinente, sino incluso al enunciado básico del contexto que se está considerando.
Sean X 1 , ..., X n e Y 1 , ..., Y m muestras iid de dos poblaciones que provienen de la misma familia de distribuciones de ubicación-escala. Se supone que los parámetros de escala son desconocidos y no necesariamente iguales, y el problema es evaluar si los parámetros de ubicación pueden tratarse razonablemente como iguales. Lehmann [1] afirma que "el problema de Behrens-Fisher" se utiliza tanto para esta forma general de modelo cuando la familia de distribuciones es arbitraria, como para cuando se hace la restricción a una distribución normal . Si bien Lehmann analiza una serie de enfoques para el problema más general, principalmente basados en no paramétricos, [2] la mayoría de las otras fuentes parecen utilizar "el problema de Behrens-Fisher" para referirse solo al caso en el que se supone que la distribución es normal: la mayor parte de este artículo hace esta suposición.
Se han presentado soluciones al problema de Behrens-Fisher que utilizan un punto de vista de inferencia clásico o bayesiano y cualquiera de las dos soluciones sería teóricamente inválida juzgada desde el otro punto de vista. Si la consideración se limita únicamente a la inferencia estadística clásica, es posible buscar soluciones al problema de inferencia que sean fáciles de aplicar en un sentido práctico, dando preferencia a esta simplicidad sobre cualquier inexactitud en las declaraciones de probabilidad correspondientes. Cuando se requiere exactitud en los niveles de significación de las pruebas estadísticas, puede haber un requisito adicional de que el procedimiento haga el máximo uso de la información estadística en el conjunto de datos. Es bien sabido que se puede obtener una prueba exacta descartando aleatoriamente datos del conjunto de datos más grande hasta que los tamaños de muestra sean iguales, reuniendo los datos en pares y tomando las diferencias, y luego usando una prueba t ordinaria para probar si la diferencia de medias es cero: claramente esto no sería "óptimo" en ningún sentido.
La tarea de especificar estimaciones de intervalos para este problema es una en la que un enfoque frecuentista no logra proporcionar una solución exacta, aunque existen algunas aproximaciones. Los enfoques bayesianos estándar tampoco logran proporcionar una respuesta que pueda expresarse como fórmulas simples y directas, pero los métodos computacionales modernos de análisis bayesiano sí permiten encontrar soluciones esencialmente exactas. [ cita requerida ] Por lo tanto, el estudio del problema se puede utilizar para dilucidar las diferencias entre los enfoques frecuentista y bayesiano para la estimación de intervalos.
En 1935, Ronald Fisher introdujo la inferencia fiducial [3] [4] para aplicarla a este problema. Hizo referencia a un artículo anterior de Walter-Ulrich Behrens de 1929. Behrens y Fisher propusieron encontrar la distribución de probabilidad de
donde y son las dos medias muestrales , y s 1 y s 2 son sus desviaciones estándar . Véase la distribución de Behrens-Fisher . Fisher aproximó la distribución de esta ignorando la variación aleatoria de los tamaños relativos de las desviaciones estándar,
La solución de Fisher provocó controversia porque no tenía la propiedad de que la hipótesis de medias iguales fuera rechazada con probabilidad α si las medias fueran de hecho iguales. Desde entonces se han propuesto muchos otros métodos para tratar el problema y se ha investigado su efecto sobre los intervalos de confianza resultantes. [5]
Un método ampliamente utilizado es el de BL Welch , [6] quien, como Fisher, estuvo en el University College de Londres . La varianza de la diferencia de medias
resultados en
Welch (1938) aproximó la distribución de mediante la distribución de Pearson de tipo III (una distribución de chi-cuadrado escalada ) cuyos dos primeros momentos coinciden con los de . Esto se aplica al siguiente número de grados de libertad (gl), que generalmente no es entero:
Bajo la hipótesis nula de igualdad de expectativas, μ 1 = μ 2 , la distribución del estadístico de Behrens–Fisher T , que también depende de la razón de varianzas σ 1 2 / σ 2 2 , podría ahora aproximarse mediante la distribución t de Student con estos ν grados de libertad. Pero este ν contiene las varianzas poblacionales σ i 2 , y estas son desconocidas. La siguiente estimación solo reemplaza las varianzas poblacionales por las varianzas muestrales:
Esta es una variable aleatoria. No existe una distribución t con un número aleatorio de grados de libertad. Sin embargo, la T de Behrens-Fisher se puede comparar con un cuartil correspondiente de la distribución t de Student con estos números estimados de grados de libertad, , que generalmente no es un número entero. De esta manera, el límite entre la región de aceptación y rechazo del estadístico de prueba T se calcula en función de las varianzas empíricas s i 2 , de manera que sea una función suave de estas.
Este método tampoco da exactamente la tasa nominal, pero por lo general no se aleja demasiado de la realidad. [ cita requerida ] Sin embargo, si las varianzas de la población son iguales, o si las muestras son bastante pequeñas y se puede suponer que las varianzas de la población son aproximadamente iguales, es más preciso utilizar la prueba t de Student . [ cita requerida ]
Se han propuesto varios enfoques diferentes para el problema general, algunos de los cuales pretenden "resolver" alguna versión del problema. Entre ellos se encuentran: [7]
En la comparación de métodos seleccionados de Dudewicz, [7] se encontró que el procedimiento de Dudewicz-Ahmed se recomienda para uso práctico.
Durante varias décadas, se creyó comúnmente que no existía una solución exacta al problema común de Behrens-Fisher. [ cita requerida ] Sin embargo, se demostró en 1966 que tiene una solución exacta. [12] En 2018, se demostró la función de densidad de probabilidad de una distribución generalizada de Behrens-Fisher de m medias y m errores estándar distintos de m muestras de distintos tamaños de distribuciones normales independientes con medias y varianzas distintas y el artículo también examinó sus aproximaciones asintóticas. [13] Un artículo de seguimiento mostró que la prueba t pareada clásica es un problema central de Behrens-Fisher con un coeficiente de correlación poblacional distinto de cero y derivó su función de densidad de probabilidad correspondiente resolviendo su problema de Behrens-Fisher no central asociado con un coeficiente de correlación poblacional distinto de cero. [14] También resolvió un problema de Behrens-Fisher no central más general con un coeficiente de correlación poblacional distinto de cero en el apéndice. [14]
Se ha estudiado una variante menor del problema de Behrens-Fisher. [15] En este caso, el problema consiste en hacer inferencias acerca de la media común, suponiendo que las dos medias poblacionales son de hecho las mismas: por ejemplo, se podría requerir un intervalo de confianza para la media común.
Una generalización del problema involucra distribuciones normales multivariadas con matrices de covarianza desconocidas, y se conoce como el problema multivariado de Behrens-Fisher . [16]
El problema no paramétrico de Behrens-Fisher no supone que las distribuciones sean normales. [17] [18] Las pruebas incluyen la prueba de Cucconi de 1968 y la prueba de Lepage de 1971.
Este artículo incluye una lista de referencias generales , pero carece de suficientes citas en línea correspondientes . ( febrero de 2010 ) |