Desviaciones al cuadrado de la media

Cálculos en teoría de la probabilidad

Las desviaciones al cuadrado de la media ( SDM ) resultan de elevar al cuadrado las desviaciones . En teoría de probabilidad y estadística , la definición de varianza es el valor esperado de la SDM (cuando se considera una distribución teórica ) o su valor promedio (para datos experimentales reales). Los cálculos para el análisis de varianza implican la partición de una suma de SDM.

Fondo

La comprensión de los cálculos involucrados se mejora enormemente mediante un estudio del valor estadístico.

mi ( incógnita 2 ) {\displaystyle \nombre del operador {E} (X^{2})} , donde es el operador de valor esperado. mi {\displaystyle \nombre del operador {E} }

Para una variable aleatoria con media y varianza , incógnita {\estilo de visualización X} micras {\estilo de visualización \mu} σ 2 {\displaystyle \sigma ^{2}}

σ 2 = mi ( incógnita 2 ) micras 2 . {\displaystyle \sigma ^{2}=\operatorname {E} (X^{2})-\mu ^{2}.} [1]

(Su derivación se muestra aquí .) Por lo tanto,

mi ( incógnita 2 ) = σ 2 + micras 2 . {\displaystyle \operatorname {E} (X^{2})=\sigma ^{2}+\mu ^{2}.}

De lo anterior se puede deducir lo siguiente:

mi ( ( incógnita 2 ) ) = norte σ 2 + norte micras 2 , {\displaystyle \operatorname {E} \left(\sum \left(X^{2}\right)\right)=n\sigma ^{2}+n\mu ^{2},}
mi ( ( incógnita ) 2 ) = norte σ 2 + norte 2 micras 2 . {\displaystyle \operatorname {E} \left(\left(\sum X\right)^{2}\right)=n\sigma ^{2}+n^{2}\mu ^{2}.}

Varianza de la muestra

La suma de las desviaciones al cuadrado necesarias para calcular la varianza de la muestra (antes de decidir si dividir por n o n  − 1) se calcula más fácilmente como

S = incógnita 2 ( incógnita ) 2 norte {\displaystyle S=\suma x^{2}-{\frac {\left(\suma x\right)^{2}}{n}}}

De las dos expectativas derivadas anteriores, el valor esperado de esta suma es

mi ( S ) = norte σ 2 + norte micras 2 norte σ 2 + norte 2 micras 2 norte {\displaystyle \operatorname {E} (S)=n\sigma ^{2}+n\mu ^{2}-{\frac {n\sigma ^{2}+n^{2}\mu ^{2}}{n}}}

Lo que implica

mi ( S ) = ( norte 1 ) σ 2 . {\displaystyle \operatorname {E} (S)=(n-1)\sigma ^{2}.}

Esto demuestra efectivamente el uso del divisor n  − 1 en el cálculo de una estimación muestral imparcial de  σ 2 .

Partición — análisis de varianza

En la situación en la que hay datos disponibles para k grupos de tratamiento diferentes que tienen un tamaño n i donde i varía de 1 a k , entonces se supone que la media esperada de cada grupo es

mi ( micras i ) = micras + yo i {\displaystyle \operatorname {E} (\mu _{i})=\mu +T_{i}}

y la varianza de cada grupo de tratamiento no cambia con respecto a la varianza de la población . σ 2 {\displaystyle \sigma ^{2}}

Bajo la hipótesis nula de que los tratamientos no tienen efecto, entonces cada uno de ellos será cero. yo i Estilo de visualización T_{i}}

Ahora es posible calcular tres sumas de cuadrados:

Individual
I = incógnita 2 {\displaystyle I=\suma x^{2}}
mi ( I ) = norte σ 2 + norte micras 2 {\displaystyle \operatorname {E} (I)=n\sigma ^{2}+n\mu ^{2}}
Tratos
yo = i = 1 a ( ( incógnita ) 2 / norte i ) {\displaystyle T=\suma _{i=1}^{k}(\suma x\right)^{2}/n_{i}\right)}
mi ( yo ) = a σ 2 + i = 1 a norte i ( micras + yo i ) 2 {\displaystyle \operatorname {E} (T)=k\sigma ^{2}+\sum _{i=1}^{k}n_{i}(\mu +T_{i})^{2}}
mi ( yo ) = a σ 2 + norte micras 2 + 2 micras i = 1 a ( norte i yo i ) + i = 1 a norte i ( yo i ) 2 {\displaystyle \operatorname {E} (T)=k\sigma ^{2}+n\mu ^{2}+2\mu \sum _{i=1}^{k}(n_{i}T_{i})+\sum _{i=1}^{k}n_{i}(T_{i})^{2}}

Bajo la hipótesis nula de que los tratamientos no causan diferencias y todos son cero, la expectativa se simplifica a yo i Estilo de visualización T_{i}}

mi ( yo ) = a σ 2 + norte micras 2 . {\displaystyle \operatorname {E} (T)=k\sigma ^{2}+n\mu ^{2}.}
Combinación
do = ( incógnita ) 2 / norte {\displaystyle C=\left(\suma x\right)^{2}/n}
mi ( do ) = σ 2 + norte micras 2 {\displaystyle \operatorname {E} (C)=\sigma ^{2}+n\mu ^{2}}

Sumas de desviaciones al cuadrado

Bajo la hipótesis nula, la diferencia de cualquier par de I , T y C no contiene ninguna dependencia de , solo de . micras {\estilo de visualización \mu} σ 2 {\displaystyle \sigma ^{2}}

mi ( I do ) = ( norte 1 ) σ 2 {\displaystyle \operatorname {E} (IC)=(n-1)\sigma ^{2}} Desviaciones cuadradas totales, también conocidas como suma total de cuadrados
mi ( yo do ) = ( a 1 ) σ 2 {\displaystyle \operatorname {E} (TC)=(k-1)\sigma ^{2}} Desviaciones al cuadrado del tratamiento, también conocidas como suma de cuadrados explicada
mi ( I yo ) = ( norte a ) σ 2 {\displaystyle \operatorname {E} (IT)=(nk)\sigma ^{2}} Desviaciones residuales al cuadrado, también conocidas como suma residual de cuadrados.

Las constantes ( n  − 1), ( k  − 1) y ( n  −  k ) normalmente se denominan número de grados de libertad .

Ejemplo

En un ejemplo muy sencillo, se obtienen 5 observaciones a partir de dos tratamientos. El primer tratamiento da tres valores 1, 2 y 3, y el segundo tratamiento da dos valores 4 y 6.

I = 1 2 1 + 2 2 1 + 3 2 1 + 4 2 1 + 6 2 1 = 66 {\displaystyle I={\frac {1^{2}}{1}}+{\frac {2^{2}}{1}}+{\frac {3^{2}}{1}}+ {\frac {4^{2}}{1}}+{\frac {6^{2}}{1}}=66}
yo = ( 1 + 2 + 3 ) 2 3 + ( 4 + 6 ) 2 2 = 12 + 50 = 62 {\displaystyle T={\frac {(1+2+3)^{2}}{3}}+{\frac {(4+6)^{2}}{2}}=12+50=62}
do = ( 1 + 2 + 3 + 4 + 6 ) 2 5 = 256 / 5 = 51.2 {\displaystyle C={\frac {(1+2+3+4+6)^{2}}{5}}=256/5=51,2}

Donación

Desviaciones cuadradas totales = 66 − 51,2 = 14,8 con 4 grados de libertad.
Desviaciones al cuadrado del tratamiento = 62 − 51,2 = 10,8 con 1 grado de libertad.
Desviaciones cuadradas residuales = 66 − 62 = 4 con 3 grados de libertad.

Análisis de varianza de dos vías

En estadística , el análisis de varianza de dos vías (ANOVA) es una extensión del ANOVA de una vía que examina la influencia de dos variables independientes categóricas diferentes sobre una variable dependiente continua . El ANOVA de dos vías no solo tiene como objetivo evaluar el efecto principal de cada variable independiente, sino también si existe alguna interacción entre ellas.

Véase también

Referencias

  1. ^ Mood y Graybill: Una introducción a la teoría de la estadística (McGraw Hill)
Obtenido de "https://es.wikipedia.org/w/index.php?title=Desviaciones_cuadradas_con_respecto_a_la_media&oldid=1257350625"