Tendencia central

Valor estadístico que representa el centro o promedio de una distribución

En estadística , una tendencia central (o medida de tendencia central ) es un valor central o típico de una distribución de probabilidad . ^[1]

En el lenguaje coloquial, las medidas de tendencia central suelen denominarse promedios . El término tendencia central data de finales de la década de 1920. ^[2]

Las medidas de tendencia central más comunes son la media aritmética , la mediana y la moda . Se puede calcular una tendencia media para un conjunto finito de valores o para una distribución teórica, como la distribución normal . En ocasiones, los autores utilizan la tendencia central para denotar "la tendencia de los datos cuantitativos a agruparse en torno a un valor central". ^[2]^[3]

La tendencia central de una distribución se contrasta típicamente con su dispersión o variabilidad ; la dispersión y la tendencia central son las propiedades que se suelen caracterizar en las distribuciones. El análisis puede determinar si los datos tienen una tendencia central fuerte o débil en función de su dispersión.

Medidas

Lo siguiente se puede aplicar a datos unidimensionales. Según las circunstancias, puede ser adecuado transformar los datos antes de calcular una tendencia central. Algunos ejemplos son elevar al cuadrado los valores o tomar logaritmos. La idoneidad de una transformación y su aplicación dependen en gran medida de los datos que se estén analizando.

Media aritmética o simplemente, media: la suma de todas las mediciones dividida por el número de observaciones en el conjunto de datos.
Mediana: el valor medio que separa la mitad superior de la mitad inferior del conjunto de datos. La mediana y la moda son las únicas medidas de tendencia central que se pueden utilizar para datos ordinales , en los que los valores se clasifican entre sí pero no se miden de forma absoluta.
Modo: el valor más frecuente en el conjunto de datos. Esta es la única medida de tendencia central que se puede utilizar con datos nominales , que tienen asignaciones de categorías puramente cualitativas.
Media generalizada: Una generalización de la ecuación pitagórica significa , especificada por un exponente.
Media geométrica: la raíz n- ésima del producto de los valores de los datos, donde hay n de ellos. Esta medida es válida únicamente para datos que se miden en una escala estrictamente positiva.
Media armónica: el recíproco de la media aritmética de los recíprocos de los valores de los datos. Esta medida es válida únicamente para datos que se miden en una escala estrictamente positiva o estrictamente negativa.
Media aritmética ponderada: una media aritmética que incorpora ponderación a ciertos elementos de datos.
Media truncada o media recortada: la media aritmética de los valores de datos después de descartar una cierta cantidad o proporción de los valores de datos más altos y más bajos.
Media intercuartil: una media truncada basada en datos dentro del rango intercuartil .
Rango medio: la media aritmética de los valores máximo y mínimo de un conjunto de datos.
Bisagra media: la media aritmética del primer y tercer cuartiles .
Media cuasi-aritmética: Una generalización de la media generalizada , especificada por una función inyectiva continua .
Trimean: la media aritmética ponderada de la mediana y dos cuartiles.
Media winsorizada: una media aritmética en la que los valores extremos se reemplazan por valores más cercanos a la mediana.

Cualquiera de los métodos anteriores se puede aplicar a cada dimensión de datos multidimensionales, pero los resultados pueden no ser invariables a las rotaciones del espacio multidimensional.

Mediana geométrica: el punto que minimiza la suma de distancias a un conjunto de puntos de muestra. Es lo mismo que la mediana cuando se aplica a datos unidimensionales, pero no es lo mismo que tomar la mediana de cada dimensión de forma independiente. No es invariable a diferentes reescalamientos de las diferentes dimensiones.
Media cuadrática (a menudo conocida como raíz cuadrada media ): Útil en ingeniería, pero no se utiliza a menudo en estadística. Esto se debe a que no es un buen indicador del centro de la distribución cuando esta incluye valores negativos.
Profundidad simple: la probabilidad de que un símplex elegido al azar con vértices de la distribución dada contenga el centro dado
Mediana de Tukey: un punto con la propiedad de que cada semiespacio que lo contiene también contiene muchos puntos de muestra

Soluciones a problemas variacionales

Varias medidas de tendencia central pueden caracterizarse como la solución de un problema variacional, en el sentido del cálculo de variaciones , es decir, la minimización de la variación desde el centro. Es decir, dada una medida de dispersión estadística , se pide una medida de tendencia central que minimice la variación: de modo que la variación desde el centro sea mínima entre todas las opciones de centro. En un chiste, "la dispersión precede a la ubicación". Estas medidas se definen inicialmente en una dimensión, pero se pueden generalizar a múltiples dimensiones. Este centro puede ser único o no. En el sentido de los espacios $L p$ , la correspondencia es:

$L p$	dispersión	tendencia central
$El 0$	relación de variación	modo ^[a]
$L 1$	desviación absoluta media	mediana ( mediana geométrica ) ^[b]
$L 2$	desviación estándar	media ( centroide ) ^[c]
$L \infty$	desviación máxima	rango medio ^[d]

Las funciones asociadas se denominan $p$ -normas : respectivamente 0-"norma", 1-norma, 2-norma y ∞-norma. La función correspondiente al espacio L ⁰ no es una norma, y por ello se la suele mencionar entre comillas: 0-"norma".

En ecuaciones, para un conjunto de datos dado (finito) $X$ , considerado como un vector $x = (x 1,\dots, x n)$ , la dispersión alrededor de un punto $c$ es la "distancia" desde $x$ al vector constante $c = (c,\dots, c)$ en la p -norma (normalizada por el número de puntos n ):

f_{p}(c)=\left\|\mathbf {x} -\mathbf {c} \right\|_{p}:={\bigg (}{\frac {1}{n}}\sum _{i=1}^{n}\left|x_{i}-c\right|^{p}{\bigg )}^{1/p}

Para $p = 0$ y $p = \infty$ estas funciones se definen tomando límites, respectivamente, como $p \to 0$ y $p \to \infty$ . Para $p = 0$ los valores límite son $00 = 0$ y $a 0 = 0$ o $a \neq 0$ , por lo que la diferencia se convierte simplemente en igualdad, por lo que la norma 0 cuenta el número de puntos desiguales . Para $p = \infty$ domina el número más grande y, por lo tanto, la norma ∞ es la diferencia máxima.

Unicidad

La media ( centro L ² ) y el rango medio ( centro L ^∞ ) son únicos (cuando existen), mientras que la mediana ( centro L ¹ ) y la moda ( centro L ⁰ ) no son en general únicos. Esto se puede entender en términos de convexidad de las funciones asociadas ( funciones coercitivas ).

La norma 2 y la norma ∞ son estrictamente convexas y, por lo tanto (mediante la optimización convexa), el minimizador es único (si existe) y existe para distribuciones acotadas. Por lo tanto, la desviación estándar sobre la media es menor que la desviación estándar sobre cualquier otro punto, y la desviación máxima sobre el rango medio es menor que la desviación máxima sobre cualquier otro punto.

La norma 1 no es estrictamente convexa, mientras que la convexidad estricta es necesaria para garantizar la unicidad del minimizador. En consecuencia, la mediana (en este sentido de minimización) no es en general única y, de hecho, cualquier punto entre los dos puntos centrales de una distribución discreta minimiza la desviación absoluta promedio.

La "norma" 0 no es convexa (por lo tanto, no es una norma). En consecuencia, la moda no es única: por ejemplo, en una distribución uniforme cualquier punto es la moda.

Agrupamiento

En lugar de un único punto central, se pueden pedir múltiples puntos de modo que se minimice la variación a partir de estos puntos. Esto conduce al análisis de conglomerados , en el que cada punto del conjunto de datos se agrupa con el "centro" más cercano. Lo más común es que el uso de la norma 2 generalice la media a la agrupación de k -medias , mientras que el uso de la norma 1 generalice la mediana (geométrica) a la agrupación de k -medianas . El uso de la norma 0 simplemente generaliza la moda (valor más común) para usar los k valores más comunes como centros.

A diferencia de las estadísticas de un solo centro, esta agrupación multicéntrica en general no se puede calcular en una expresión de forma cerrada , y en su lugar se debe calcular o aproximar mediante un método iterativo ; un enfoque general son los algoritmos de expectativa-maximización .

Geometría de la información

La noción de un "centro" como minimización de la variación se puede generalizar en la geometría de la información como una distribución que minimiza la divergencia (una distancia generalizada) de un conjunto de datos. El caso más común es la estimación de máxima verosimilitud , donde la estimación de máxima verosimilitud (MLE) maximiza la verosimilitud (minimiza la sorpresa esperada ), lo que se puede interpretar geométricamente utilizando la entropía para medir la variación: la MLE minimiza la entropía cruzada (equivalentemente, entropía relativa , divergencia de Kullback-Leibler).

Un ejemplo sencillo de esto es el centro de los datos nominales: en lugar de utilizar la moda (el único "centro" de un solo valor), a menudo se utiliza la medida empírica (la distribución de frecuencia dividida por el tamaño de la muestra ) como "centro". Por ejemplo, dados datos binarios , digamos cara o cruz, si un conjunto de datos consta de 2 caras y 1 cruz, entonces la moda es "cara", pero la medida empírica es 2/3 caras, 1/3 cruz, lo que minimiza la entropía cruzada (sorpresa total) del conjunto de datos. Esta perspectiva también se utiliza en el análisis de regresión , donde los mínimos cuadrados encuentran la solución que minimiza las distancias desde ella, y análogamente en la regresión logística , una estimación de máxima verosimilitud minimiza la sorpresa (distancia de información).

Relaciones entre la media, la mediana y la moda

Para distribuciones unimodales se conocen los siguientes límites y son precisos: ^[4]

{\frac {|\theta -\mu |}{\sigma }}\leq {\sqrt {3}},

{\frac {|\nu -\mu |}{\sigma }}\leq {\sqrt {0.6}},

{\frac {|\theta -\nu |}{\sigma }}\leq {\sqrt {3}},

donde μ es la media, ν es la mediana, θ es la moda y σ es la desviación estándar.

Para cada distribución, ^[5]^[6]

{\frac {|\nu -\mu |}{\sigma }}\leq 1.

Véase también

Notas

^ A diferencia de las otras medidas, la moda no requiere ninguna geometría en el conjunto y, por lo tanto, se aplica igualmente en una dimensión, en múltiples dimensiones o incluso para variables categóricas .
^ La mediana sólo se define en una dimensión; la mediana geométrica es una generalización multidimensional.
^ La media se puede definir de forma idéntica para vectores en múltiples dimensiones que para escalares en una dimensión; la forma multidimensional a menudo se denomina centroide.
^ En dimensiones múltiples, el rango medio se puede definir por coordenadas (tomar el rango medio de cada coordenada), aunque esto no es común.

Referencias

^ Weisberg HF (1992) Tendencia central y variabilidad , Sage University Paper Series sobre aplicaciones cuantitativas en las ciencias sociales, ISBN 0-8039-4007-6 p.2
^ ab Upton, G.; Cook, I. (2008) Oxford Dictionary of Statistics , OUP ISBN 978-0-19-954145-4 (entrada para "tendencia central")
^ Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms , OUP para el Instituto Internacional de Estadística . ISBN 0-19-920613-9 (entrada para "tendencia central")
^ Johnson NL, Rogers CA (1951) "El problema del momento para distribuciones unimodales". Anales de estadística matemática , 22 (3) 433–439
^ Hotelling H, Solomons LM (1932) Los límites de una medida de asimetría. Annals Math Stat 3, 141–114
^ Garver (1932) Sobre los límites de una medida de asimetría. Ann Math Stats 3(4) 141–142

[4] A diferencia de las otras medidas, la moda no requiere ninguna geometría en el conjunto y, por lo tanto, se aplica igualmente en una dimensión, en múltiples dimensiones o incluso para variables categóricas .

[5] La mediana sólo se define en una dimensión; la mediana geométrica es una generalización multidimensional.

[6] La media se puede definir de forma idéntica para vectores en múltiples dimensiones que para escalares en una dimensión; la forma multidimensional a menudo se denomina centroide.

[7] En dimensiones múltiples, el rango medio se puede definir por coordenadas (tomar el rango medio de cada coordenada), aunque esto no es común.

[Weisberg-1] Weisberg HF (1992) Tendencia central y variabilidad , Sage University Paper Series sobre aplicaciones cuantitativas en las ciencias sociales, ISBN 0-8039-4007-6 p.2

[Upton-2] Upton, G.; Cook, I. (2008) Oxford Dictionary of Statistics , OUP ISBN 978-0-19-954145-4 (entrada para "tendencia central")

[Dodge-3] Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms , OUP para el Instituto Internacional de Estadística . ISBN 0-19-920613-9 (entrada para "tendencia central")

[Johnson1951-8] Johnson NL, Rogers CA (1951) "El problema del momento para distribuciones unimodales". Anales de estadística matemática , 22 (3) 433–439

[Hotelling1932-9] Hotelling H, Solomons LM (1932) Los límites de una medida de asimetría. Annals Math Stat 3, 141–114

[Garver1932-10] Garver (1932) Sobre los límites de una medida de asimetría. Ann Math Stats 3(4) 141–142