La desviación absoluta media ( DAP ) de un conjunto de datos es el promedio de las desviaciones absolutas con respecto a un punto central . Es una estadística resumen de la dispersión o variabilidad estadística . En su forma general, el punto central puede ser una media , una mediana , una moda o el resultado de cualquier otra medida de tendencia central o cualquier valor de referencia relacionado con el conjunto de datos dado. La DAP incluye la desviación absoluta media y la desviación absoluta mediana (ambas abreviadas como MAD ).
Varias medidas de dispersión estadística se definen en términos de la desviación absoluta. El término "desviación absoluta media" no identifica de forma única una medida de dispersión estadística , ya que existen varias medidas que se pueden utilizar para medir desviaciones absolutas, y también hay varias medidas de tendencia central que se pueden utilizar. Por lo tanto, para identificar de forma única la desviación absoluta es necesario especificar tanto la medida de desviación como la medida de tendencia central. La literatura estadística aún no ha adoptado una notación estándar, ya que tanto la desviación absoluta media alrededor de la media como la desviación absoluta mediana alrededor de la mediana se han denotado por sus iniciales "MAD" en la literatura, lo que puede dar lugar a confusión, ya que generalmente tienen valores considerablemente diferentes entre sí.
La desviación absoluta media de un conjunto X = { x 1 , x 2 , …, x n } es
La elección de la medida de tendencia central, , tiene un efecto marcado en el valor de la desviación media. Por ejemplo, para el conjunto de datos {2, 2, 3, 4, 14}:
Medida de tendencia central | Desviación absoluta media |
---|---|
Media aritmética = 5 | |
Mediana = 3 | |
Moda = 2 |
La desviación absoluta media (DMA), también denominada "desviación media" o, en ocasiones, "desviación absoluta promedio", es la media de las desviaciones absolutas de los datos en torno a la media de los mismos: la distancia media (absoluta) con respecto a la media. "Desviación absoluta promedio" puede referirse a este uso o a la forma general con respecto a un punto central específico (véase más arriba).
Se ha propuesto utilizar MAD en lugar de la desviación estándar , ya que se corresponde mejor con la vida real. [1] Debido a que la MAD es una medida de variabilidad más simple que la desviación estándar , puede ser útil en la enseñanza escolar. [2] [3]
La precisión de los pronósticos de este método está muy relacionada con el método del error cuadrático medio (MSE), que es simplemente el error cuadrático medio de los pronósticos. Aunque estos métodos están muy relacionados, el MAD es el más utilizado porque es más fácil de calcular (evita la necesidad de elevar al cuadrado) [4] y más fácil de entender. [5]
Para la distribución normal , la razón entre la desviación absoluta media y la desviación estándar es . Por lo tanto, si X es una variable aleatoria distribuida normalmente con un valor esperado de 0, entonces, véase Geary (1935): [6] En otras palabras, para una distribución normal, la desviación absoluta media es aproximadamente 0,8 veces la desviación estándar. Sin embargo, las mediciones en la muestra proporcionan valores de la razón entre la desviación media promedio y la desviación estándar para una muestra gaussiana dada n con los siguientes límites: , con un sesgo para n pequeño . [7]
La desviación absoluta media de la media es menor o igual a la desviación estándar ; una forma de demostrarlo se basa en la desigualdad de Jensen .
La desigualdad de Jensen es , donde φ es una función convexa, esto implica que:
Dado que ambos lados son positivos y la raíz cuadrada es una función monótonamente creciente en el dominio positivo:
Para un caso general de esta afirmación, véase la desigualdad de Hölder .
La mediana es el punto en torno al cual se minimiza la desviación media. La mediana MAD ofrece una medida directa de la escala de una variable aleatoria en torno a su mediana.
Este es el estimador de máxima verosimilitud del parámetro de escala de la distribución de Laplace .
Como la mediana minimiza la distancia absoluta promedio, tenemos . La desviación absoluta media con respecto a la mediana es menor o igual que la desviación absoluta media con respecto a la media. De hecho, la desviación absoluta media con respecto a la mediana siempre es menor o igual que la desviación absoluta media con respecto a cualquier otro número fijo.
Utilizando la función de dispersión general, Habib (2011) definió la MAD sobre la mediana como el punto donde se encuentra la función indicadora.
Esta representación permite obtener coeficientes de correlación mediana de MAD. [ cita requerida ]
Aunque en principio la media o cualquier otro punto central podría tomarse como punto central para la desviación absoluta mediana, lo más frecuente es tomar en su lugar el valor mediano .
La desviación absoluta media (también MAD) es la mediana de la desviación absoluta con respecto a la mediana . Es un estimador robusto de la dispersión .
Para el ejemplo {2, 2, 3, 4, 14}: 3 es la mediana, por lo que las desviaciones absolutas de la mediana son {1, 1, 0, 1, 11} (reordenadas como {0, 1, 1, 1, 11}) con una mediana de 1, en este caso no afectada por el valor del valor atípico 14, por lo que la desviación absoluta mediana es 1.
Para una distribución simétrica, la desviación absoluta mediana es igual a la mitad del rango intercuartil .
La desviación absoluta máxima en torno a un punto arbitrario es la desviación absoluta máxima de una muestra con respecto a ese punto. Si bien no es estrictamente una medida de tendencia central, la desviación absoluta máxima se puede hallar utilizando la fórmula para la desviación absoluta promedio como se indica anteriormente con , donde es el máximo de la muestra .
Las medidas de dispersión estadística derivadas de la desviación absoluta caracterizan a varias medidas de tendencia central como minimizadoras de la dispersión: La mediana es la medida de tendencia central más asociada con la desviación absoluta. Algunos parámetros de ubicación se pueden comparar de la siguiente manera:
This section needs expansion. You can help by adding to it. (March 2009) |
La desviación absoluta media de una muestra es un estimador sesgado de la desviación absoluta media de la población. Para que la desviación absoluta sea un estimador insesgado, el valor esperado (promedio) de todas las desviaciones absolutas de la muestra debe ser igual a la desviación absoluta de la población. Sin embargo, no es así. Para la población 1, 2, 3, tanto la desviación absoluta de la población con respecto a la mediana como la desviación absoluta de la población con respecto a la media son 2/3. El promedio de todas las desviaciones absolutas de la muestra con respecto a la media de tamaño 3 que se pueden extraer de la población es 44/81, mientras que el promedio de todas las desviaciones absolutas de la muestra con respecto a la mediana es 4/9. Por lo tanto, la desviación absoluta es un estimador sesgado.
Sin embargo, este argumento se basa en la noción de imparcialidad media. Cada medida de ubicación tiene su propia forma de imparcialidad (véase la entrada sobre estimador sesgado ). La forma de imparcialidad relevante aquí es la imparcialidad mediana.
{{cite web}}
: CS1 maint: bot: original URL status unknown (link){{cite book}}
: CS1 maint: multiple names: authors list (link)MAD es a menudo el método preferido para medir el error de pronóstico porque no requiere elevar al cuadrado.
el significado del MAD es más fácil de interpretar.