En lenguaje corriente , un promedio es un número o valor único que representa mejor un conjunto de datos. El tipo de promedio que se toma como más representativo de una lista de números es la media aritmética : la suma de los números dividida por la cantidad de números que hay en la lista. Por ejemplo, la media media de los números 2, 3, 4, 7 y 9 (que suman 25) es 5. Dependiendo del contexto, la estadística más representativa que se tomará como promedio podría ser otra medida de tendencia central , como el rango medio , la mediana , la moda o la media geométrica . Por ejemplo, el ingreso personal promedio a menudo se da como la mediana (el número por debajo del cual se encuentran el 50% de los ingresos personales y por encima del cual se encuentran el 50% de los ingresos personales) porque la media sería más alta al incluir los ingresos personales de unos pocos multimillonarios . Por esta razón, se recomienda evitar el uso de la palabra "promedio" cuando se habla de medidas de tendencia central y especificar qué medida promedio se está utilizando.
Si todos los números de una lista son el mismo número, entonces su promedio también es igual a este número. Esta propiedad es compartida por cada uno de los muchos tipos de promedio.
Otra propiedad universal es la monotonía : si dos listas de números A y B tienen la misma longitud, y cada entrada de la lista A es al menos tan grande como la entrada correspondiente en la lista B , entonces el promedio de la lista A es al menos el de la lista B. Además, todos los promedios satisfacen la homogeneidad lineal : si todos los números de una lista se multiplican por el mismo número positivo, entonces su promedio cambia por el mismo factor.
En algunos tipos de promedio, a los elementos de la lista se les asignan diferentes pesos antes de determinar el promedio. Estos incluyen la media aritmética ponderada , la media geométrica ponderada y la mediana ponderada . Además, para algunos tipos de promedio móvil , el peso de un elemento depende de su posición en la lista. Sin embargo, la mayoría de los tipos de promedio satisfacen la insensibilidad a la permutación : todos los elementos cuentan por igual para determinar su valor promedio y sus posiciones en la lista son irrelevantes; el promedio de (1, 2, 3, 4, 6) es el mismo que el de (3, 2, 6, 4, 1).
La media aritmética , la media geométrica y la media armónica se conocen colectivamente como medias pitagóricas .
La moda , la mediana y el rango medio se utilizan a menudo, además de la media , como estimaciones de la tendencia central en las estadísticas descriptivas . Todas ellas pueden considerarse como una forma de minimizar la variación en alguna medida; consulte Tendencia central § Soluciones a los problemas variacionales .
Tipo | Descripción | Ejemplo | Resultado |
---|---|---|---|
Media aritmética | Suma de valores de un conjunto de datos dividida por el número de valores: | (1+2+2+3+4+7+9) / 7 | 4 |
Mediana | Valor medio que separa las mitades mayor y menor de un conjunto de datos | 1, 2, 2, 3 , 4, 7, 9 | 3 |
Modo | Valor más frecuente en un conjunto de datos | 1, 2 , 2 , 3, 4, 7, 9 | 2 |
Gama media | La media aritmética de los valores más altos y más bajos de un conjunto. | (1+9) / 2 | 5 |
El número que aparece con más frecuencia en una lista se denomina moda. Por ejemplo, la moda de la lista (1, 2, 2, 3, 3, 3, 4) es 3. Puede ocurrir que haya dos o más números que aparezcan con la misma frecuencia y con más frecuencia que cualquier otro número. En este caso, no hay una definición consensuada de moda. Algunos autores dicen que todos son modas y otros que no hay moda.
La mediana es el número del medio del grupo cuando se ordenan los números. (Si hay un número par de números, se toma la media de los dos del medio).
Para hallar la mediana, ordena la lista según la magnitud de sus elementos y luego elimina repetidamente el par formado por los valores más alto y más bajo hasta que queden uno o dos valores. Si queda exactamente un valor, es la mediana; si quedan dos valores, la mediana es la media aritmética de estos dos. Este método toma la lista 1, 7, 3, 13 y la ordena para que se lea 1, 3, 7, 13. Luego se eliminan el 1 y el 13 para obtener la lista 3, 7. Como hay dos elementos en esta lista restante, la mediana es su media aritmética, (3 + 7)/2 = 5.
El rango medio es la media aritmética de los valores más altos y más bajos de un conjunto.
Nombre | Ecuación o descripción | Como solución al problema de optimización |
---|---|---|
Media aritmética | ||
Mediana | Un valor medio que separa la mitad superior de la mitad inferior del conjunto de datos; puede no ser único si el conjunto de datos contiene un número par de puntos | |
Mediana geométrica | Una extensión invariante de rotación de la mediana para puntos en | |
Mediana de Tukey | Otra extensión invariante de rotación de la mediana para puntos en —un punto que maximiza la profundidad de Tukey | |
Modo | El valor más frecuente en el conjunto de datos | |
Media geométrica | ||
Media armónica | ||
Media contraarmónica | ||
Significado de Lehmer | ||
Media cuadrática (o RMS) | ||
Media cúbica | ||
Media generalizada | ||
Media cuasi-aritmética | es monótono | |
Media ponderada | ||
Media truncada | La media aritmética de los valores de los datos después de descartar una cierta cantidad o proporción de los valores de los datos más altos y más bajos. | |
Media intercuartil | Un caso especial de la media truncada, que utiliza el rango intercuartil . Un caso especial de la media truncada intercuartil, que opera sobre cuantiles (a menudo deciles o percentiles ) que son equidistantes pero en lados opuestos de la mediana. | |
Rango medio | ||
Media winsorizada | Similar a la media truncada, pero, en lugar de eliminar los valores extremos, se establecen como iguales a los valores más grandes y más pequeños que quedan. | |
medoide | Un objeto representativo de un conjunto de objetos con una suma mínima de diferencias con todos los objetos del conjunto, de acuerdo con alguna función de diferencia . |
La tabla de símbolos matemáticos explica los símbolos utilizados a continuación.
Otros promedios más sofisticados son: trimeana , trimediana y media normalizada, con sus generalizaciones. [1]
Se puede crear una métrica promedio propia utilizando la f -media generalizada :
donde f es cualquier función invertible. La media armónica es un ejemplo de esto, utilizando f ( x ) = 1/ x , y la media geométrica es otro, utilizando f ( x ) = log x .
Sin embargo, este método para generar medias no es lo suficientemente general como para capturar todos los promedios. Un método más general [2] [ verificación fallida ] para definir un promedio toma cualquier función g ( x 1 , x 2 , ..., x n ) de una lista de argumentos que es continua , estrictamente creciente en cada argumento y simétrica (invariante bajo la permutación de los argumentos). El promedio y es entonces el valor que, al reemplazar cada miembro de la lista, da como resultado el mismo valor de la función: g ( y , y , ..., y ) = g ( x 1 , x 2 , ..., x n ) . Esta definición más general aún captura la propiedad importante de todos los promedios de que el promedio de una lista de elementos idénticos es ese elemento en sí. La función g ( x 1 , x 2 , ..., x n ) = x 1 + x 2 + ··· + x n proporciona la media aritmética. La función g ( x 1 , x 2 , ..., x n ) = x 1 x 2 ··· x n (donde los elementos de la lista son números positivos) proporciona la media geométrica. La función g ( x 1 , x 2 , ..., x n ) = ( x 1 −1 + x 2 −1 + ··· + x n −1 ) −1 ) (donde los elementos de la lista son números positivos) proporciona la media armónica. [2]
Un tipo de promedio utilizado en finanzas es el rendimiento porcentual promedio. Es un ejemplo de media geométrica. Cuando los rendimientos son anuales, se denomina tasa de crecimiento anual compuesta (CAGR). Por ejemplo, si consideramos un período de dos años y el rendimiento de la inversión en el primer año es de −10% y el rendimiento en el segundo año es de +60%, entonces el rendimiento porcentual promedio o CAGR, R , se puede obtener resolviendo la ecuación: (1 − 10%) × (1 + 60%) = (1 − 0,1) × (1 + 0,6) = (1 + R ) × (1 + R ) . El valor de R que hace que esta ecuación sea verdadera es 0,2, o 20%. Esto significa que el rendimiento total durante el período de 2 años es el mismo que si hubiera habido un crecimiento del 20% cada año. El orden de los años no hace ninguna diferencia: los rendimientos porcentuales promedio de +60% y −10% son el mismo resultado que los de −10% y +60%.
Este método se puede generalizar a ejemplos en los que los períodos no son iguales. Por ejemplo, considere un período de medio año para el cual el rendimiento es −23% y un período de dos años y medio para el cual el rendimiento es +13%. El rendimiento porcentual promedio para el período combinado es el rendimiento de un solo año, R , que es la solución de la siguiente ecuación: (1 − 0,23) 0,5 × (1 + 0,13) 2,5 = (1 + R ) 0,5+2,5 , dando un rendimiento promedio R de 0,0600 o 6,00%.
Dada una serie temporal , como los precios diarios del mercado de valores o las temperaturas anuales, la gente suele querer crear una serie más suave. [3] Esto ayuda a mostrar tendencias subyacentes o quizás comportamiento periódico. Una forma sencilla de hacerlo es la media móvil : se elige un número n y se crea una nueva serie tomando la media aritmética de los primeros n valores, luego se avanza un lugar eliminando el valor más antiguo e introduciendo un nuevo valor en el otro extremo de la lista, y así sucesivamente. Esta es la forma más simple de media móvil. Las formas más complicadas implican el uso de una media ponderada . La ponderación se puede utilizar para mejorar o suprimir varios comportamientos periódicos y hay un análisis muy extenso de qué ponderaciones utilizar en la literatura sobre filtrado . En el procesamiento de señales digitales, el término "media móvil" se utiliza incluso cuando la suma de los pesos no es 1,0 (por lo que la serie de salida es una versión escalada de los promedios). [4] La razón de esto es que el analista suele estar interesado solo en la tendencia o el comportamiento periódico.
La primera vez registrada en que la media aritmética se extendió de 2 a n casos para el uso de la estimación fue en el siglo XVI. Desde finales del siglo XVI en adelante, gradualmente se convirtió en un método común para usar para reducir errores de medición en varias áreas. [5] [6] En ese momento, los astrónomos querían saber un valor real a partir de una medición ruidosa, como la posición de un planeta o el diámetro de la luna. Usando la media de varios valores medidos, los científicos asumieron que los errores suman un número relativamente pequeño cuando se comparan con el total de todos los valores medidos. El método de tomar la media para reducir los errores de observación fue de hecho desarrollado principalmente en astronomía. [5] [7] Un posible precursor de la media aritmética es el rango medio (la media de los dos valores extremos), utilizado por ejemplo en la astronomía árabe de los siglos IX al XI, pero también en la metalurgia y la navegación. [6]
Sin embargo, existen varias referencias más antiguas y vagas al uso de la media aritmética (que no son tan claras, pero que podrían tener que ver razonablemente con nuestra definición moderna de la media). En un texto del siglo IV se escribió que (el texto entre corchetes es un posible texto faltante que podría aclarar el significado): [8]
Existen referencias incluso más antiguas. Hay registros de que, desde aproximadamente el año 700 a. C., los comerciantes y los transportistas acordaron que los daños a la carga y al barco (su "contribución" en caso de daños causados por el mar) debían ser compartidos equitativamente entre ellos. [7] Esto podría haberse calculado utilizando el promedio, aunque no parece haber un registro directo del cálculo.
La raíz se encuentra en árabe como عوار ʿawār , un defecto, o cualquier cosa defectuosa o dañada, incluyendo mercancía parcialmente estropeada; y عواري ʿawārī (también عوارة ʿawāra ) = "de o relacionado con ʿawār , un estado de daño parcial". [a] Dentro de las lenguas occidentales, la historia de la palabra comienza en el comercio marítimo medieval en el Mediterráneo. Génova de los siglos XII y XIII El latín avaria significaba "daño, pérdida y gastos anormales que surgen en relación con un viaje marítimo mercante"; y el mismo significado de avaria está en Marsella en 1210, Barcelona en 1258 y Florencia a fines del siglo XIII. [b] La palabra francesa avarie del siglo XV tenía el mismo significado, y engendró la palabra inglesa "averay" (1491) y la palabra inglesa "average" (1502) con el mismo significado. Hoy en día, la palabra italiana avaria , la palabra catalana avaria y la palabra francesa avarie todavía tienen el significado principal de "daño". La enorme transformación del significado en inglés comenzó con la práctica en los contratos de derecho marítimo mercante occidental de finales de la Edad Media y principios de la Edad Moderna según la cual si el barco se encontraba con una fuerte tormenta y algunas de las mercancías debían arrojarse por la borda para que el barco fuera más liviano y seguro, entonces todos los comerciantes cuyas mercancías estuvieran en el barco debían sufrir proporcionalmente (y no las mercancías de quienes fueran arrojadas por la borda); y más generalmente debía haber una distribución proporcional de cualquier avaria . A partir de allí, la palabra fue adoptada por los aseguradores, acreedores y comerciantes británicos para hablar de sus pérdidas como si se distribuyeran en toda su cartera de activos y tuvieran una proporción media. El significado actual se desarrolló a partir de eso, y comenzó a mediados del siglo XVIII, y comenzó en inglés. [b] [9]
Los daños marítimos se clasifican en avería particular , que recae únicamente sobre el propietario de la propiedad dañada, o en avería gruesa , en la que el propietario puede reclamar una contribución proporcional de todas las partes en la operación marítima. El tipo de cálculos utilizados para ajustar la avería gruesa dio lugar al uso de "promedio" para significar "media aritmética".
Un segundo uso en inglés, documentado ya en 1674 y a veces escrito "averish", es como residuo y segundo crecimiento de cultivos de campo, que se consideraban adecuados para el consumo de animales de tiro ("avers"). [10]
Hay un uso anterior (al menos del siglo XI) de la palabra, que no guarda relación con el caso. Parece ser un antiguo término legal que designaba la obligación de un arrendatario de trabajar por día ante un alguacil, probablemente anglicanizado a partir de "avera", que se encuentra en el Domesday Book inglés (1085).
Sin embargo, el Oxford English Dictionary dice que las derivaciones del alemán hafen haven y del árabe ʿawâr loss, daño, han sido "completamente descartadas" y la palabra tiene un origen romance. [11]
Debido a la naturaleza coloquial antes mencionada del término "promedio", el término puede usarse para ofuscar el verdadero significado de los datos y sugerir respuestas variables a preguntas basadas en el método de promediado (más frecuentemente la media aritmética, la mediana o la moda) utilizado. En su artículo "Framed for Lying: Statistics as In/Artistic Proof", Daniel Libertz, miembro de la facultad de la Universidad de Pittsburgh, comenta que la información estadística es frecuentemente descartada de los argumentos retóricos por esta razón. [12] Sin embargo, debido a su poder persuasivo, los promedios y otros valores estadísticos no deben descartarse por completo, sino que deben usarse e interpretarse con cautela. Libertz nos invita a involucrarnos críticamente no solo con la información estadística como los promedios, sino también con el lenguaje utilizado para describir los datos y sus usos, diciendo: "Si las estadísticas se basan en la interpretación, los retóricos deben invitar a su audiencia a interpretar en lugar de insistir en una interpretación". [12] En muchos casos, se proporcionan datos y cálculos específicos para ayudar a facilitar esta interpretación basada en la audiencia.