La media aritmética ponderada es similar a una media aritmética ordinaria (el tipo más común de promedio ), excepto que en lugar de que cada uno de los puntos de datos contribuya por igual al promedio final, algunos puntos de datos contribuyen más que otros. El concepto de media ponderada desempeña un papel en las estadísticas descriptivas y también se presenta de forma más general en varias otras áreas de las matemáticas.
Si todos los pesos son iguales, entonces la media ponderada es la misma que la media aritmética . Si bien las medias ponderadas generalmente se comportan de manera similar a las medias aritméticas, tienen algunas propiedades contraintuitivas, como se refleja, por ejemplo, en la paradoja de Simpson .
Ejemplos
Ejemplo básico
Dadas dos clases escolares —una con 20 estudiantes, otra con 30 estudiantes— y las calificaciones de los exámenes en cada clase son las siguientes:
La media de la clase de la mañana es 80 y la media de la clase de la tarde es 90. La media no ponderada de las dos medias es 85. Sin embargo, esto no tiene en cuenta la diferencia en el número de estudiantes en cada clase (20 frente a 30); por lo tanto, el valor de 85 no refleja la nota media de los estudiantes (independientemente de la clase). La nota media de los estudiantes se puede obtener haciendo el promedio de todas las notas, sin tener en cuenta las clases (suma todas las notas y divide por el número total de estudiantes):
O bien, esto se puede lograr ponderando las medias de las clases por el número de estudiantes en cada clase. A la clase más grande se le da más "peso":
De esta forma, la media ponderada permite hallar la nota media de los alumnos sin conocer la puntuación de cada uno de ellos. Solo se necesitan las medias de las clases y el número de alumnos de cada clase.
Ejemplo de combinación convexa
Dado que solo son relevantes los pesos relativos , cualquier media ponderada se puede expresar mediante coeficientes que sumen uno. Una combinación lineal de este tipo se denomina combinación convexa .
Utilizando el ejemplo anterior, obtendríamos los siguientes pesos:
Por lo tanto, los elementos de datos con un peso alto contribuyen más a la media ponderada que los elementos con un peso bajo. Los pesos no pueden ser negativos para que la ecuación funcione [a] . Algunos pueden ser cero, pero no todos (ya que no se permite la división por cero).
Las fórmulas se simplifican cuando los pesos se normalizan de modo que sumen 1, es decir, . Para dichos pesos normalizados, la media ponderada es equivalente a:
.
Siempre se pueden normalizar los pesos realizando la siguiente transformación sobre los pesos originales:
.
La media ordinaria es un caso especial de la media ponderada donde todos los datos tienen pesos iguales.
Para la media ponderada de una lista de datos en la que cada elemento proviene potencialmente de una distribución de probabilidad diferente con varianza conocida , y todos tienen la misma media, una posible elección para los pesos está dada por el recíproco de la varianza:
La media ponderada en este caso es:
y el error estándar de la media ponderada (con ponderaciones de varianza inversa) es:
Tenga en cuenta que esto se reduce a cuando todos . Es un caso especial de la fórmula general de la sección anterior,
Las ecuaciones anteriores se pueden combinar para obtener:
La importancia de esta elección es que esta media ponderada es el estimador de máxima verosimilitud de la media de las distribuciones de probabilidad bajo el supuesto de que son independientes y se distribuyen normalmente con la misma media.
Propiedades estadísticas
Expectativa
La media ponderada de la muestra, , es en sí misma una variable aleatoria. Su valor esperado y desviación estándar están relacionados con los valores esperados y las desviaciones estándar de las observaciones, como se indica a continuación. Para simplificar, suponemos ponderaciones normalizadas (ponderaciones que suman uno).
Si las observaciones tienen valores esperados ,
entonces la media ponderada de la muestra tiene expectativa.
En particular, si las medias son iguales, entonces la expectativa de la media ponderada de la muestra será ese valor,
Sin embargo, esta estimación es bastante limitada debido a la fuerte suposición sobre las observaciones y . Esto ha llevado al desarrollo de estimadores alternativos más generales.
Perspectiva de muestreo por encuesta
Desde una perspectiva basada en modelos , nos interesa estimar la varianza de la media ponderada cuando las variables no son aleatorias iid . Una perspectiva alternativa para este problema es la de un diseño de muestreo arbitrario de los datos en el que se seleccionan unidades con probabilidades desiguales (con reemplazo). [1] : 306
En la metodología de encuestas , la media poblacional, de alguna cantidad de interés y , se calcula tomando una estimación del total de y sobre todos los elementos de la población ( Y o, a veces, T ) y dividiéndola por el tamaño de la población, ya sea conocido ( ) o estimado ( ). En este contexto, cada valor de y se considera constante y la variabilidad proviene del procedimiento de selección. Esto en contraste con los enfoques "basados en modelos" en los que la aleatoriedad a menudo se describe en los valores de y. El procedimiento de muestreo de encuestas produce una serie de valores indicadores de Bernoulli ( ) que obtienen 1 si alguna observación i está en la muestra y 0 si no fue seleccionada. Esto puede ocurrir con un tamaño de muestra fijo o un muestreo de tamaño de muestra variado (por ejemplo, muestreo de Poisson ). La probabilidad de que se elija algún elemento, dada una muestra, se denota como , y la probabilidad de selección de un solo sorteo es (si N es muy grande y cada uno es muy pequeño). Para la siguiente derivación, asumiremos que la probabilidad de seleccionar cada elemento está completamente representada por estas probabilidades. [2] : 42, 43, 51 Es decir: seleccionar un elemento no influirá en la probabilidad de extraer otro elemento (esto no se aplica a cosas como el diseño de muestreo por conglomerados ).
Como cada elemento ( ) es fijo y la aleatoriedad proviene de que esté incluido en la muestra o no ( ), a menudo hablamos de la multiplicación de los dos, que es una variable aleatoria. Para evitar confusiones en la siguiente sección, llamaremos a este término: . Con la siguiente expectativa: ; y varianza: .
Cuando cada elemento de la muestra se infla por el inverso de su probabilidad de selección, se denomina valores y -expandidos , es decir: . Una cantidad relacionada son los valores y -expandidos : . [2] : 42, 43, 51, 52 Como arriba, podemos agregar una marca de verificación si se multiplica por la función indicadora. Es decir:
En esta perspectiva basada en el diseño , los pesos, utilizados en el numerador de la media ponderada, se obtienen al tomar la inversa de la probabilidad de selección (es decir: el factor de inflación). Es decir: .
Varianza de la suma ponderada (energía-estimador de totales)
Si se conoce el tamaño de la población N, podemos estimar la media de la población utilizando .
Si el diseño de muestreo es uno que da como resultado un tamaño de muestra fijo n (como en el muestreo pps ), entonces la varianza de este estimador es:
Prueba
La fórmula general se puede desarrollar así:
El total de la población se denota como y puede estimarse mediante el estimador (imparcial) de Horvitz–Thompson , también llamado estimador . Este estimador puede estimarse a su vez utilizando el estimador pwr (es decir: estimador expandido con reemplazo o estimador de "probabilidad con reemplazo"). Con la notación anterior, es: . [2] : 51
La varianza estimada del estimador pwr viene dada por: [2] : 52
donde .
La fórmula anterior se tomó de Sarndal et al. (1992) (también presentada en Cochran 1977), pero se escribió de manera diferente. [2] : 52 [1] : 307 (11.35) El lado izquierdo es cómo se escribió la varianza y el lado derecho es cómo hemos desarrollado la versión ponderada:
Y llegamos a la fórmula de arriba.
Un término alternativo, para cuando el muestreo tiene un tamaño de muestra aleatorio (como en el muestreo de Poisson ), se presenta en Sarndal et al. (1992) como: [2] : 182
Con . Además, donde es la probabilidad de seleccionar tanto i como j. [2] : 36 Y , y para i=j: . [2] : 43
Si las probabilidades de selección no están correlacionadas (es decir: ), y se supone que la probabilidad de cada elemento es muy pequeña, entonces:
Prueba
Suponemos que y que
Varianza de la media ponderada (π-estimador de razón-media)
La sección anterior trató sobre la estimación de la media de la población como una razón de un total de población estimado ( ) con un tamaño de población conocido ( ), y la varianza se estimó en ese contexto. Otro caso común es que el tamaño de la población en sí ( ) es desconocido y se estima utilizando la muestra (es decir: ). La estimación de se puede describir como la suma de pesos. Entonces, cuando obtenemos . Con la notación anterior, el parámetro que nos interesa es la razón de las sumas de s y 1s. Es decir: . Podemos estimarlo utilizando nuestra muestra con: . A medida que pasamos de usar N a usar n, en realidad sabemos que todas las variables indicadoras obtienen 1, por lo que simplemente podríamos escribir: . Este será el estimando para valores específicos de y y w, pero las propiedades estadísticas aparecen al incluir la variable indicadora . [2] : 162, 163, 176
Esto se llama estimador de razón y es aproximadamente imparcial para R. [2] : 182
En este caso, la variabilidad de la razón depende de la variabilidad de las variables aleatorias tanto en el numerador como en el denominador, así como de su correlación. Dado que no existe una forma analítica cerrada para calcular esta varianza, se utilizan varios métodos para la estimación aproximada. Principalmente, la linealización de primer orden de la serie de Taylor , la asintótica y el bootstrap/jackknife. [2] : 172 El método de linealización de Taylor podría llevar a una subestimación de la varianza para tamaños de muestra pequeños en general, pero eso depende de la complejidad de la estadística. Para la media ponderada, se supone que la varianza aproximada es relativamente precisa incluso para tamaños de muestra medianos. [2] : 176 Para cuando el muestreo tiene un tamaño de muestra aleatorio (como en el muestreo de Poisson ), es como sigue: [2] : 182
.
Si , entonces, ya sea utilizando o obtendríamos el mismo estimador, ya que multiplicar por algún factor daría como resultado el mismo estimador. Esto también significa que si escalamos la suma de pesos para que sea igual a un tamaño de población conocido de antemano N , el cálculo de la varianza sería el mismo. Cuando todos los pesos son iguales entre sí, esta fórmula se reduce al estimador de varianza insesgado estándar.
Prueba
La linealización de Taylor establece que, para un estimador de razón general de dos sumas ( ), se pueden expandir alrededor del valor verdadero R y dar: [2] : 178
Y la varianza se puede aproximar por: [2] : 178, 179
.
El término es la covarianza estimada entre la suma estimada de Y y la suma estimada de Z. Dado que se trata de la covarianza de dos sumas de variables aleatorias , incluiría muchas combinaciones de covarianzas que dependerán de las variables indicadoras. Si la probabilidad de selección no está correlacionada (es decir: ), este término incluiría una suma de n covarianzas para cada elemento i entre y . Esto ayuda a ilustrar que esta fórmula incorpora el efecto de la correlación entre y y z en la varianza de los estimadores de razón.
Al definir lo anterior se convierte en: [2] : 182
Si las probabilidades de selección no están correlacionadas (es decir: ), y cuando se supone que la probabilidad de cada elemento es muy pequeña (es decir: ), entonces lo anterior se reduce a lo siguiente:
Thomas Lumley proporcionó una recreación similar de la prueba (con algunos errores al final) en crossvalidated. [3]
Tenemos (al menos) dos versiones de varianza para la media ponderada: una con estimación de tamaño de población conocido y otra con estimación de tamaño de población desconocido. No hay un enfoque uniformemente mejor, pero la literatura presenta varios argumentos para preferir usar la versión de estimación de población (incluso cuando se conoce el tamaño de la población). [2] : 188 Por ejemplo: si todos los valores de y son constantes, el estimador con tamaño de población desconocido dará el resultado correcto, mientras que el que tiene tamaño de población conocido tendrá cierta variabilidad. Además, cuando el tamaño de la muestra en sí es aleatorio (por ejemplo: en el muestreo de Poisson ), la versión con media de población desconocida se considera más estable. Por último, si la proporción de muestreo está correlacionada negativamente con los valores (es decir: menor probabilidad de muestrear una observación que es grande), entonces la versión de tamaño de población desconocido compensa ligeramente eso.
Para el caso trivial en el que todos los pesos son iguales a 1, la fórmula anterior es como la fórmula regular para la varianza de la media (pero observe que utiliza el estimador de máxima verosimilitud para la varianza en lugar de la varianza insesgada, es decir: dividiéndola por n en lugar de (n-1)).
Gatz et al. mencionan que la formulación anterior fue publicada por Endlich et al. (1988) al tratar la media ponderada como una combinación de un estimador total ponderado dividido por un estimador del tamaño de la población, [5] basándose en la formulación publicada por Cochran (1977), como una aproximación a la media de la razón. Sin embargo, Endlich et al. no parece publicar esta derivación en su artículo (aunque mencionan que la usaron), y el libro de Cochran incluye una formulación ligeramente diferente. [1] : 155 Aun así, es casi idéntica a las formulaciones descritas en las secciones anteriores.
Estimadores basados en replicación
Debido a que no existe una forma analítica cerrada para la varianza de la media ponderada, se propuso en la literatura confiar en métodos de replicación como Jackknife y Bootstrapping . [1] : 321
Otras notas
Para las observaciones no correlacionadas con varianzas , la varianza de la media ponderada de la muestra es [ cita requerida ]
cuya raíz cuadrada puede llamarse el error estándar de la media ponderada (caso general) . [ cita requerida ]
En consecuencia, si todas las observaciones tienen varianza igual, , la media ponderada de la muestra tendrá varianza
donde . La varianza alcanza su valor máximo, , cuando todos los pesos excepto uno son cero. Su valor mínimo se encuentra cuando todos los pesos son iguales (es decir, media no ponderada), en cuyo caso tenemos , es decir, degenera en el error estándar de la media , al cuadrado.
Dado que siempre se pueden transformar pesos no normalizados en pesos normalizados, todas las fórmulas de esta sección se pueden adaptar a pesos no normalizados reemplazando todos los .
Conceptos relacionados
Varianza de muestra ponderada
Por lo general, cuando se calcula una media, es importante conocer la varianza y la desviación estándar de esa media. Cuando se utiliza una media ponderada, la varianza de la muestra ponderada es diferente de la varianza de la muestra no ponderada.
La varianza de muestra ponderada sesgada se define de manera similar a la varianza de muestra sesgada normal :
donde para pesos normalizados. Si los pesos son pesos de frecuencia (y por lo tanto son variables aleatorias), se puede demostrar [ cita requerida ] que es el estimador de máxima verosimilitud de para observaciones gaussianas iid .
En el caso de muestras pequeñas, se acostumbra a utilizar un estimador insesgado para la varianza de la población. En muestras normales no ponderadas, la N en el denominador (que corresponde al tamaño de la muestra) se cambia a N − 1 (véase la corrección de Bessel ). En el caso de muestras ponderadas, en realidad hay dos estimadores insesgados diferentes, uno para el caso de ponderaciones de frecuencia y otro para el caso de ponderaciones de confiabilidad .
Pesos de frecuencia
Si los pesos son pesos de frecuencia (donde un peso es igual al número de ocurrencias), entonces el estimador imparcial es:
Esto aplica efectivamente la corrección de Bessel para pesos de frecuencia.
Por ejemplo, si los valores se extraen de la misma distribución, entonces podemos tratar este conjunto como una muestra no ponderada, o podemos tratarlo como una muestra ponderada con pesos correspondientes , y obtenemos el mismo resultado de cualquier manera.
Si los pesos de frecuencia se normalizan a 1, entonces la expresión correcta después de la corrección de Bessel se convierte en
donde el número total de muestras es (no ). En cualquier caso, la información sobre el número total de muestras es necesaria para obtener una corrección no sesgada, incluso si tiene un significado diferente al de ponderación de frecuencia.
El estimador puede ser imparcial solo si los pesos no están estandarizados ni normalizados ; estos procesos cambian la media y la varianza de los datos y conducen así a una pérdida de la tasa base (el recuento de la población, que es un requisito para la corrección de Bessel).
Pesos de confiabilidad
Si, en cambio, los pesos no son aleatorios ( pesos de confiabilidad [ se necesita una definición ] ), podemos determinar un factor de corrección para obtener un estimador imparcial. Suponiendo que cada variable aleatoria se muestrea de la misma distribución con media y varianza real , tomando las expectativas que tenemos,
donde y . Por lo tanto, el sesgo en nuestro estimador es , análogo al sesgo en el estimador no ponderado (observe también que es el tamaño de muestra efectivo ). Esto significa que para eliminar el sesgo de nuestro estimador, necesitamos dividir previamente por , lo que garantiza que el valor esperado de la varianza estimada sea igual a la varianza real de la distribución de muestreo.
La estimación final imparcial de la varianza de la muestra es:
[6]
dónde .
Los grados de libertad de la varianza muestral ponderada e imparcial varían en consecuencia desde N − 1 hasta 0.
La desviación estándar es simplemente la raíz cuadrada de la varianza anterior.
Como nota al margen, se han descrito otros enfoques para calcular la varianza de la muestra ponderada. [7]
Covarianza de muestra ponderada
En una muestra ponderada, a cada vector de fila (cada conjunto de observaciones individuales en cada una de las K variables aleatorias) se le asigna un peso .
Y la matriz de covarianza ponderada viene dada por: [8]
De manera similar a la varianza de muestra ponderada, existen dos estimadores imparciales diferentes según el tipo de ponderaciones.
Pesos de frecuencia
Si los pesos son pesos de frecuencia , la estimación ponderada no sesgada de la matriz de covarianza , con la corrección de Bessel, viene dada por: [8]
Este estimador puede ser imparcial solo si los pesos no están estandarizados ni normalizados ; estos procesos cambian la media y la varianza de los datos y conducen así a una pérdida de la tasa base (el recuento de la población, que es un requisito para la corrección de Bessel).
Pesos de confiabilidad
En el caso de los pesos de confiabilidad , los pesos se normalizan :
(Si no es así, divida los pesos por su suma para normalizar antes de calcular :
y la estimación ponderada no sesgada de la matriz de covarianza es: [9]
El razonamiento aquí es el mismo que en la sección anterior.
Dado que suponemos que los pesos están normalizados, entonces esto se reduce a:
Si todos los pesos son iguales, es decir , entonces la media ponderada y la covarianza se reducen a la media y la covarianza de la muestra no ponderada anteriores.
Estimaciones con valores vectoriales
Lo anterior se puede generalizar fácilmente al caso de tomar la media de estimaciones con valores vectoriales. Por ejemplo, las estimaciones de posición en un plano pueden tener menos certeza en una dirección que en otra. Como en el caso escalar, la media ponderada de múltiples estimaciones puede proporcionar una estimación de máxima verosimilitud . Simplemente reemplazamos la varianza por la matriz de covarianza y la inversa aritmética por la inversa de la matriz (ambas denotadas de la misma manera, mediante superíndices); la matriz de ponderación entonces se lee: [10]
La media ponderada en este caso es:
(donde el orden del producto matriz-vector no es conmutativo ), en términos de la covarianza de la media ponderada:
Por ejemplo, considere la media ponderada del punto [1 0] con alta varianza en el segundo componente y [0 1] con alta varianza en el primer componente.
entonces la media ponderada es:
lo cual tiene sentido: la estimación [1 0] es "compatible" en el segundo componente y la estimación [0 1] es compatible en el primer componente, por lo que la media ponderada es casi [1 1].
Contabilización de las correlaciones
En el caso general, supongamos que , es la matriz de covarianza que relaciona las cantidades , es la media común que se va a estimar y es una matriz de diseño igual a un vector de unos (de longitud ). El teorema de Gauss-Markov establece que la estimación de la media que tiene una varianza mínima viene dada por:
y
dónde:
Disminución de la fuerza de las interacciones
Considere la serie temporal de una variable independiente y una variable dependiente , con observaciones muestreadas en momentos discretos . En muchas situaciones comunes, el valor de en el momento depende no solo de , sino también de sus valores pasados. Comúnmente, la fuerza de esta dependencia disminuye a medida que aumenta la separación de las observaciones en el tiempo. Para modelar esta situación, se puede reemplazar la variable independiente por su media móvil para un tamaño de ventana .
Pesos decrecientes exponencialmente
En el escenario descrito en la sección anterior, la disminución más frecuente de la fuerza de interacción obedece a una ley exponencial negativa. Si las observaciones se muestrean en momentos equidistantes, entonces la disminución exponencial es equivalente a una disminución en una fracción constante en cada paso de tiempo. Podemos definir pesos normalizados mediante
donde es la suma de los pesos no normalizados. En este caso es simplemente
aproximándose para valores grandes de .
La constante de amortiguamiento debe corresponder a la disminución real de la fuerza de interacción. Si esto no se puede determinar a partir de consideraciones teóricas, entonces las siguientes propiedades de pesos que disminuyen exponencialmente son útiles para hacer una elección adecuada: en el paso , el peso es aproximadamente igual a , el área de la cola el valor , el área de la cabeza . El área de la cola en el paso es . Cuando las observaciones más cercanas importan principalmente y el efecto de las observaciones restantes se puede ignorar de manera segura, entonces elija de manera que el área de la cola sea suficientemente pequeña.
Promedios ponderados de funciones
El concepto de promedio ponderado se puede extender a las funciones. [11] Los promedios ponderados de funciones juegan un papel importante en los sistemas de cálculo diferencial e integral ponderado. [12]
Corrección de la sobre o subdispersión
Las medias ponderadas se utilizan normalmente para encontrar la media ponderada de datos históricos, en lugar de datos generados teóricamente. En este caso, habrá algún error en la varianza de cada punto de datos. Normalmente, los errores experimentales pueden subestimarse debido a que el experimentador no tiene en cuenta todas las fuentes de error al calcular la varianza de cada punto de datos. En este caso, la varianza en la media ponderada debe corregirse para tener en cuenta el hecho de que es demasiado grande. La corrección que debe realizarse es
La raíz cuadrada puede denominarse error estándar de la media ponderada (pesos de varianza, corregidos por escala) .
Cuando todas las varianzas de los datos son iguales, , se cancelan en la varianza media ponderada, , que a su vez se reduce al error estándar de la media (al cuadrado), , formulado en términos de la desviación estándar de la muestra (al cuadrado),
^ Técnicamente, se pueden utilizar números negativos si todos los valores son cero o negativos. Sin embargo, esto no cumple ninguna función, ya que los pesos funcionan como valores absolutos .
Referencias
^ abcd Cochran, WG (1977). Técnicas de muestreo (3.ª ed.). Nashville, TN: John Wiley & Sons. ISBN 978-0-471-16240-7
^ abcdefghijklmnopq Carl-Erik Sarndal; Bengt Swensson; Jan Wretman (1992). Muestreo de encuestas asistido por modelos . ISBN978-0-387-97528-3.
^ Thomas Lumley (https://stats.stackexchange.com/users/249135/thomas-lumley), ¿Cómo estimar la varianza (aproximada) de la media ponderada?, URL (versión: 2021-06-08): https://stats.stackexchange.com/q/525770
^ Gatz, Donald F.; Smith, Luther (junio de 1995). "El error estándar de una concentración media ponderada: I. Bootstrapping frente a otros métodos". Atmospheric Environment . 29 (11): 1185–1193. Bibcode :1995AtmEn..29.1185G. doi :10.1016/1352-2310(94)00210-C.- enlace pdf
^ Endlich, RM; Eymon, BP; Ferek, RJ; Valdes, AD; Maxwell, C. (1988-12-01). "Análisis estadístico de las mediciones de la química de la precipitación en el este de los Estados Unidos. Parte I: Patrones y correlaciones estacionales y regionales". Journal of Applied Meteorology and Climatology . 27 (12): 1322–1333. Bibcode :1988JApMe..27.1322E. doi : 10.1175/1520-0450(1988)027<1322:SAOPCM>2.0.CO;2 .
^ "Biblioteca científica GNU – Manual de referencia: muestras ponderadas". Gnu.org . Consultado el 22 de diciembre de 2017 .
^ "Error estándar ponderado y su impacto en las pruebas de significancia (WinCross vs. Quantum y SPSS), Dr. Albert Madansky" (PDF) . Analyticalgroup.com . Consultado el 22 de diciembre de 2017 .
^ ab Price, George R. (abril de 1972). "Extensión de las matemáticas de selección de covarianza" (PDF) . Anales de genética humana . 35 (4): 485–490. doi :10.1111/j.1469-1809.1957.tb01874.x. PMID 5073694. S2CID 37828617.
^ Mark Galassi, Jim Davies, James Theiler, Brian Gough, Gerard Jungman, Michael Booth y Fabrice Rossi. Manual de referencia de la biblioteca científica GNU, versión 1.15, 2011. Sección 21.7 Muestras ponderadas
^ James, Frederick (2006). Métodos estadísticos en física experimental (2.ª ed.). Singapur: World Scientific. pág. 324. ISBN981-270-527-9.
^ GH Hardy, JE Littlewood y G. Pólya. Desigualdades (2.ª ed.), Cambridge University Press, ISBN 978-0-521-35880-4 , 1988.
^ Jane Grossman, Michael Grossman, Robert Katz. Los primeros sistemas de cálculo diferencial e integral ponderado, ISBN 0-9771170-1-4 , 1980.
Lectura adicional
Bevington, Philip R (1969). Reducción de datos y análisis de errores para las ciencias físicas . Nueva York, NY: McGraw-Hill. OCLC 300283069.
Strutz, T. (2010). Ajuste de datos e incertidumbre (Una introducción práctica a los mínimos cuadrados ponderados y más allá) . Vieweg+Teubner. ISBN978-3-8348-1022-9.