Una estadística (singular) o estadística de muestra es cualquier cantidad calculada a partir de valores de una muestra que se considera para un propósito estadístico. Los propósitos estadísticos incluyen la estimación de un parámetro de población , la descripción de una muestra o la evaluación de una hipótesis. El promedio (o media) de los valores de la muestra es una estadística. El término estadística se utiliza tanto para la función como para el valor de la función en una muestra dada. Cuando una estadística se utiliza para un propósito específico, se puede hacer referencia a ella por un nombre que indique su propósito.
Cuando se utiliza una estadística para estimar un parámetro de población, la estadística se denomina estimador . Un parámetro de población es cualquier característica de una población en estudio, pero cuando no es posible medir directamente el valor de un parámetro de población, se utilizan métodos estadísticos para inferir el valor probable del parámetro sobre la base de una estadística calculada a partir de una muestra tomada de la población. Por ejemplo, la media de la muestra es un estimador insesgado de la media de la población . Esto significa que el valor esperado de la media de la muestra es igual a la media real de la población. [1]
Una estadística descriptiva se utiliza para resumir los datos de la muestra. Una estadística de prueba se utiliza en las pruebas de hipótesis estadísticas . Una sola estadística se puede utilizar para múltiples propósitos; por ejemplo, la media de la muestra se puede utilizar para estimar la media de la población, para describir un conjunto de datos de muestra o para probar una hipótesis.
Algunos ejemplos de estadísticas son:
En este caso, "52%" es una estadística, es decir, el porcentaje de mujeres en la muestra de la encuesta que creen en el calentamiento global. La población es el conjunto de todas las mujeres de los Estados Unidos, y el parámetro de población que se está estimando es el porcentaje de todas las mujeres de los Estados Unidos, no solo las encuestadas, que creen en el calentamiento global.
En este ejemplo, "5,6 días" es una estadística, es decir, la duración media de la estancia de nuestra muestra de 20 huéspedes del hotel. La población es el conjunto de todos los huéspedes de este hotel, y el parámetro de población que se está estimando es la duración media de la estancia de todos los huéspedes. [2] El hecho de que el estimador sea insesgado en este caso depende del proceso de selección de la muestra; véase la paradoja de la inspección .
Existen diversas funciones que se utilizan para calcular estadísticas. Algunas de ellas son:
Los estadísticos suelen contemplar una familia parametrizada de distribuciones de probabilidad , cualquiera de cuyos miembros podría ser la distribución de algún aspecto medible de cada miembro de una población, de la que se extrae una muestra aleatoriamente. Por ejemplo, el parámetro puede ser la altura media de los hombres de 25 años de Norteamérica. Se mide la altura de los miembros de una muestra de 100 de esos hombres; el promedio de esos 100 números es una estadística. El promedio de las alturas de todos los miembros de la población no es una estadística a menos que eso también se haya determinado de alguna manera (por ejemplo, midiendo a cada miembro de la población). La altura media que se calcularía utilizando todas las alturas individuales de todos los hombres norteamericanos de 25 años es un parámetro y no una estadística.
Las propiedades potenciales importantes de las estadísticas incluyen integridad , consistencia , suficiencia , imparcialidad , error cuadrático medio mínimo , baja varianza , robustez y conveniencia computacional.
La información de una estadística sobre los parámetros del modelo se puede definir de varias maneras. La más común es la información de Fisher , que se define sobre el modelo estadístico inducido por la estadística. También se puede utilizar la medida de información de Kullback .