Probabilidad empírica

Relación entre el número de resultados deseados y el total de experimentos

En teoría de probabilidad y estadística , la probabilidad empírica , frecuencia relativa o probabilidad experimental de un evento es la relación entre el número de resultados en los que ocurre un evento específico y el número total de ensayos, ^[1] es decir, no por medio de un espacio muestral teórico sino de un experimento real . De manera más general, la probabilidad empírica estima probabilidades a partir de la experiencia y la observación . ^[2]

Dado un evento $A$ en un espacio muestral, la frecuencia relativa de $A$ es la relación entre m y n , donde ${\frac {m}{n}},$ $m$ es el número de resultados en los que ocurre el evento $A$ y $n$ es el número total de resultados del experimento. ^[3]

En términos estadísticos, la probabilidad empírica es un estimador o estimación de una probabilidad. En casos simples, donde el resultado de un ensayo solo determina si el evento especificado ha ocurrido o no, el modelado utilizando una distribución binomial podría ser apropiado y entonces la estimación empírica es la estimación de máxima verosimilitud . Es la estimación bayesiana para el mismo caso si se hacen ciertas suposiciones para la distribución previa de la probabilidad. Si un ensayo arroja más información, la probabilidad empírica puede mejorarse adoptando suposiciones adicionales en forma de un modelo estadístico : si dicho modelo se ajusta, puede usarse para derivar una estimación de la probabilidad del evento especificado.

Ventajas y desventajas

Ventajas

Una ventaja de estimar probabilidades utilizando probabilidades empíricas es que este procedimiento está relativamente libre de suposiciones.

Por ejemplo, consideremos estimar la probabilidad entre una población de hombres de que satisfagan dos condiciones:

que miden más de 6 pies de altura.
que prefieren la mermelada de fresa a la mermelada de frambuesa.

Se podría hacer una estimación directa contando el número de hombres que satisfacen ambas condiciones para obtener la probabilidad empírica de la condición combinada. Se podría hacer una estimación alternativa multiplicando la proporción de hombres que miden más de 6 pies de altura por la proporción de hombres que prefieren la mermelada de fresa a la de frambuesa, pero esta estimación se basa en el supuesto de que las dos condiciones son estadísticamente independientes .

Desventajas

Una desventaja de utilizar probabilidades empíricas surge cuando se estiman probabilidades que son muy cercanas a cero o muy cercanas a uno. En estos casos, se necesitarían tamaños de muestra muy grandes para estimar dichas probabilidades con un buen nivel de precisión relativa. En este caso, los modelos estadísticos pueden ayudar, dependiendo del contexto, y en general se puede esperar que dichos modelos proporcionen mejoras en la precisión en comparación con las probabilidades empíricas, siempre que los supuestos involucrados realmente se cumplan.

Por ejemplo, considere la posibilidad de estimar la probabilidad de que la temperatura máxima diaria más baja en un sitio en febrero de un año determinado sea inferior a cero grados Celsius. Se podría utilizar un registro de dichas temperaturas en años anteriores para estimar esta probabilidad. Una alternativa basada en modelos sería seleccionar una familia de distribuciones de probabilidad y ajustarla al conjunto de datos que contiene los valores de años anteriores. La distribución ajustada proporcionaría una estimación alternativa de la probabilidad deseada. Este método alternativo puede proporcionar una estimación de la probabilidad incluso si todos los valores en el registro son mayores que cero.

Nomenclatura mixta

La frase probabilidad a posteriori también se utiliza como alternativa a "probabilidad empírica" o "frecuencia relativa". ^[1] El uso de la frase "a posteriori" recuerda a los términos de la estadística bayesiana , pero no está directamente relacionada con la inferencia bayesiana , donde la probabilidad a posteriori se utiliza ocasionalmente para referirse a la probabilidad posterior , que es diferente aunque tiene un nombre confusamente similar.

El término probabilidad a posteriori , en su significado que sugiere "probabilidad empírica", puede usarse junto con probabilidad a priori , que representa una estimación de una probabilidad no basada en ninguna observación, sino en un razonamiento deductivo . ^[4]

Véase también

Referencias

^ ab Mood, AM; Graybill, FA; Boes, DC (1974). "Sección 2.3". Introducción a la teoría de la estadística (3.ª ed.). McGraw-Hill. ISBN 0070428646.
^ "Probabilidades empíricas en tpub.com". Archivado desde el original el 10 de mayo de 2007. Consultado el 31 de marzo de 2007 .
^ Gujarati, Damodar N. (2003). "Apéndice A". Econometría básica (4.ª ed.). McGraw-Hill. ISBN 978-0-07-233542-2.
^ Mood, AM; Graybill, FA; Boes, DC (1974). "Sección 2.2". Introducción a la teoría de la estadística (3.ª ed.). McGraw-Hill. ISBN 0070428646.(disponible en línea Archivado el 15 de mayo de 2012 en Wayback Machine )

[Mood-1] Mood, AM; Graybill, FA; Boes, DC (1974). "Sección 2.3". Introducción a la teoría de la estadística (3.ª ed.). McGraw-Hill. ISBN 0070428646.

[2] "Probabilidades empíricas en tpub.com". Archivado desde el original el 10 de mayo de 2007. Consultado el 31 de marzo de 2007 .

[3] Gujarati, Damodar N. (2003). "Apéndice A". Econometría básica (4.ª ed.). McGraw-Hill. ISBN 978-0-07-233542-2.

[4] Mood, AM; Graybill, FA; Boes, DC (1974). "Sección 2.2". Introducción a la teoría de la estadística (3.ª ed.). McGraw-Hill. ISBN 0070428646.(disponible en línea Archivado el 15 de mayo de 2012 en Wayback Machine )