La probabilidad frecuentista o frecuentismo es una interpretación de la probabilidad que define la probabilidad de un evento como el límite de su frecuencia relativa en un número infinito de ensayos (la probabilidad a largo plazo ). [2]
Las probabilidades se pueden encontrar (en principio) mediante un proceso objetivo repetible (y, por lo tanto, están idealmente libres de opinión). Sin embargo, se ha puesto en tela de juicio el uso continuo de métodos frecuentistas en la inferencia científica. [3] [4] [5]
El desarrollo de la teoría frecuentista estuvo motivado por los problemas y paradojas de la perspectiva dominante hasta entonces, la interpretación clásica . En la interpretación clásica, la probabilidad se definía en términos del principio de indiferencia , basado en la simetría natural de un problema, de modo que, por ejemplo, las probabilidades de los juegos de dados surgen de la simetría natural de 6 lados del cubo. Esta interpretación clásica tropezaba con cualquier problema estadístico que no tuviera simetría natural para el razonamiento.
Definición
En la interpretación frecuentista, las probabilidades se analizan únicamente cuando se trata de experimentos aleatorios bien definidos. El conjunto de todos los resultados posibles de un experimento aleatorio se denomina espacio muestral del experimento. Un evento se define como un subconjunto particular del espacio muestral que se debe considerar. Para cualquier evento dado, solo puede darse una de dos posibilidades: ocurre o no ocurre. La frecuencia relativa de ocurrencia de un evento, observada en una cantidad de repeticiones del experimento, es una medida de la probabilidad de ese evento. Esta es la concepción central de la probabilidad en la interpretación frecuentista.
Una afirmación del enfoque frecuentista es que, a medida que aumenta el número de ensayos, el cambio en la frecuencia relativa disminuirá. Por lo tanto, se puede considerar una probabilidad como el valor límite de las frecuencias relativas correspondientes.
Alcance
La interpretación frecuentista es un enfoque filosófico de la definición y el uso de las probabilidades; es uno de varios enfoques de ese tipo. No pretende captar todas las connotaciones del concepto "probable" en el lenguaje coloquial de las lenguas naturales.
Como interpretación, no está en conflicto con la axiomatización matemática de la teoría de la probabilidad; más bien, proporciona una guía sobre cómo aplicar la teoría de la probabilidad matemática a situaciones del mundo real. Ofrece una guía distinta en la construcción y el diseño de experimentos prácticos, especialmente cuando se contrasta con la interpretación bayesiana . En cuanto a si esta guía es útil o es propensa a interpretaciones erróneas, ha sido una fuente de controversia. Particularmente cuando se asume erróneamente que la interpretación de la frecuencia de la probabilidad es la única base posible para la inferencia frecuentista . Así, por ejemplo, una lista de interpretaciones erróneas del significado de los valores p acompaña el artículo sobre los valores p ; las controversias se detallan en el artículo sobre pruebas de hipótesis estadísticas . La paradoja de Jeffreys-Lindley muestra cómo diferentes interpretaciones, aplicadas al mismo conjunto de datos, pueden llevar a diferentes conclusiones sobre la "significación estadística" de un resultado. [ cita requerida ]
En nuestro sistema no hay lugar para especulaciones sobre la probabilidad de que el sol salga mañana . Antes de hablar de ello, deberíamos ponernos de acuerdo sobre un modelo (idealizado) que presumiblemente funcionaría en el sentido de "de entre infinitos mundos se elige uno al azar...". Se requiere poca imaginación para construir un modelo así, pero parece poco interesante y carente de sentido. [6]
Historia
La visión frecuentista puede haber sido prefigurada por Aristóteles , en Retórica , [7]
cuando escribió:
Lo probable es lo que ocurre en la mayor parte de los casos — Aristóteles Retórica [8]
Poisson (1837) distinguió claramente entre probabilidades objetivas y subjetivas. [9]
Poco después, una oleada de publicaciones casi simultáneas de Mill , Ellis (1843) [10]
y Ellis (1854), [11] Cournot (1843), [12]
y Fries introdujeron la visión frecuentista. Venn (1866, 1876, 1888) [1] proporcionó una exposición exhaustiva dos décadas después. Estas fueron respaldadas además por las publicaciones de Boole y Bertrand . A fines del siglo XIX, la interpretación frecuentista estaba bien establecida y quizás era dominante en las ciencias. [9] La siguiente generación estableció las herramientas de las estadísticas inferenciales clásicas (pruebas de significancia, pruebas de hipótesis e intervalos de confianza), todas basadas en la probabilidad frecuentista.
Alternativamente, [13] Bernoulli [b]
entendió el concepto de probabilidad frecuentista y publicó una prueba crítica (la ley débil de los grandes números ) póstumamente (Bernoulli, 1713). [14]
También se le atribuye cierta apreciación de la probabilidad subjetiva (antes y sin el teorema de Bayes ). [15] [c] [16] Gauss y Laplace usaron la probabilidad frecuentista (y otras) en las derivaciones del método de mínimos cuadrados un siglo después, una generación antes de Poisson. [13] Laplace consideró las probabilidades de testimonios, tablas de mortalidad, sentencias de tribunales, etc., que son candidatos poco probables para la probabilidad clásica. En esta visión, la contribución de Poisson fue su aguda crítica de la interpretación alternativa de la probabilidad "inversa" (subjetiva, bayesiana). Cualquier crítica de Gauss o Laplace fue silenciada e implícita. (Sin embargo, nótese que sus derivaciones posteriores de mínimos cuadrados no usaron la probabilidad inversa).
Entre los principales contribuidores a la estadística "clásica" a principios del siglo XX se encuentran Fisher , Neyman y Pearson . Fisher contribuyó a la mayor parte de la estadística e hizo de las pruebas de significación el núcleo de la ciencia experimental, aunque fue crítico del concepto frecuentista de "muestreo repetido de la misma población" ; [17]
Neyman formuló los intervalos de confianza y contribuyó en gran medida a la teoría del muestreo; Neyman y Pearson colaboraron en la creación de las pruebas de hipótesis. Todos valoraban la objetividad, por lo que la mejor interpretación de la probabilidad disponible para ellos era la frecuentista.
Todos desconfiaban de la "probabilidad inversa" (la alternativa disponible) con probabilidades previas elegidas mediante el uso del principio de indiferencia. Fisher dijo: "... la teoría de la probabilidad inversa se basa en un error, [refiriéndose al teorema de Bayes] y debe ser rechazada por completo". [18]
Si bien Neyman era un frecuentista puro, [19] [d]
las opiniones de Fisher sobre la probabilidad eran únicas: tanto Fisher como Neyman tenían una visión matizada de la probabilidad. von Mises ofreció una combinación de apoyo matemático y filosófico al frecuentismo en la época. [20] [21]
3. ...podemos distinguir, en líneas generales, dos actitudes principales. Una considera la probabilidad como "un grado de creencia racional" o alguna idea similar... la segunda define la probabilidad en términos de frecuencias de ocurrencia de eventos, o por proporciones relativas en "poblaciones" o "colectivos"; [23] (p. 101)
...
12. Podría pensarse que las diferencias entre los frecuentistas y los no frecuentistas (si puedo llamarlos así) se deben en gran medida a las diferencias de los dominios que pretenden cubrir. [23] (p. 104)
...
Afirmo que esto no es así ... La distinción esencial entre los frecuentistas y los no frecuentistas es, creo, que los primeros, en un esfuerzo por evitar cualquier cosa que suene a cuestión de opinión, buscan definir la probabilidad en términos de las propiedades objetivas de una población, real o hipotética, mientras que los segundos no lo hacen. [énfasis en el original]
"La teoría de frecuencia de la probabilidad" se utilizó una generación antes como título de un capítulo en Keynes (1921). [7]
La secuencia histórica:
Se introdujeron conceptos de probabilidad y se derivó gran parte de las matemáticas de la probabilidad (antes del siglo XX).
Se desarrollaron métodos clásicos de inferencia estadística.
Se solidificaron los fundamentos matemáticos de la probabilidad y se introdujo la terminología actual (todo ello en el siglo XX).
Las fuentes históricas primarias en probabilidad y estadística no utilizaron la terminología actual de probabilidad clásica , subjetiva (bayesiana) y frecuentista .
Puntos de vista alternativos
La teoría de la probabilidad es una rama de las matemáticas. Si bien sus raíces se remontan a siglos atrás, alcanzó su madurez con los axiomas de Andrey Kolmogorov en 1933. La teoría se centra en las operaciones válidas sobre valores de probabilidad, en lugar de en la asignación inicial de valores; las matemáticas son en gran medida independientes de cualquier interpretación de la probabilidad.
Las aplicaciones e interpretaciones de la probabilidad son consideradas por la filosofía, las ciencias y la estadística. Todas están interesadas en la extracción de conocimiento de las observaciones: razonamiento inductivo . Hay una variedad de interpretaciones en competencia; [24]
Todas tienen problemas. La interpretación frecuentista resuelve dificultades con la interpretación clásica, como cualquier problema donde no se conoce la simetría natural de los resultados. No aborda otras cuestiones, como el libro holandés .
La probabilidad clásica asigna probabilidades basadas en una simetría física idealizada (dados, monedas, cartas). La definición clásica corre el riesgo de ser circular: las probabilidades se definen asumiendo la igualdad de probabilidades. [25] En ausencia de simetría, la utilidad de la definición es limitada.
La probabilidad subjetiva (bayesiana) (una familia de interpretaciones en competencia) considera los grados de creencia: todas las interpretaciones prácticas de probabilidad "subjetiva" están tan limitadas a la racionalidad que evitan la mayor parte de la subjetividad. La subjetividad real es repelente para algunas definiciones de ciencia que buscan resultados independientes del observador y el analista. [ cita requerida ] Otras aplicaciones del bayesianismo en la ciencia (por ejemplo, el bayesianismo lógico) adoptan la subjetividad inherente de muchos estudios y objetos científicos y utilizan el razonamiento bayesiano para poner límites y contexto a la influencia de las subjetividades en todos los análisis. [26] Las raíces históricas de este concepto se extendieron a aplicaciones no numéricas como la evidencia legal.
La probabilidad de propensión considera la probabilidad como un fenómeno causal más que puramente descriptivo o subjetivo. [24]
A pesar de la explícita e inmediata renuncia de Laplace en la fuente , basada en la experiencia personal de Laplace tanto en astronomía como en probabilidad, han seguido dos siglos de críticas vagas.
^
El matemático suizo Jacob Bernoulli, de la famosa familia Bernoulli , vivió en un país multilingüe y mantuvo correspondencia y contactos regulares con hablantes de alemán y francés, y publicó en latín, lenguas todas que hablaba con fluidez. Usaba con comodidad y frecuencia los tres nombres "Jacob", "James" y "Jacques", según el idioma que hablaba o escribía.
^
Bernoulli proporcionó un ejemplo clásico de extracción de muchas piedritas blancas y negras de una urna (con reemplazo). La proporción de la muestra le permitió a Bernoulli inferir la proporción en la urna, con límites más estrictos a medida que aumentaba el número de muestras.
Los historiadores pueden interpretar el ejemplo como probabilidad clásica, frecuentista o subjetiva. David escribe: " James definitivamente ha iniciado aquí la controversia sobre la probabilidad inversa..." Bernoulli escribió generaciones antes que Bayes, Laplace y Gauss. La controversia continúa. — David (1962), pp. 137-138 [16]
^ La derivación de los intervalos de confianza de Jerzy Neyman adoptó los axiomas teóricos de la medida de la probabilidad publicados por Andrey Kolmogorov unos años antes, y hizo referencia a las definiciones de probabilidad subjetiva (bayesiana) que Jeffreys había publicado a principios de la década. Neyman definió la probabilidad frecuentista (bajo el nombre de probabilidad clásica ) y afirmó la necesidad de aleatoriedad en las muestras o ensayos repetidos. Aceptó en principio la posibilidad de múltiples teorías de probabilidad en competencia, al tiempo que expresó varias reservas específicas sobre la interpretación de probabilidad alternativa existente. [19]
Citas
^ ab Venn, John (1888) [1866, 1876]. La lógica del azar (3.ª ed.). Londres, Reino Unido: Macmillan & Co. – vía Internet Archive (archive.org. Un ensayo sobre los fundamentos y el ámbito de la teoría de la probabilidad, con especial referencia a sus implicaciones lógicas y su aplicación a la ciencia moral y social, y a la estadística.
^ Kaplan, D. (2014). Estadística bayesiana para las ciencias sociales. Metodología en las ciencias sociales. Guilford Publications. pág. 4. ISBN978-1-4625-1667-4. Recuperado el 23 de abril de 2022 .
^ Goodman, Steven N. (1999). "Hacia estadísticas médicas basadas en evidencia. 1: La falacia del valor p ". Anales de Medicina Interna . 130 (12): 995–1004. doi :10.7326/0003-4819-130-12-199906150-00008. PMID 10383371. S2CID 7534212.
^ Morey, Richard D.; Hoekstra, Rink; Rouder, Jeffrey N.; Lee, Michael D.; Wagenmakers, Eric-Jan (2016). "La falacia de depositar la confianza en los intervalos de confianza". Psychonomic Bulletin & Review . 23 (1): 103–123. doi :10.3758/s13423-015-0947-8. PMC 4742505 . PMID 26450628.
^ Matthews, Robert (2021). "La declaración del valor p , cinco años después". Significance . 18 (2): 16–19. doi :10.1111/1740-9713.01505. S2CID 233534109.
^ Feller, W. (1957). Introducción a la teoría de la probabilidad y sus aplicaciones . Vol. 1. pág. 4.
^ ab Keynes, JM (1921). "Capítulo VIII – La teoría de la frecuencia de la probabilidad". Tratado sobre probabilidad .
Franklin, J. (2001). La ciencia de la conjetura: evidencia y probabilidad antes de Pascal . Baltimore, MD: The Johns Hopkins University Press. pág. 110. ISBN0801865697.
^ ab Gigerenzer, Gerd; Swijtink, Porter; Daston, Beatty; Daston, Krüger (1989). El imperio del azar: cómo la probabilidad cambió la ciencia y la vida cotidiana . Cambridge, Reino Unido / Nueva York, NY: Cambridge University Press. págs. 35–36, 45. ISBN978-0-521-39838-1.
^ Cournot, AA (1843). Exposición de la teoría de las posibilidades y las probabilidades. París, FR: L. Hachette - vía Internet Archive (archive.org).
^ ab Hald, Anders (2004). Una historia de la inferencia estadística paramétrica desde Bernoulli hasta Fisher, 1713 a 1935. Copenhague, DM: Anders Hald, Departamento de Matemáticas Aplicadas y Estadística, Universidad de Copenhague . pp. 1–5. ISBN978-87-7834-628-5.
^ Bernoulli, Jakob (1713). Ars Conjectandi: Usum & applicationem praecedentis doctrinae in civilibus, moralibus, & oeconomicis [ El arte de la conjetura: el uso y aplicación de la experiencia previa en temas civiles, morales y económicos ] (en latín).
^ Fienberg, Stephen E. (1992). "Una breve historia de la estadística en tres capítulos y medio: un ensayo de revisión". Ciencia estadística . 7 (2): 208–225. doi : 10.1214/ss/1177011360 .
^ ab David, FN (1962). Juegos, dioses y apuestas . Nueva York, NY: Hafner. págs. 137–138.
^ Rubin, M. (2020). ""¿Muestreo repetido de la misma población?" Una crítica de las respuestas de Neyman y Pearson a Fisher". Revista Europea de Filosofía de la Ciencia . 10 (42): 1–15. doi :10.1007/s13194-020-00309-6. S2CID 221939887.
^ Fisher, RA Métodos estadísticos para investigadores .
^ von Mises, Richard (1981) [1939]. Probabilidad, estadística y verdad (en alemán e inglés) (2.ª ed. rev.). Dover Publications. pág. 14. ISBN0486242145.
^ Gilles, Donald (2000). "Capítulo 5 – La teoría de la frecuencia". Teorías filosóficas de la probabilidad . Psychology Press. pág. 88. ISBN9780415182751.
^ "Usos más antiguos conocidos de algunos términos relacionados con la probabilidad y la estadística". leidenuniv.nl . Leidin, NL: Leiden University .
^ abc Kendall, MG (1949). "Sobre la reconciliación de las teorías de probabilidad". Biometrika . 36 (1–2): 101–116. doi :10.1093/biomet/36.1-2.101. JSTOR 2332534. PMID 18132087.
^ ab Hájek, Alan (21 de octubre de 2002). "Interpretaciones de la probabilidad". En Zalta, Edward N. (ed.). The Stanford Encyclopedia of Philosophy – vía plato.stanford.edu.
^ Ash, Robert B. (1970). Teoría básica de la probabilidad . Nueva York, NY: Wiley. págs. 1–2.
^ Fairfield, Tasha; Charman, Andrew E. (15 de mayo de 2017). "Análisis bayesiano explícito para el seguimiento de procesos: directrices, oportunidades y advertencias". Análisis político . 25 (3): 363–380. doi :10.1017/pan.2017.14. S2CID 8862619.
Referencias
Bridgman, PW (1927). La lógica de la física moderna .
Church, Alonzo (1940). El concepto de una secuencia aleatoria .
Cramér, Harald (1946). Métodos matemáticos de estadística .
Feller, William (1957). Introducción a la teoría de la probabilidad y sus aplicaciones .
Martin-Löf, P. (1966). Sobre el concepto de secuencia aleatoria .
von Mises, Richard (1939) [1928 (en alemán)]. Probabilidad, estadística y verdad .
Neyman, Jerzy (1950). Primer Curso de Probabilidad y Estadística .
Reichenbach, Hans (1949) [1935 (en alemán)]. La teoría de la probabilidad .
Friedman, C. (1999). "La interpretación de frecuencias en probabilidad". Avances en Matemáticas Aplicadas . 23 (3): 234–254. doi : 10.1006/aama.1999.0653 . "fuente alternativa" (PS) . utexas.edu/~friedman . Austin, TX: Universidad de Texas .