Teorema de Cox

Derivación de las leyes de la teoría de la probabilidad

El teorema de Cox , llamado así en honor al físico Richard Threlkeld Cox , es una derivación de las leyes de la teoría de la probabilidad a partir de un determinado conjunto de postulados . [1] [2] Esta derivación justifica la llamada interpretación "lógica" de la probabilidad, ya que las leyes de probabilidad derivadas por el teorema de Cox son aplicables a cualquier proposición. La probabilidad lógica (también conocida como bayesiana objetiva) es un tipo de probabilidad bayesiana . Otras formas de bayesianismo, como la interpretación subjetiva, reciben otras justificaciones.

Supuestos de Cox

Cox quería que su sistema cumpliera las siguientes condiciones:

  1. Divisibilidad y comparabilidad – La plausibilidad de una proposición es un número real y depende de la información que tenemos relacionada con la proposición.
  2. Sentido común: las plausibilidades deben variar razonablemente con la evaluación de las plausibilidades en el modelo.
  3. Coherencia – Si la plausibilidad de una proposición puede derivarse de muchas maneras, todos los resultados deben ser iguales.

Los postulados aquí enunciados están tomados de Arnborg y Sjödin. [3] [4] [5] El " sentido común " incluye la coherencia con la lógica aristotélica en el sentido de que las proposiciones lógicamente equivalentes deben tener la misma plausibilidad.

Los postulados originalmente enunciados por Cox no eran matemáticamente rigurosos (aunque más que la descripción informal anterior), como señaló Halpern . [6] [7] Sin embargo, parece ser posible aumentarlos con varias suposiciones matemáticas hechas implícita o explícitamente por Cox para producir una prueba válida.

Notación de Cox:

La plausibilidad de una proposición dada cierta información relacionada se denota por . A {\estilo de visualización A} incógnita {\estilo de visualización X} A incógnita {\displaystyle A\mid X}

Los postulados y ecuaciones funcionales de Cox son:

  • La plausibilidad de la conjunción de dos proposiciones , dada cierta información relacionada , está determinada por la plausibilidad de la dada y la de la dada . A B {\estilo de visualización AB} A {\estilo de visualización A} B {\estilo de visualización B} incógnita {\estilo de visualización X} A {\estilo de visualización A} incógnita {\estilo de visualización X} B {\estilo de visualización B} A incógnita {\displaystyle AX}
En forma de ecuación funcional
A B incógnita = gramo ( A incógnita , B A incógnita ) {\displaystyle AB\mid X=g(A\mid X,B\mid AX)}
Debido a la naturaleza asociativa de la conjunción en la lógica proposicional, la consistencia con la lógica da una ecuación funcional que dice que la función es una operación binaria asociativa . gramo {\estilo de visualización g}
  • Además, Cox postula que la función es monótona . gramo {\estilo de visualización g}
Todas las operaciones binarias asociativas estrictamente crecientes sobre los números reales son isomorfas a la multiplicación de números en un subintervalo de [0, +∞] , lo que significa que hay una función monótona que asigna plausibilidades a [0, +∞] tal que el {\estilo de visualización w}
el ( A B incógnita ) = el ( A incógnita ) el ( B A incógnita ) {\displaystyle w(AB\mid X)=w(A\mid X)w(B\mid AX)}
  • En el caso de que se dé una certeza, tenemos y debido al requisito de consistencia. La ecuación general conduce entonces a A {\estilo de visualización A} incógnita {\estilo de visualización X} A B incógnita = B incógnita {\displaystyle AB\mid X=B\mid X} B A incógnita = B incógnita {\displaystyle B\mid AX=B\mid X}
el ( B incógnita ) = el ( A incógnita ) el ( B incógnita ) {\displaystyle w(B\mid X)=w(A\mid X)w(B\mid X)}
Esto se aplica a cualquier proposición que conduzca a B {\estilo de visualización B}
el ( A incógnita ) = 1 {\displaystyle w(A\mid X)=1}
  • En el caso de que sea imposible, tenemos y debido al requisito de consistencia. La ecuación general (con los factores A y B intercambiados) conduce entonces a A {\estilo de visualización A} incógnita {\estilo de visualización X} A B incógnita = A incógnita {\displaystyle AB\mid X=A\mid X} A B incógnita = A incógnita {\displaystyle A\mid BX=A\mid X}
el ( A incógnita ) = el ( B incógnita ) el ( A incógnita ) {\displaystyle w(A\mid X)=w(B\mid X)w(A\mid X)}
Esto se aplica a cualquier proposición que, sin pérdida de generalidad, conduzca a una solución. B {\estilo de visualización B}
el ( A incógnita ) = 0 {\displaystyle w(A\mid X)=0}
Debido al requisito de monotonía, esto significa que las plausibilidades de los mapas se corresponden con el intervalo [0, 1] . el {\estilo de visualización w}
  • La plausibilidad de una proposición determina la plausibilidad de la negación de la proposición .
Esto postula la existencia de una función tal que F {\estilo de visualización f}
el ( no  A incógnita ) = F ( el ( A incógnita ) ) {\displaystyle w({\text{no }}A\mid X)=f(w(A\mid X))}
Como "una doble negación es una afirmativa", la coherencia con la lógica da una ecuación funcional.
F ( F ( incógnita ) ) = incógnita , {\displaystyle f(f(x))=x,}
diciendo que la función es una involución , es decir, es su propia inversa. F {\estilo de visualización f}
  • Además, Cox postula que la función es monótona. F {\estilo de visualización f}
Las ecuaciones funcionales anteriores y su coherencia con la lógica implican que
el ( A B incógnita ) = el ( A incógnita ) F ( el ( no  B A incógnita ) ) = el ( A incógnita ) F ( el ( A  no  B incógnita ) el ( A incógnita ) ) {\displaystyle w(AB\mid X)=w(A\mid X)f(w({\text{not }}B\mid AX))=w(A\mid X)f\left({w(A{\text{ not }}B\mid X) \over w(A\mid X)}\right)}
Como es lógicamente equivalente a , también obtenemos A B {\displaystyle AB} B A {\displaystyle BA}
w ( A X ) f ( w ( A  not  B X ) w ( A X ) ) = w ( B X ) f ( w ( B  not  A X ) w ( B X ) ) {\displaystyle w(A\mid X)f\left({w(A{\text{ not }}B\mid X) \over w(A\mid X)}\right)=w(B\mid X)f\left({w(B{\text{ not }}A\mid X) \over w(B\mid X)}\right)}
Si, en particular, , entonces también y y obtenemos B =  not  ( A D ) {\displaystyle B={\text{ not }}(AD)} A  not  B = not  B {\displaystyle A{\text{ not }}B={\text{not }}B} B  not  A =  not  A {\displaystyle B{\text{ not }}A={\text{ not }}A}
w ( A  not  B X ) = w ( not  B X ) = f ( w ( B X ) ) {\displaystyle w(A{\text{ not }}B\mid X)=w({\text{not }}B\mid X)=f(w(B\mid X))}
y
w ( B  not  A X ) = w ( not  A X ) = f ( w ( A X ) ) {\displaystyle w(B{\text{ not }}A\mid X)=w({\text{not }}A\mid X)=f(w(A\mid X))}
Abreviando obtenemos la ecuación funcional w ( A X ) = x {\displaystyle w(A\mid X)=x} w ( B X ) = y {\displaystyle w(B\mid X)=y}
x f ( f ( y ) x ) = y f ( f ( x ) y ) {\displaystyle x\,f\left({f(y) \over x}\right)=y\,f\left({f(x) \over y}\right)}

Implicaciones de los postulados de Cox

Las leyes de probabilidad que se derivan de estos postulados son las siguientes. [8] Sea la plausibilidad de la proposición dada que satisface los postulados de Cox. Entonces existe una función que asigna plausibilidades al intervalo [0,1] y un número positivo tal que A B {\displaystyle A\mid B} A {\displaystyle A} B {\displaystyle B} w {\displaystyle w} m {\displaystyle m}

  1. La certeza está representada por w ( A B ) = 1. {\displaystyle w(A\mid B)=1.}
  2. w m ( A | B ) + w m ( not  A B ) = 1. {\displaystyle w^{m}(A|B)+w^{m}({\text{not }}A\mid B)=1.}
  3. w ( A B C ) = w ( A C ) w ( B A C ) = w ( B C ) w ( A B C ) . {\displaystyle w(AB\mid C)=w(A\mid C)w(B\mid AC)=w(B\mid C)w(A\mid BC).}

Es importante señalar que los postulados implican únicamente estas propiedades generales. Podemos recuperar las leyes de probabilidad habituales estableciendo una nueva función, convencionalmente denotada como , igual a . Entonces obtenemos las leyes de probabilidad en una forma más familiar: P {\displaystyle P} Pr {\displaystyle \Pr } w m {\displaystyle w^{m}}

  1. Cierta verdad está representada por , y cierta falsedad por Pr ( A B ) = 1 {\displaystyle \Pr(A\mid B)=1} Pr ( A B ) = 0. {\displaystyle \Pr(A\mid B)=0.}
  2. Pr ( A B ) + Pr ( not  A B ) = 1. {\displaystyle \Pr(A\mid B)+\Pr({\text{not }}A\mid B)=1.}
  3. Pr ( A B C ) = Pr ( A C ) Pr ( B A C ) = Pr ( B C ) Pr ( A B C ) . {\displaystyle \Pr(AB\mid C)=\Pr(A\mid C)\Pr(B\mid AC)=\Pr(B\mid C)\Pr(A\mid BC).}

La regla 2 es una regla para la negación y la regla 3 es una regla para la conjunción. Dado que cualquier proposición que contenga conjunción, disyunción y negación puede reformularse de manera equivalente utilizando solo la conjunción y la negación (la forma normal conjuntiva ), ahora podemos manejar cualquier proposición compuesta.

Las leyes así derivadas dan como resultado una aditividad finita de probabilidad, pero no una aditividad contable . La formulación de Kolmogorov basada en la teoría de la medida supone que una medida de probabilidad es contablemente aditiva. Esta condición ligeramente más estricta es necesaria para ciertos resultados. Un ejemplo elemental (en el que esta suposición simplemente simplifica el cálculo en lugar de ser necesaria para él) es que la probabilidad de ver cara por primera vez después de un número par de lanzamientos en una secuencia de lanzamientos de moneda es . [9] 1 3 {\displaystyle {\tfrac {1}{3}}}

Interpretación y discusión posterior

El teorema de Cox ha llegado a utilizarse como una de las justificaciones para el uso de la teoría de probabilidad bayesiana . Por ejemplo, en Jaynes se analiza en detalle en los capítulos 1 y 2 y es una piedra angular para el resto del libro. [8] La probabilidad se interpreta como un sistema formal de lógica , la extensión natural de la lógica aristotélica (en la que cada enunciado es verdadero o falso) en el ámbito del razonamiento en presencia de incertidumbre.

Se ha debatido hasta qué punto el teorema excluye modelos alternativos para razonar sobre la incertidumbre . Por ejemplo, si se descartaran ciertos supuestos matemáticos "no intuitivos", se podrían idear alternativas, por ejemplo, un ejemplo proporcionado por Halpern. [6] Sin embargo, Arnborg y Sjödin [3] [4] [5] sugieren postulados adicionales de "sentido común", que permitirían relajar los supuestos en algunos casos mientras se sigue descartando el ejemplo de Halpern. Hardy [10] o Dupré y Tipler idearon otros enfoques . [11]

La formulación original del teorema de Cox se encuentra en Cox (1946), que se amplía con resultados adicionales y más discusión en Cox (1961). Jaynes [8] cita a Abel [12] como el primer uso conocido de la ecuación funcional de asociatividad. János Aczél [13] proporciona una larga prueba de la "ecuación de asociatividad" (páginas 256-267). Jaynes [8] : 27  reproduce la prueba más corta de Cox en la que se supone la diferenciabilidad. Una guía del teorema de Cox de Van Horn tiene como objetivo presentar de forma exhaustiva al lector todas estas referencias. [14]

Baoding Liu, el fundador de la teoría de la incertidumbre , critica el teorema de Cox por presumir que el valor de verdad de la conjunción es una función dos veces diferenciable de los valores de verdad de las dos proposiciones y , es decir, , lo que excluye la "medida incierta" de la teoría de la incertidumbre desde su inicio, porque la función , [a] utilizada en la teoría de la incertidumbre, no es diferenciable con respecto a y . [15] Según Liu, "no existe ninguna evidencia de que el valor de verdad de la conjunción esté completamente determinado por los valores de verdad de las proposiciones individuales, y mucho menos una función dos veces diferenciable". [15] P Q {\displaystyle P\land Q} f {\displaystyle f} P {\displaystyle P} Q {\displaystyle Q} T ( P Q ) = f ( T ( P ) , T ( Q ) ) {\displaystyle T(P\land Q)=f(T(P),T(Q))} f ( x , y ) = x y {\displaystyle f(x,y)=x\land y} x {\displaystyle x} y {\displaystyle y}

Véase también

Notas

  1. ^ Liu utiliza el símbolo ∧ como "operador mínimo", probablemente refiriéndose a una operación binaria que toma dos números y devuelve el más pequeño (o mínimo) de los dos.

Referencias

  1. ^ Cox, RT (1946). "Probabilidad, frecuencia y expectativa razonable". American Journal of Physics . 14 (1): 1–10. Código Bibliográfico :1946AmJPh..14....1C. doi :10.1119/1.1990764.
  2. ^ Cox, RT (1961). El álgebra de la inferencia probable . Baltimore, MD: Johns Hopkins University Press.
  3. ^ ab Stefan Arnborg y Gunnar Sjödin, Sobre los fundamentos del bayesianismo, Preimpresión: Nada, KTH (1999) - http://www.stats.org.uk/cox-theorems/ArnborgSjodin2001.pdf
  4. ^ ab Stefan Arnborg y Gunnar Sjödin, Una nota sobre los fundamentos del bayesianismo, Preimpresión: Nada, KTH (2000a) - http://www.stats.org.uk/bayesian/ArnborgSjodin1999.pdf
  5. ^ por Stefan Arnborg y Gunnar Sjödin, "Reglas de Bayes en modelos finitos", en Conferencia Europea sobre Inteligencia Artificial, Berlín, (2000b) — https://frontiersinai.com/ecai/ecai2000/pdf/p0571.pdf
  6. ^ de Joseph Y. Halpern, "Un contraejemplo de los teoremas de Cox y Fine", Journal of AI research, 10, 67–85 (1999) — http://www.jair.org/media/536/live-536-2054-jair.ps.Z Archivado el 25 de noviembre de 2015 en Wayback Machine.
  7. ^ Joseph Y. Halpern, "Anexo técnico, Teorema de Cox revisitado", Journal of AI research, 11, 429–435 (1999) — http://www.jair.org/media/644/live-644-1840-jair.ps.Z Archivado el 25 de noviembre de 2015 en Wayback Machine.
  8. ^ abcd Edwin Thompson Jaynes , Probability Theory: The Logic of Science, Cambridge University Press (2003). — versión preimpresa (1996) en «Copia archivada». Archivado desde el original el 19 de enero de 2016. Consultado el 19 de enero de 2016 .{{cite web}}: CS1 maint: archived copy as title (link); Capítulos 1 a 3 de la versión publicada en http://bayes.wustl.edu/etj/prob/book.pdf
  9. ^ Price, David T. (1974), "Aditividad contable para medidas de probabilidad", American Mathematical Monthly , 81 : 886–889, doi :10.2307/2319450, JSTOR  2319450, MR  0350798
  10. ^ Michael Hardy, "Álgebras de Boole escaladas", Advances in Applied Mathematics , agosto de 2002, páginas 243-292 (o preimpresión); Hardy ha dicho: "Afirmo allí que creo que las suposiciones de Cox son demasiado fuertes, aunque en realidad no digo por qué. Digo con qué las reemplazaría". (La cita es de una página de discusión de Wikipedia, no del artículo).
  11. ^ Dupré, Maurice J. y Tipler, Frank J. (2009). "Nuevos axiomas para la probabilidad bayesiana rigurosa", Bayesian Analysis , 4 (3): 599-606.
  12. ^ Niels Henrik Abel "Untersuchung der Functionen zweier unabhängig veränderlichen Gröszen x und y , wie f ( x , y ), welche die Eigenschaft haben, dasz f [ z , f ( x , y )] eine symmetrische Function von z , x und y ist.", Jour. Reina u. ángulo. Matemáticas. (Crelle's Jour.), 1, 11-15, (1826).
  13. ^ János Aczél , Conferencias sobre ecuaciones funcionales y sus aplicaciones, Academic Press, Nueva York, (1966).
  14. ^ Van Horn, KS (2003). "Construcción de una lógica de inferencia plausible: una guía para el teorema de Cox". Revista internacional de razonamiento aproximado . 34 : 3–24. doi :10.1016/S0888-613X(03)00051-3.
  15. ^ ab Liu, Baoding (2015). Teoría de la incertidumbre . Springer Uncertainty Research (4.ª ed., 2015). Berlín, Heidelberg: Springer Berlin Heidelberg: Imprenta: Springer. pp. 459–460. ISBN 978-3-662-44354-5.

Lectura adicional

  • Fine, Terrence L. (1973). Teorías de la probabilidad: un examen de los fundamentos . Nueva York: Academic Press. ISBN 0-12-256450-2.
  • Smith, C. Ray; Erickson, Gary (1989). "De la racionalidad y la consistencia a la probabilidad bayesiana". En Skilling, John (ed.). Máxima entropía y métodos bayesianos . Dordrecht: Kluwer. págs. 29–44. doi :10.1007/978-94-015-7860-8_2. ISBN. 0-7923-0224-9.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Cox%27s_theorem&oldid=1226998905"