Parte de una serie sobre estadísticas |
Teoría de la probabilidad |
---|
En el uso común, la aleatoriedad es la falta aparente o real de un patrón definido o de previsibilidad en la información. [1] [2] Una secuencia aleatoria de eventos, símbolos o pasos a menudo no tiene orden y no sigue un patrón o combinación inteligible. Los eventos aleatorios individuales son, por definición, impredecibles, pero si hay una distribución de probabilidad conocida , la frecuencia de diferentes resultados en eventos repetidos (o "ensayos") es predecible. [nota 1] Por ejemplo, al lanzar dos dados , el resultado de cualquier tirada en particular es impredecible, pero una suma de 7 tenderá a ocurrir el doble de veces que 4. En esta visión, la aleatoriedad no es casualidad; es una medida de incertidumbre de un resultado. La aleatoriedad se aplica a los conceptos de azar, probabilidad y entropía de la información .
Los campos de las matemáticas, la probabilidad y la estadística utilizan definiciones formales de aleatoriedad, asumiendo normalmente que existe alguna distribución de probabilidad "objetiva". En estadística, una variable aleatoria es una asignación de un valor numérico a cada resultado posible de un espacio de eventos . Esta asociación facilita la identificación y el cálculo de probabilidades de los eventos. Las variables aleatorias pueden aparecer en secuencias aleatorias . Un proceso aleatorio es una secuencia de variables aleatorias cuyos resultados no siguen un patrón determinista , sino que siguen una evolución descrita por distribuciones de probabilidad . Estos y otros constructos son extremadamente útiles en la teoría de la probabilidad y las diversas aplicaciones de la aleatoriedad .
La aleatoriedad se utiliza con mayor frecuencia en estadística para indicar propiedades estadísticas bien definidas. Los métodos de Monte Carlo , que se basan en una entrada aleatoria (como la de generadores de números aleatorios o generadores de números pseudoaleatorios ), son técnicas importantes en la ciencia, en particular en el campo de la ciencia computacional . [3] Por analogía, los métodos cuasi-Monte Carlo utilizan generadores de números cuasialeatorios .
La selección aleatoria, cuando se asocia estrechamente con una muestra aleatoria simple , es un método de selección de elementos (a menudo llamados unidades) de una población donde la probabilidad de elegir un elemento específico es la proporción de esos elementos en la población. Por ejemplo, con un recipiente que contiene solo 10 canicas rojas y 90 canicas azules, un mecanismo de selección aleatoria elegiría una canica roja con una probabilidad de 1/10. Un mecanismo de selección aleatoria que seleccionara 10 canicas de este recipiente no necesariamente daría como resultado 1 roja y 9 azules. En situaciones donde una población consta de elementos que son distinguibles, un mecanismo de selección aleatoria requiere probabilidades iguales para que se elija cualquier elemento. Es decir, si el proceso de selección es tal que cada miembro de una población, digamos sujetos de investigación, tiene la misma probabilidad de ser elegido, entonces podemos decir que el proceso de selección es aleatorio. [2]
Según la teoría de Ramsey , la aleatoriedad pura (en el sentido de que no hay un patrón discernible) es imposible, especialmente para estructuras grandes. El matemático Theodore Motzkin sugirió que "si bien el desorden es más probable en general, el desorden completo es imposible". [4] La mala comprensión de esto puede conducir a numerosas teorías conspirativas . [5] Cristian S. Calude afirmó que "dada la imposibilidad de una aleatoriedad verdadera, el esfuerzo se dirige a estudiar los grados de aleatoriedad". [6] Se puede demostrar que existe una jerarquía infinita (en términos de calidad o fuerza) de formas de aleatoriedad. [6]
En la historia antigua, los conceptos de azar y aleatoriedad estaban entrelazados con el de destino. Muchos pueblos antiguos tiraban dados para determinar el destino, y esto más tarde evolucionó hacia los juegos de azar. La mayoría de las culturas antiguas usaban varios métodos de adivinación para intentar eludir la aleatoriedad y el destino. [7] [8] Más allá de la religión y los juegos de azar , la aleatoriedad ha sido atestiguada para el sorteo al menos desde la antigua democracia ateniense en forma de kleroterion . [9]
La formalización de las probabilidades y el azar fue quizás la primera en ser realizada por los chinos hace 3.000 años. Los filósofos griegos discutieron la aleatoriedad extensamente, pero sólo en formas no cuantitativas. Fue recién en el siglo XVI que los matemáticos italianos comenzaron a formalizar las probabilidades asociadas con varios juegos de azar. La invención del cálculo tuvo un impacto positivo en el estudio formal de la aleatoriedad. En la edición de 1888 de su libro La lógica del azar , John Venn escribió un capítulo sobre La concepción de la aleatoriedad que incluía su visión de la aleatoriedad de los dígitos de pi (π), al usarlos para construir un paseo aleatorio en dos dimensiones. [10]
A principios del siglo XX se produjo un rápido crecimiento del análisis formal de la aleatoriedad, a medida que se introdujeron diversos enfoques de los fundamentos matemáticos de la probabilidad. A mediados y finales del siglo XX, las ideas de la teoría de la información algorítmica introdujeron nuevas dimensiones en el campo a través del concepto de aleatoriedad algorítmica .
Aunque durante muchos siglos la aleatoriedad se ha considerado un obstáculo y una molestia, en el siglo XX los informáticos empezaron a darse cuenta de que la introducción deliberada de aleatoriedad en los cálculos puede ser una herramienta eficaz para diseñar mejores algoritmos. En algunos casos, estos algoritmos aleatorios incluso superan a los mejores métodos deterministas. [11]
Muchos campos científicos se ocupan de la aleatoriedad:
En el siglo XIX, los científicos utilizaron la idea de los movimientos aleatorios de las moléculas en el desarrollo de la mecánica estadística para explicar los fenómenos de la termodinámica y las propiedades de los gases .
Según varias interpretaciones estándar de la mecánica cuántica , los fenómenos microscópicos son objetivamente aleatorios. [12] Es decir, en un experimento que controla todos los parámetros causalmente relevantes, algunos aspectos del resultado aún varían aleatoriamente. Por ejemplo, si se coloca un solo átomo inestable en un entorno controlado, no se puede predecir cuánto tiempo tardará en desintegrarse el átomo, solo la probabilidad de desintegración en un tiempo determinado. [13] Por lo tanto, la mecánica cuántica no especifica el resultado de experimentos individuales, sino solo las probabilidades. Las teorías de variables ocultas rechazan la visión de que la naturaleza contiene aleatoriedad irreducible: dichas teorías postulan que en los procesos que parecen aleatorios, las propiedades con una cierta distribución estadística están funcionando detrás de escena, determinando el resultado en cada caso.
La síntesis evolutiva moderna atribuye la diversidad de vida observada a mutaciones genéticas aleatorias seguidas de selección natural . Esta última conserva algunas mutaciones aleatorias en el acervo genético debido a la posibilidad sistemáticamente mejorada de supervivencia y reproducción que esos genes mutados confieren a los individuos que los poseen. Sin embargo, la ubicación de la mutación no es completamente aleatoria, ya que, por ejemplo, las regiones biológicamente importantes pueden estar más protegidas de las mutaciones. [14] [15] [16]
Varios autores sostienen también que la evolución (y a veces el desarrollo) requiere una forma específica de aleatoriedad, a saber, la introducción de comportamientos cualitativamente nuevos. En lugar de la elección de una posibilidad entre varias preestablecidas, esta aleatoriedad corresponde a la formación de nuevas posibilidades. [17] [18]
Las características de un organismo surgen en cierta medida de manera determinista (por ejemplo, bajo la influencia de los genes y el medio ambiente) y en cierta medida de manera aleatoria. Por ejemplo, la densidad de pecas que aparecen en la piel de una persona está controlada por los genes y la exposición a la luz, mientras que la ubicación exacta de las pecas individuales parece aleatoria. [19]
En lo que respecta al comportamiento, la aleatoriedad es importante para que un animal se comporte de una manera que sea impredecible para los demás. Por ejemplo, los insectos en vuelo tienden a moverse con cambios aleatorios de dirección, lo que dificulta que los depredadores que los persiguen puedan predecir sus trayectorias.
La teoría matemática de la probabilidad surgió de los intentos de formular descripciones matemáticas de eventos aleatorios, originalmente en el contexto de los juegos de azar , pero más tarde en conexión con la física. La estadística se utiliza para inferir una distribución de probabilidad subyacente de una colección de observaciones empíricas. Para los fines de la simulación , es necesario tener una gran cantidad de números aleatorios , o medios para generarlos a pedido.
La teoría de la información algorítmica estudia, entre otros temas, lo que constituye una secuencia aleatoria . La idea central es que una cadena de bits es aleatoria si y solo si es más corta que cualquier programa informático que pueda producir esa cadena ( aleatoriedad de Kolmogorov ), lo que significa que las cadenas aleatorias son aquellas que no se pueden comprimir . Entre los pioneros de este campo se incluyen Andrey Kolmogorov y su alumno Per Martin-Löf , Ray Solomonoff y Gregory Chaitin . Para la noción de secuencia infinita, los matemáticos generalmente aceptan la definición semi-epónima de Per Martin-Löf : Una secuencia infinita es aleatoria si y solo si resiste todos los conjuntos nulos recursivamente enumerables. [20] Las otras nociones de secuencias aleatorias incluyen, entre otras, la aleatoriedad recursiva y la aleatoriedad de Schnorr, que se basan en martingalas recursivamente computables. Yongge Wang demostró que estas nociones de aleatoriedad son generalmente diferentes. [21]
La aleatoriedad se da en números como log(2) y pi . Los dígitos decimales de pi constituyen una secuencia infinita y "nunca se repiten de manera cíclica". También se considera que es probable que números como pi sean normales :
Ciertamente, parece que Pi se comporta de esta manera. En los primeros seis mil millones de decimales de Pi, cada uno de los dígitos del 0 al 9 aparece unos seiscientos millones de veces. Sin embargo, estos resultados, posiblemente accidentales, no prueban la normalidad ni siquiera en la base 10, y mucho menos en otras bases numéricas. [22]
En estadística, la aleatoriedad se utiliza habitualmente para crear muestras aleatorias simples . Esto permite que las encuestas a grupos de personas completamente aleatorios proporcionen datos realistas que reflejen la población. Los métodos habituales para hacerlo incluyen sacar nombres de un sombrero o utilizar un gráfico de dígitos aleatorios (una gran tabla de dígitos aleatorios).
En la ciencia de la información, los datos irrelevantes o sin sentido se consideran ruido. El ruido consiste en numerosas perturbaciones transitorias, con una distribución temporal estadísticamente aleatoria.
En la teoría de la comunicación , la aleatoriedad de una señal se denomina "ruido" y se opone a aquel componente de su variación que es causalmente atribuible a la fuente, la señal.
En términos del desarrollo de redes aleatorias, la aleatoriedad para la comunicación se basa en dos supuestos simples de Paul Erdős y Alfréd Rényi , quienes dijeron que había un número fijo de nodos y que este número permanecía fijo durante la vida de la red, y que todos los nodos eran iguales y estaban vinculados aleatoriamente entre sí. [ aclaración necesaria ] [23]
La hipótesis del paseo aleatorio considera que los precios de los activos en un mercado organizado evolucionan de manera aleatoria, en el sentido de que el valor esperado de su cambio es cero, pero el valor real puede resultar positivo o negativo. En términos más generales, los precios de los activos se ven influidos por una variedad de eventos impredecibles en el entorno económico general.
La selección aleatoria puede ser un método oficial para resolver empates electorales en algunas jurisdicciones. [24] Su uso en política se remonta a mucho tiempo atrás. Muchos cargos en la antigua Atenas se elegían por sorteo en lugar de por votación moderna.
La aleatoriedad puede verse como algo contradictorio con las ideas deterministas de algunas religiones, como aquellas que sostienen que el universo fue creado por una deidad omnisciente que conoce todos los eventos pasados y futuros. Si se considera que el universo tiene un propósito, entonces la aleatoriedad puede verse como algo imposible. Esta es una de las razones de la oposición religiosa a la evolución , que afirma que la selección no aleatoria se aplica a los resultados de la variación genética aleatoria.
Las filosofías hindú y budista sostienen que todo acontecimiento es el resultado de acontecimientos anteriores, como se refleja en el concepto de karma . Por tanto, esta concepción es contraria a la idea de aleatoriedad, y cualquier reconciliación entre ambas requeriría una explicación. [25]
En algunos contextos religiosos, se utilizan para la adivinación procedimientos que suelen percibirse como aleatorios. La cleromancia utiliza el lanzamiento de dados o de huesos para revelar lo que se considera la voluntad de los dioses.
En la mayoría de sus usos matemáticos, políticos, sociales y religiosos, la aleatoriedad se utiliza por su innata "imparcialidad" y falta de sesgo.
Política : La democracia ateniense se basaba en el concepto de isonomía (igualdad de derechos políticos) y utilizaba complejas máquinas de asignación de votos para garantizar que los puestos en los comités gobernantes que dirigían Atenas se asignaran de forma justa. En la actualidad, la asignación de votos se limita a la selección de jurados en los sistemas jurídicos anglosajones y en situaciones en las que la "justicia" se aproxima a la aleatorización , como en la selección de jurados y en las loterías de reclutamiento militar .
Juegos : Los números aleatorios se investigaron por primera vez en el contexto de los juegos de azar , y muchos dispositivos aleatorios, como los dados , las barajadoras de cartas y las ruletas , se desarrollaron por primera vez para su uso en los juegos de azar. La capacidad de producir números aleatorios de manera justa es vital para los juegos de azar electrónicos y, como tal, los métodos utilizados para crearlos suelen estar regulados por las Juntas de Control de Juegos del gobierno . Los sorteos aleatorios también se utilizan para determinar los ganadores de la lotería . De hecho, la aleatoriedad se ha utilizado para los juegos de azar a lo largo de la historia y para seleccionar a individuos para una tarea no deseada de manera justa (ver sorteo de pajitas ).
Deportes : Algunos deportes, incluido el fútbol americano , utilizan lanzamientos de moneda para seleccionar aleatoriamente las condiciones iniciales de los partidos o para clasificar a los equipos empatados para la postemporada . La Asociación Nacional de Baloncesto utiliza una lotería ponderada para ordenar a los equipos en su draft.
Matemáticas : Los números aleatorios también se emplean cuando su uso es matemáticamente importante, como en el muestreo para encuestas de opinión y en el muestreo estadístico en sistemas de control de calidad . Las soluciones computacionales para algunos tipos de problemas utilizan ampliamente los números aleatorios, como en el método de Monte Carlo y en los algoritmos genéticos .
Medicina : La asignación aleatoria de una intervención clínica se utiliza para reducir el sesgo en ensayos controlados (por ejemplo, ensayos controlados aleatorios ).
Religión : Aunque no pretenden ser aleatorias, varias formas de adivinación como la cleromancia ven lo que parece ser un evento aleatorio como un medio para que un ser divino comunique su voluntad (ver también Libre albedrío y determinismo para más información).
Se acepta generalmente que existen tres mecanismos responsables del comportamiento (aparentemente) aleatorio en los sistemas:
Las múltiples aplicaciones de la aleatoriedad han dado lugar a muchos métodos diferentes para generar datos aleatorios. Estos métodos pueden variar en cuanto a su grado de imprevisibilidad o aleatoriedad estadística y a la rapidez con la que pueden generar números aleatorios.
Antes de la aparición de los generadores computacionales de números aleatorios , generar grandes cantidades de números suficientemente aleatorios (algo importante en estadística) requería mucho trabajo. A veces, los resultados se recopilaban y distribuían como tablas de números aleatorios .
Existen muchas medidas prácticas de aleatoriedad para una secuencia binaria. Estas incluyen medidas basadas en frecuencia, transformaciones discretas , complejidad o una combinación de ellas, como las pruebas de Kak, Phillips, Yuen, Hopkins, Beth y Dai, Mund y Marsaglia y Zaman. [26]
La no localidad cuántica se ha utilizado para certificar la presencia de una forma genuina o fuerte de aleatoriedad en una cadena dada de números. [27]
Las percepciones populares de la aleatoriedad son frecuentemente erróneas y a menudo se basan en razonamientos o intuiciones falaces.
Este argumento es el siguiente: "En una selección aleatoria de números, como todos los números aparecen eventualmente, aquellos que aún no han salido son los que "deben salir" y, por lo tanto, es más probable que salgan pronto". Esta lógica solo es correcta si se aplica a un sistema en el que los números que salen se eliminan del sistema, como cuando se extraen cartas de juego y no se devuelven a la baraja. En este caso, una vez que se extrae una jota de la baraja, es menos probable que la siguiente carta que se extraiga sea una jota y es más probable que sea otra carta. Sin embargo, si se devuelve la jota a la baraja y esta se vuelve a barajar a fondo, es tan probable que se extraiga una jota como cualquier otra carta. Lo mismo se aplica en cualquier otro proceso en el que los objetos se seleccionan de forma independiente y no se elimina ninguno después de cada evento, como el lanzamiento de un dado, el lanzamiento de una moneda o la mayoría de los esquemas de selección de números de lotería . Los procesos verdaderamente aleatorios como estos no tienen memoria, lo que hace imposible que los resultados pasados afecten a los resultados futuros. De hecho, no existe un número finito de ensayos que pueda garantizar el éxito.
En una secuencia aleatoria de números, se puede decir que un número está maldito porque ha salido con menos frecuencia en el pasado y, por lo tanto, se cree que aparecerá con menos frecuencia en el futuro. Se puede suponer que un número está bendecido porque ha salido con más frecuencia que otros en el pasado y, por lo tanto, se cree que es probable que aparezca con más frecuencia en el futuro. Esta lógica es válida solo si la aleatorización puede estar sesgada; por ejemplo, si se sospecha que un dado está cargado, el hecho de que no salgan suficientes seises sería evidencia de que está cargado. Si se sabe que el dado es justo, las tiradas anteriores no pueden dar ninguna indicación de eventos futuros.
En la naturaleza, los eventos rara vez ocurren con una frecuencia conocida a priori , por lo que tiene sentido observar los resultados para determinar qué eventos son más probables. Sin embargo, es erróneo aplicar esta lógica a sistemas diseñados y conocidos para que todos los resultados sean igualmente probables, como las cartas mezcladas, los dados y las ruletas.
Al principio de un escenario, se puede calcular la probabilidad de un determinado evento. Sin embargo, tan pronto como se obtenga más información sobre el escenario, es posible que sea necesario volver a calcular la probabilidad en consecuencia.
Por ejemplo, si nos dicen que una mujer tiene dos hijos, podríamos estar interesados en saber si alguno de ellos es niña y, en caso afirmativo, cuál es la probabilidad de que el otro hijo también sea niña. Si consideramos los dos eventos de forma independiente, podríamos esperar que la probabilidad de que el otro hijo sea niña sea de ½ (50 %), pero si construimos un espacio de probabilidad que ilustre todos los resultados posibles, nos daríamos cuenta de que la probabilidad es en realidad de solo ⅓ (33 %).
Sin duda, el espacio de probabilidad ilustra cuatro formas de tener estos dos hijos: niño-niño, niña-niño, niño-niña y niña-niña. Pero una vez que se sabe que al menos uno de los hijos es niña, se descarta el escenario niño-niño, y quedan solo tres formas de tener los dos hijos: niño-niña, niña-niño, niña-niña. De esto se desprende que solo en ⅓ de estos escenarios el otro hijo también sería niña [28] (véase la paradoja del niño o la niña para más información).
En general, al utilizar un espacio de probabilidad, es menos probable que se pasen por alto posibles escenarios o que se descuide la importancia de la nueva información. Esta técnica se puede utilizar para proporcionar información en otras situaciones, como el problema de Monty Hall , un escenario de un concurso en el que un coche está escondido detrás de una de tres puertas y dos cabras están escondidas como premios de consolación detrás de las otras. Una vez que el concursante ha elegido una puerta, el anfitrión abre una de las puertas restantes para revelar una cabra, eliminando esa puerta como opción. Con solo dos puertas restantes (una con el coche, la otra con otra cabra), el jugador debe decidir si mantiene su decisión o cambia y selecciona la otra puerta. Intuitivamente, uno podría pensar que el jugador está eligiendo entre dos puertas con la misma probabilidad y que la oportunidad de elegir otra puerta no hace ninguna diferencia. Sin embargo, un análisis de los espacios de probabilidad revelaría que el concursante ha recibido nueva información y que cambiar a la otra puerta aumentaría sus posibilidades de ganar. [28]
La distribución de las pecas parece completamente aleatoria y no asociada con ninguna otra característica anatómica o fisiológica claramente puntuada de la piel.