Ley de Benford

Observación de que en muchos conjuntos de datos de la vida real, es probable que el dígito inicial sea pequeño
Una secuencia de barras azules decrecientes sobre un fondo de cuadrícula gris claro
Distribución de los primeros dígitos según la ley de Benford. Cada barra representa un dígito y la altura de la barra es el porcentaje de números que comienzan con ese dígito.
Frecuencia del primer dígito significativo de las constantes físicas graficadas frente a la ley de Benford

La ley de Benford , también conocida como ley de Newcomb-Benford , ley de números anómalos o ley del primer dígito , es una observación que indica que en muchos conjuntos de datos numéricos de la vida real , es probable que el dígito principal sea pequeño. [1] En los conjuntos que obedecen la ley, el número 1 aparece como el dígito significativo principal aproximadamente el 30 % del tiempo, mientras que el 9 aparece como el dígito significativo principal menos del 5 % del tiempo. Los dígitos distribuidos uniformemente aparecerían cada uno aproximadamente el 11,1 % del tiempo. [2] La ley de Benford también hace predicciones sobre la distribución de segundos dígitos, terceros dígitos, combinaciones de dígitos, etc.

El gráfico de la derecha muestra la ley de Benford para la base 10 , uno de los infinitos casos de una ley generalizada con respecto a los números expresados ​​en bases arbitrarias (enteras), que descarta la posibilidad de que el fenómeno pueda ser un artefacto del sistema numérico de base 10. Otras generalizaciones publicadas en 1995 [3] incluyeron afirmaciones análogas tanto para el n -ésimo dígito principal como para la distribución conjunta de los n dígitos principales, lo que lleva a un corolario en el que se demuestra que los dígitos significativos son una cantidad estadísticamente dependiente .

Se ha demostrado que este resultado se aplica a una amplia variedad de conjuntos de datos, incluidas facturas de electricidad, direcciones de calles, precios de acciones, precios de viviendas, números de población, tasas de mortalidad, longitudes de ríos y constantes físicas y matemáticas . [4] Al igual que otros principios generales sobre datos naturales (por ejemplo, el hecho de que muchos conjuntos de datos se aproximan bien mediante una distribución normal ), existen ejemplos ilustrativos y explicaciones que cubren muchos de los casos en los que se aplica la ley de Benford, aunque hay muchos otros casos en los que se aplica la ley de Benford que resisten explicaciones simples. [5] [6] La ley de Benford tiende a ser más precisa cuando los valores se distribuyen en múltiples órdenes de magnitud , especialmente si el proceso que genera los números se describe mediante una ley de potencia (que es común en la naturaleza).

La ley recibe su nombre del físico Frank Benford , quien la enunció en 1938 en un artículo titulado "La ley de los números anómalos", [7] aunque ya había sido enunciada previamente por Simon Newcomb en 1881. [8] [9]

La ley es similar en concepto, aunque no idéntica en distribución, a la ley de Zipf .

Definición

Rectángulo con eje en negrita desplazado en la parte inferior izquierda y líneas de color gris claro que representan logaritmos
Una barra de escala logarítmica . Si se elige una posición x aleatoria de manera uniforme en esta línea numérica, aproximadamente el 30 % de las veces el primer dígito del número será 1.

Se dice que un conjunto de números satisface la ley de Benford si el dígito principal  d ( d  ∈ {1, ..., 9} ) aparece con probabilidad [10]

PAG ( d ) = registro 10 ( d + 1 ) registro 10 ( d ) = registro 10 ( d + 1 d ) = registro 10 ( 1 + 1 d ) . {\displaystyle P(d)=\log _{10}(d+1)-\log _{10}(d)=\log _{10}({\frac {d+1}{d}}\right)=\log _{10}(1+{\frac {1}{d}}\right).}

Los dígitos principales de dicho conjunto tienen la siguiente distribución:

d⁠ ⁠ PAG ( d ) {\estilo de visualización P(d)} Tamaño relativo de ⁠ ⁠ PAG ( d ) {\estilo de visualización P(d)}
130,1%30.1
 
217,6%17.6
 
312,5%12.5
 
49,7%9.7
 
57,9%7.9
 
66,7%6.7
 
75,8%5.8
 
85,1%5.1
 
94,6%4.6
 

La cantidad ⁠ ⁠ PAG ( d ) {\estilo de visualización P(d)} es proporcional al espacio entre d y d  + 1 en una escala logarítmica . Por lo tanto, esta es la distribución esperada si los logaritmos de los números (pero no los números en sí) se distribuyen de manera uniforme y aleatoria .

Por ejemplo, un número x , restringido a estar entre 1 y 10, comienza con el dígito 1 si 1 ≤  x  < 2 , y comienza con el dígito 9 si 9 ≤  x  < 10 . Por lo tanto, x comienza con el dígito 1 si log 1 ≤ log  x  < log 2 , o comienza con 9 si log 9 ≤ log  x  < log 10 . El intervalo [log 1, log 2] es mucho más amplio que el intervalo [log 9, log 10] (0,30 y 0,05 respectivamente); por lo tanto, si log x se distribuye de manera uniforme y aleatoria, es mucho más probable que caiga en el intervalo más amplio que en el intervalo más estrecho, es decir, es más probable que comience con 1 que con 9; las probabilidades son proporcionales a los anchos de los intervalos, lo que da la ecuación anterior (así como la generalización a otras bases además del decimal).

La ley de Benford a veces se enuncia de forma más contundente, afirmando que la parte fraccionaria del logaritmo de los datos suele estar distribuida de manera casi uniforme entre 0 y 1; de aquí se puede derivar la afirmación principal sobre la distribución de los primeros dígitos. [5]

En otras bases

Gráficos de P ( d ) para el dígito inicial d en varias bases. [11] La línea de puntos muestra P ( d ) si la distribución fuera uniforme. (En la imagen SVG, pase el cursor sobre un gráfico para ver el valor de cada punto).

Una extensión de la ley de Benford predice la distribución de los primeros dígitos en otras bases además de la decimal ; de hecho, cualquier base b  ≥ 2 . La forma general es [12]

PAG ( d ) = registro b ( d + 1 ) registro b ( d ) = registro b ( 1 + 1 d ) . {\displaystyle P(d)=\log _{b}(d+1)-\log _{b}(d)=\log _{b}\left(1+{\frac {1}{d}}\right).}

Para los sistemas numéricos b = 2, 1 ( binario y unario ), la ley de Benford es verdadera pero trivial: todos los números binarios y unarios (excepto el 0 o el conjunto vacío) comienzan con el dígito 1. (Por otro lado, la generalización de la ley de Benford al segundo dígito y posteriores no es trivial, incluso para números binarios. [13] )

Ejemplos

Distribución de los primeros dígitos (en %, barras rojas) de la población de los 237 países del mundo en julio de 2010. Los puntos negros indican la distribución prevista por la ley de Benford.

Un examen de una lista de las alturas de las 58 estructuras más altas del mundo por categoría muestra que 1 es, por lejos, el dígito principal más común, independientemente de la unidad de medida (véase "invariancia de escala" a continuación):


Dígito principal
metropieSegún
la ley de Benford
ContarCompartirContarCompartir
12339,7 %1525,9 %30,1 %
21220,7 %813,8 %17,6 %
3610,3 %58,6 %12,5 %
458,6 %712,1 %9,7 %
523,4 %915,5 %7,9 %
658,6 %46,9 %6,7 %
711,7 %35,2 %5,8 %
846,9 %610,3 %5,1 %
900 %11,7 %4,6 %

Otro ejemplo es el dígito principal de 2 n . La secuencia de los primeros 96 dígitos principales (1, 2, 4, 8, 1, 3, 6, 1, 2, 5, 1, 2, 4, 8, 1, 3, 6, 1, ... (secuencia A008952 en la OEIS )) muestra una mayor adherencia a la ley de Benford de lo que se espera para secuencias aleatorias de la misma longitud, porque se deriva de una secuencia geométrica. [14]


Dígito principal
ApariciónSegún
la ley de Benford
ContarCompartir
12930,2 %30,1 %
21717,7 %17,6 %
31212,5 %12,5 %
41010,4 %9,7 %
577,3 %7,9 %
666,3 %6,7 %
755,2 %5,8 %
855,2 %5,1 %
955,2 %4,6 %

Historia

El descubrimiento de la ley de Benford se remonta a 1881, cuando el astrónomo canadiense-estadounidense Simon Newcomb se dio cuenta de que en las tablas de logaritmos las páginas anteriores (que empezaban con 1) estaban mucho más desgastadas que las demás páginas. [8] El resultado publicado por Newcomb es el primer ejemplo conocido de esta observación e incluye también una distribución en el segundo dígito. Newcomb propuso una ley según la cual la probabilidad de que un único número N sea el primer dígito de un número era igual a log( N  + 1) − log( N ).

El fenómeno fue observado nuevamente en 1938 por el físico Frank Benford , [7] quien lo probó en datos de 20 dominios diferentes y se le atribuyó el mérito. Su conjunto de datos incluía las áreas de superficie de 335 ríos, los tamaños de 3259 poblaciones de EE. UU., 104 constantes físicas , 1800 pesos moleculares , 5000 entradas de un manual matemático, 308 números contenidos en un número de Reader's Digest , las direcciones de las primeras 342 personas enumeradas en American Men of Science y 418 tasas de mortalidad. El número total de observaciones utilizadas en el artículo fue de 20 229. Este descubrimiento recibió más tarde el nombre de Benford (lo que lo convierte en un ejemplo de la ley de Stigler ).

En 1995, Ted Hill demostró el resultado sobre distribuciones mixtas que se menciona a continuación. [15] [16]

Explicaciones

La ley de Benford tiende a aplicarse con mayor precisión a datos que abarcan varios órdenes de magnitud . Como regla general, cuanto más órdenes de magnitud cubran los datos de manera uniforme, con mayor precisión se aplicará la ley de Benford. Por ejemplo, se puede esperar que la ley de Benford se aplique a una lista de números que representan las poblaciones de los asentamientos del Reino Unido. Pero si un "asentamiento" se define como un pueblo con una población entre 300 y 999, entonces la ley de Benford no se aplicará. [17] [18]

Consideremos las distribuciones de probabilidad que se muestran a continuación, referenciadas a una escala logarítmica . En cada caso, el área total en rojo es la probabilidad relativa de que el primer dígito sea 1, y el área total en azul es la probabilidad relativa de que el primer dígito sea 8. Para la primera distribución, el tamaño de las áreas de rojo y azul son aproximadamente proporcionales a los anchos de cada barra roja y azul. Por lo tanto, los números extraídos de esta distribución seguirán aproximadamente la ley de Benford. Por otro lado, para la segunda distribución, la relación de las áreas de rojo y azul es muy diferente de la relación de los anchos de cada barra roja y azul. Más bien, las áreas relativas de rojo y azul están determinadas más por las alturas de las barras que por los anchos. En consecuencia, los primeros dígitos de esta distribución no satisfacen en absoluto la ley de Benford. [18]

Distribución de probabilidad amplia del logaritmo de una variable, que se muestra en una escala logarítmica. La ley de Benford se puede ver en el área más grande cubierta por el sombreado rojo (primer dígito uno) en comparación con el azul (primer dígito 8).
Distribución de probabilidad estrecha del logaritmo de una variable, que se muestra en una escala logarítmica. No se cumple la ley de Benford porque la distribución estrecha no cumple los criterios de la ley de Benford.

Por lo tanto, es probable que las distribuciones del mundo real que abarcan varios órdenes de magnitud de manera bastante uniforme (por ejemplo, los precios de la bolsa y las poblaciones de pueblos, ciudades y aldeas) satisfagan la ley de Benford con mucha precisión. Por otro lado, es poco probable que una distribución que se encuentre mayoritariamente o totalmente dentro de un orden de magnitud (por ejemplo, los puntajes de CI o las alturas de los adultos humanos) satisfaga la ley de Benford con mucha precisión, si es que lo hace. [17] [18] Sin embargo, la diferencia entre regímenes aplicables e inaplicables no es un límite nítido: a medida que la distribución se estrecha, las desviaciones de la ley de Benford aumentan gradualmente.

(Esta discusión no es una explicación completa de la ley de Benford, porque no ha explicado por qué se encuentran tan a menudo conjuntos de datos que, cuando se representan gráficamente como una distribución de probabilidad del logaritmo de la variable, son relativamente uniformes en varios órdenes de magnitud. [19] )

Explicación de la entropía de Krieger-Kafri

En 1970, Wolfgang Krieger demostró lo que ahora se denomina el teorema del generador de Krieger. [20] [21] El teorema del generador de Krieger podría considerarse como una justificación de la suposición del modelo de caja y bola de Kafri de que, en una base dada con un número fijo de dígitos 0, 1, ..., n , ..., , el dígito n es equivalente a una caja de Kafri que contiene n bolas que no interactúan. Otros científicos y estadísticos han sugerido explicaciones relacionadas con la entropía [ ¿cuáles? ] para la ley de Benford. [22] [23] [10] [24] B {\estilo de visualización B} B 1 {\estilo de visualización B-1}

Fluctuaciones multiplicativas

Muchos ejemplos del mundo real de la ley de Benford surgen de fluctuaciones multiplicativas. [25] Por ejemplo, si el precio de una acción comienza en $100 y luego cada día se multiplica por un factor elegido aleatoriamente entre 0,99 y 1,01, entonces durante un período extendido la distribución de probabilidad de su precio satisface la ley de Benford con cada vez mayor precisión.

La razón es que el logaritmo del precio de las acciones está experimentando un paseo aleatorio , por lo que con el tiempo su distribución de probabilidad se volverá cada vez más amplia y suave (ver arriba). [25] (Más técnicamente, el teorema del límite central dice que multiplicar cada vez más variables aleatorias creará una distribución log-normal con una varianza cada vez mayor, por lo que eventualmente cubre muchos órdenes de magnitud casi uniformemente). Para estar seguro de un acuerdo aproximado con la ley de Benford, la distribución tiene que ser aproximadamente invariante cuando se amplía por cualquier factor hasta 10; un conjunto de datos distribuidos log-normalmente con amplia dispersión tendría esta propiedad aproximada.

A diferencia de las fluctuaciones multiplicativas, las fluctuaciones aditivas no conducen a la ley de Benford, sino a distribuciones de probabilidad normales (de nuevo por el teorema del límite central ), que no satisfacen la ley de Benford. Por el contrario, el precio hipotético de las acciones descrito anteriormente se puede escribir como el producto de muchas variables aleatorias (es decir, el factor de cambio de precio para cada día), por lo que es probable que cumpla bastante bien la ley de Benford.

Distribuciones de probabilidad múltiples

Anton Formann proporcionó una explicación alternativa al dirigir la atención a la interrelación entre la distribución de los dígitos significativos y la distribución de la variable observada . Demostró en un estudio de simulación que las distribuciones de cola derecha larga de una variable aleatoria son compatibles con la ley de Newcomb-Benford, y que para las distribuciones de la razón de dos variables aleatorias el ajuste generalmente mejora. [26] Para los números extraídos de ciertas distribuciones ( puntuaciones de CI , alturas humanas), la ley de Benford no se cumple porque estas variables obedecen a una distribución normal, que se sabe que no satisface la ley de Benford, [9] ya que las distribuciones normales no pueden abarcar varios órdenes de magnitud y el Significando de sus logaritmos no estará (ni siquiera aproximadamente) distribuido de manera uniforme. Sin embargo, si uno "mezcla" números de esas distribuciones, por ejemplo, tomando números de artículos de periódicos, la ley de Benford reaparece. Esto también se puede demostrar matemáticamente: si uno elige repetidamente "al azar" una distribución de probabilidad (de un conjunto no correlacionado) y luego elige aleatoriamente un número de acuerdo con esa distribución, la lista de números resultante obedecerá la ley de Benford. [15] [27] Se ha propuesto una explicación probabilística similar para la aparición de la ley de Benford en los números de la vida cotidiana al demostrar que surge naturalmente cuando se consideran mezclas de distribuciones uniformes. [28]

Invariancia

En una lista de longitudes, la distribución de los primeros dígitos de los números de la lista puede ser generalmente similar independientemente de si todas las longitudes se expresan en metros, yardas, pies, pulgadas, etc. Lo mismo se aplica a las unidades monetarias.

No siempre es así. Por ejemplo, la altura de los adultos casi siempre empieza con 1 o 2 cuando se mide en metros y casi siempre empieza con 4, 5, 6 o 7 cuando se mide en pies. Pero en una lista de longitudes distribuidas uniformemente en muchos órdenes de magnitud (por ejemplo, una lista de 1000 longitudes mencionadas en artículos científicos que incluye las medidas de moléculas, bacterias, plantas y galaxias), es razonable esperar que la distribución de los primeros dígitos sea la misma sin importar si las longitudes se escriben en metros o en pies.

Cuando la distribución de los primeros dígitos de un conjunto de datos es invariante en escala (independiente de las unidades en que se expresan los datos), siempre viene dada por la ley de Benford. [29] [30]

Por ejemplo, el primer dígito (distinto de cero) de la lista de longitudes antes mencionada debería tener la misma distribución independientemente de que la unidad de medida sea pies o yardas. Pero hay tres pies en una yarda, por lo que la probabilidad de que el primer dígito de una longitud en yardas sea 1 debe ser la misma que la probabilidad de que el primer dígito de una longitud en pies sea 3, 4 o 5; de manera similar, la probabilidad de que el primer dígito de una longitud en yardas sea 2 debe ser la misma que la probabilidad de que el primer dígito de una longitud en pies sea 6, 7 u 8. Al aplicar esto a todas las escalas de medición posibles, se obtiene la distribución logarítmica de la ley de Benford.

La ley de Benford para los primeros dígitos es invariante en la base de los sistemas numéricos. Existen condiciones y pruebas de invariancia de la suma, invariancia inversa e invariancia de la suma y la resta. [31] [32]

Aplicaciones

Detección de fraude contable

En 1972, Hal Varian sugirió que la ley podría utilizarse para detectar posibles fraudes en las listas de datos socioeconómicos presentadas en apoyo de las decisiones de planificación pública. Partiendo de la hipótesis plausible de que las personas que inventan cifras tienden a distribuir sus dígitos de manera bastante uniforme, una simple comparación de la distribución de frecuencias del primer dígito de los datos con la distribución esperada según la ley de Benford debería revelar cualquier resultado anómalo. [33]

Uso en procesos penales

En los Estados Unidos, se han admitido pruebas basadas en la Ley de Benford en casos penales a nivel federal, estatal y local. [34]

Datos electorales

Walter Mebane , politólogo y estadístico de la Universidad de Michigan, fue el primero en aplicar la prueba de la ley de Benford del segundo dígito (prueba 2BL) en la investigación forense electoral . [35] Este análisis se considera un método simple, aunque no infalible, para identificar irregularidades en los resultados electorales. [36] No se ha alcanzado un consenso científico en la literatura para apoyar la aplicabilidad de la ley de Benford a las elecciones. Un estudio de 2011 realizado por los politólogos Joseph Deckert, Mikhail Myagkov y Peter C. Ordeshook argumentó que la ley de Benford es problemática y engañosa como indicador estadístico de fraude electoral. [37] Su método fue criticado por Mebane en una respuesta, aunque estuvo de acuerdo en que hay muchas salvedades para la aplicación de la ley de Benford a los datos electorales. [38]

La ley de Benford se ha utilizado como evidencia de fraude en las elecciones iraníes de 2009. [ 39] Un análisis de Mebane encontró que los segundos dígitos en los recuentos de votos para el presidente Mahmoud Ahmadinejad , el ganador de la elección, tendían a diferir significativamente de las expectativas de la ley de Benford, y que las urnas con muy pocas papeletas inválidas tenían una mayor influencia en los resultados, lo que sugiere un relleno generalizado de las urnas . [40] Otro estudio utilizó simulaciones bootstrap para encontrar que el candidato Mehdi Karroubi recibió casi el doble de recuentos de votos comenzando con el dígito 7 de lo que se esperaría según la ley de Benford, [41] mientras que un análisis de la Universidad de Columbia concluyó que la probabilidad de que una elección justa produzca muy pocos dígitos no adyacentes y las desviaciones sospechosas en las frecuencias del último dígito encontradas en la elección presidencial iraní de 2009 es inferior al 0,5 por ciento. [42] La ley de Benford también se ha aplicado para la auditoría forense y la detección de fraudes en datos de las elecciones para gobernador de California de 2003 , [43] las elecciones presidenciales de los Estados Unidos de 2000 y 2004 , [44] y las elecciones federales alemanas de 2009 ; [45] se encontró que la prueba de la ley de Benford "valía la pena tomarla en serio como una prueba estadística para detectar fraude", aunque "no es sensible a distorsiones que sabemos que afectaron significativamente a muchos votos". [44] [ se necesita más explicación ]

La ley de Benford también se ha aplicado incorrectamente para denunciar fraude electoral. Al aplicar la ley a los resultados electorales de Joe Biden para Chicago , Milwaukee y otras localidades en las elecciones presidenciales de Estados Unidos de 2020 , la distribución del primer dígito no siguió la ley de Benford. La aplicación incorrecta fue el resultado de analizar datos que estaban estrechamente limitados en rango, lo que viola el supuesto inherente a la ley de Benford de que el rango de los datos debe ser grande. La prueba del primer dígito se aplicó a los datos a nivel de distrito, pero debido a que los distritos rara vez reciben más de unos pocos miles de votos o menos de varias docenas, no se puede esperar que se aplique la ley de Benford. Según Mebane, "se entiende ampliamente que los primeros dígitos de los recuentos de votos de los distritos no son útiles para tratar de diagnosticar fraudes electorales". [46] [47]

Datos macroeconómicos

De manera similar, se demostró que los datos macroeconómicos que el gobierno griego comunicó a la Unión Europea antes de ingresar a la eurozona eran probablemente fraudulentos utilizando la ley de Benford, aunque años después de que el país se uniera. [48] [49]

Análisis de dígitos de precios

Los investigadores han utilizado la ley de Benford para detectar patrones de precios psicológicos en un estudio a escala europea sobre los precios de los productos de consumo antes y después de la introducción del euro en 2002. [50] La idea era que, sin precios psicológicos, los dos o tres primeros dígitos del precio de los artículos deberían seguir la ley de Benford. En consecuencia, si la distribución de dígitos se desvía de la ley de Benford (por ejemplo, si hay muchos 9), significa que los comerciantes pueden haber utilizado precios psicológicos.

Cuando el euro sustituyó a las monedas locales en 2002 , durante un breve período de tiempo, el precio de los bienes en euros se convirtió simplemente a partir del precio de los bienes en monedas locales antes de la sustitución. Como es esencialmente imposible utilizar simultáneamente el precio psicológico tanto en los precios en euros como en los precios en moneda local, durante el período de transición, el precio psicológico se vería alterado incluso si solía estar presente. Solo se podrá restablecer una vez que los consumidores se hayan acostumbrado nuevamente a los precios en una moneda única, esta vez en euros.

Como esperaban los investigadores, la distribución del primer dígito del precio siguió la ley de Benford, pero la distribución del segundo y tercer dígito se desvió significativamente de la ley de Benford antes de la introducción, luego se desvió menos durante la introducción y luego se desvió más nuevamente después de la introducción.

Datos del genoma

El número de marcos de lectura abiertos y su relación con el tamaño del genoma difiere entre eucariotas y procariotas : los primeros muestran una relación log-lineal y los segundos una relación lineal. La ley de Benford se ha utilizado para comprobar esta observación y se ha ajustado perfectamente a los datos en ambos casos. [51]

Detección de fraudes científicos

Una prueba de coeficientes de regresión en artículos publicados mostró que concordaban con la ley de Benford. [52] Como grupo de comparación, se pidió a los sujetos que elaboraran estimaciones estadísticas. Los resultados elaborados se ajustaron a la ley de Benford en los primeros dígitos, pero no a la ley de Benford en los segundos dígitos.

Redes de publicaciones académicas

Al comprobar el número de artículos científicos publicados de todos los investigadores registrados en la base de datos nacional de Eslovenia se demostró que se ajustaba firmemente a la ley de Benford. [53] Además, los autores se agruparon por campo científico y las pruebas indican que las ciencias naturales muestran una mayor conformidad que las ciencias sociales.

Pruebas estadísticas

Aunque la prueba de chi-cuadrado se ha utilizado para comprobar el cumplimiento de la ley de Benford, tiene un poder estadístico bajo cuando se utiliza con muestras pequeñas.

La prueba de Kolmogorov-Smirnov y la prueba de Kuiper son más potentes cuando el tamaño de la muestra es pequeño, en particular cuando se utiliza el factor correctivo de Stephens. [54] Estas pruebas pueden ser excesivamente conservadoras cuando se aplican a distribuciones discretas. Los valores para la prueba de Benford han sido generados por Morrow. [55] Los valores críticos de las estadísticas de prueba se muestran a continuación:

Prueba
0,100,050,01
Kuiper1.1911.3211.579
Kolmogorov-Smirnov1.0121.1481.420

Estos valores críticos proporcionan los valores estadísticos de prueba mínimos necesarios para rechazar la hipótesis de cumplimiento de la ley de Benford en los niveles de significancia dados .

Se han publicado dos pruebas alternativas específicas para esta ley: primero, la estadística máx ( m ) [56] viene dada por

metro = norte máximo a = 1 9 { | Pr ( incógnita  tiene FSD = a ) registro 10 ( 1 + 1 a ) | } . {\displaystyle m={\sqrt {N}}\cdot \max _{k=1}^{9}\left\{\left|\Pr \left(X{\text{ tiene FSD}}=k\right)-\log _{10}\left(1+{\frac {1}{k}}\right)\right|\right\}.}

El factor principal no aparece en la fórmula original de Leemis; [56] fue añadido por Morrow en un artículo posterior. [55] norte {\displaystyle {\sqrt {N}}}

En segundo lugar, la estadística de distancia ( d ) [57] viene dada por

d = norte yo = 1 9 [ Pr ( incógnita  tiene FSD = yo ) registro 10 ( 1 + 1 yo ) ] 2 , {\displaystyle d={\sqrt {N\cdot \sum _{l=1}^{9}\left[\Pr \left(X{\text{ tiene FSD}}=l\right)-\log _{10}\left(1+{\frac {1}{l}}\right)\right]^{2}}},}

donde FSD es el primer dígito significativo y N es el tamaño de la muestra. Morrow ha determinado los valores críticos para ambas estadísticas, que se muestran a continuación: [55]

Estadística
0,100,050,01
La m de Leemis0,8510,9671.212
El d de Cho y Gaines1.2121.3301.569

Morrow también ha demostrado que para cualquier variable aleatoria X (con una PDF continua ) dividida por su desviación estándar ( σ ), se puede encontrar algún valor A tal que la probabilidad de la distribución del primer dígito significativo de la variable aleatoria diferirá de la ley de Benford en menos de ε > 0. [55] El valor de A depende del valor de ε y de la distribución de la variable aleatoria. | incógnita / σ | A {\displaystyle |X/\sigma |^{A}}

Se ha propuesto un método de detección de fraude contable basado en bootstrap y regresión. [58]

Si el objetivo es llegar a un acuerdo con la ley de Benford en lugar de un desacuerdo, entonces las pruebas de bondad de ajuste mencionadas anteriormente son inadecuadas. En este caso, se deben aplicar las pruebas específicas de equivalencia . Una distribución empírica se considera equivalente a la ley de Benford si una distancia (por ejemplo, la distancia de variación total o la distancia euclidiana habitual) entre las funciones de masa de probabilidad es suficientemente pequeña. Este método de prueba con aplicación a la ley de Benford se describe en Ostrovski. [59]

Rango de aplicabilidad

Distribuciones que se sabe que obedecen la ley de Benford

Algunas sucesiones de números enteros infinitos conocidas satisfacen de manera demostrable la ley de Benford con exactitud (en el límite asintótico a medida que se incluyen más y más términos de la sucesión). Entre ellas se encuentran los números de Fibonacci , [60] [61] los factoriales , [62] las potencias de 2, [63] [14] y las potencias de casi cualquier otro número. [63]

De la misma manera, algunos procesos continuos satisfacen la ley de Benford de manera exacta (en el límite asintótico a medida que el proceso continúa a través del tiempo). Uno de ellos es un proceso de crecimiento o decrecimiento exponencial : si una cantidad aumenta o disminuye exponencialmente en el tiempo, entonces el porcentaje de tiempo que tiene cada primer dígito satisface la ley de Benford de manera asintótica (es decir, aumenta la precisión a medida que el proceso continúa a través del tiempo).

Distribuciones que se sabe que desobedecen la ley de Benford

Las raíces cuadradas y recíprocas de números naturales sucesivos no obedecen a esta ley. [64] Los números primos en un rango finito siguen una ley de Benford generalizada, que se acerca a la uniformidad a medida que el tamaño del rango se acerca al infinito. [65] Las listas de números de teléfono locales violan la ley de Benford. [66] La ley de Benford es violada por las poblaciones de todos los lugares con una población de al menos 2500 individuos de cinco estados de EE. UU. según los censos de 1960 y 1970, donde solo el 19 % comenzó con el dígito 1, pero el 20 % comenzó con el dígito 2, porque el truncamiento en 2500 introduce sesgo estadístico. [64] Los dígitos terminales en los informes de patología violan la ley de Benford debido al redondeo. [67]

Las distribuciones que no abarcan varios órdenes de magnitud no seguirán la ley de Benford. Algunos ejemplos son la altura, el peso y los puntajes de CI. [9] [68]

Criterios para distribuciones que se espera y no se espera que obedezcan la ley de Benford

Se han sugerido varios criterios, aplicables particularmente a datos contables, en los casos en que cabe esperar que se aplique la ley de Benford. [69]

Distribuciones que se puede esperar que obedezcan la ley de Benford
  • Cuando la media es mayor que la mediana y la asimetría es positiva
  • Números que resultan de la combinación matemática de números: p. ej. cantidad × precio
  • Datos a nivel de transacción: por ejemplo, desembolsos, ventas
Distribuciones que no se esperaría que obedecieran la ley de Benford
  • Donde los números se asignan secuencialmente: por ejemplo, números de cheques, números de facturas
  • Cuando los números están influenciados por el pensamiento humano: por ejemplo, los precios se establecen mediante umbrales psicológicos ($9,99)
  • Cuentas con una gran cantidad de números específicos de la empresa: por ejemplo, cuentas configuradas para registrar reembolsos de $100
  • Cuentas con un mínimo o máximo incorporado
  • Distribuciones que no abarcan un orden de magnitud de números.

Teorema de cumplimiento de la ley de Benford

Matemáticamente, la ley de Benford se aplica si la distribución que se está probando se ajusta al "teorema de cumplimiento de la ley de Benford". [17] La ​​derivación dice que la ley de Benford se cumple si la transformada de Fourier del logaritmo de la función de densidad de probabilidad es cero para todos los valores enteros. En particular, esto se cumple si la transformada de Fourier es cero (o despreciable) para n  ≥ 1. Esto se cumple si la distribución es amplia (ya que una distribución amplia implica una transformada de Fourier estrecha). Smith resume así (p. 716):

La ley de Benford se cumple en distribuciones que son amplias en comparación con la unidad de distancia a lo largo de la escala logarítmica. Del mismo modo, la ley no se cumple en distribuciones que son estrechas en comparación con la unidad de distancia... Si la distribución es amplia en comparación con la unidad de distancia en el eje logarítmico, significa que la dispersión en el conjunto de números que se examina es mucho mayor que diez.

En resumen, la ley de Benford requiere que los números en la distribución que se mide tengan una dispersión de al menos un orden de magnitud.

Pruebas con distribuciones comunes

La ley de Benford fue probada empíricamente contra los números (hasta el décimo dígito) generados por una serie de distribuciones importantes, incluidas la distribución uniforme , la distribución exponencial , la distribución normal y otras. [9]

Como era de esperar, la distribución uniforme no obedece a la ley de Benford. En cambio, la distribución de proporciones de dos distribuciones uniformes está bien descrita por la ley de Benford.

Ni la distribución normal ni la distribución de razón de dos distribuciones normales ( distribución de Cauchy ) obedecen la ley de Benford. Aunque la distribución seminormal no obedece la ley de Benford, la distribución de razón de dos distribuciones seminormales sí lo hace. Ni la distribución normal truncada por la derecha ni la distribución de razón de dos distribuciones normales truncadas por la derecha están bien descritas por la ley de Benford. Esto no es sorprendente ya que esta distribución está ponderada hacia números mayores.

La ley de Benford también describe bien la distribución exponencial y la distribución de razón de dos distribuciones exponenciales. El ajuste de la distribución de chi-cuadrado depende de los grados de libertad (gl), con una buena concordancia con gl = 1 y una concordancia decreciente a medida que los gl aumentan. La distribución F se ajusta bien para grados de libertad bajos. Con gl crecientes, el ajuste disminuye, pero mucho más lentamente que la distribución de chi-cuadrado. El ajuste de la distribución log-normal depende de la media y la varianza de la distribución. La varianza tiene un efecto mucho mayor en el ajuste que la media. Valores mayores de ambos parámetros dan como resultado una mejor concordancia con la ley. La razón de dos distribuciones log-normales es una log-normal, por lo que no se examinó esta distribución.

Otras distribuciones que se han examinado incluyen la distribución de Muth, la distribución de Gompertz , la distribución de Weibull , la distribución gamma , la distribución log-logística y la distribución de potencia exponencial , todas las cuales muestran un acuerdo razonable con la ley. [56] [70] La distribución de Gumbel (una densidad que aumenta con el aumento del valor de la variable aleatoria) no muestra acuerdo con esta ley. [70]

Generalización a dígitos más allá del primero

Gráfico logarítmico-logarítmico de la probabilidad de que un número comience con el dígito n , para una distribución que satisface la ley de Benford. Los puntos muestran la fórmula exacta, P ( n ) = log 10 (1 + 1/ n ). El gráfico tiende hacia la asíntota discontinua que pasa por (1, log 10  e ) con pendiente −1 en escala logarítmica-logarítmica. El ejemplo en amarillo muestra que la probabilidad de que un número comience con 314 es de alrededor de 0,00138. Las líneas punteadas muestran las probabilidades de una distribución uniforme para comparación. (En la imagen SVG , pase el cursor sobre un punto para ver sus valores).

Es posible extender la ley a dígitos más allá del primero. [71] En particular, para cualquier número dado de dígitos, la probabilidad de encontrar un número que comience con la cadena de dígitos n de esa longitud (descartando los ceros iniciales) está dada por

registro 10 ( norte + 1 ) registro 10 ( norte ) = registro 10 ( 1 + 1 norte ) . {\displaystyle \log _{10}(n+1)-\log _{10}(n)=\log _{10}\left(1+{\frac {1}{n}}\right).}

Por lo tanto, la probabilidad de que un número comience con los dígitos 3, 1, 4 (algunos ejemplos son 3,14, 3,142, π , 314280,7 y 0,00314005) es log 10 (1 + 1/314) ≈ 0,00138 , como en el cuadro con el gráfico logarítmico a la derecha.  

Este resultado se puede utilizar para hallar la probabilidad de que un dígito en particular aparezca en una posición dada dentro de un número. Por ejemplo, la probabilidad de que aparezca un "2" como segundo dígito es [71]

registro 10 ( 1 + 1 12 ) + registro 10 ( 1 + 1 22 ) + + registro 10 ( 1 + 1 92 ) 0,109. {\displaystyle \log _{10}\left(1+{\frac {1}{12}}\right)+\log _{10}\left(1+{\frac {1}{22}}\right)+\cdots +\log _{10}\left(1+{\frac {1}{92}}\right)\approx 0,109.}

Y la probabilidad de que d ( d  = 0, 1, ..., 9) se encuentre como el n -ésimo ( n  > 1) dígito es

a = 10 norte 2 10 norte 1 1 registro 10 ( 1 + 1 10 a + d ) . {\displaystyle \sum_{k=10^{n-2}}^{10^{n-1}-1}\log_{10}\left(1+{\frac {1}{10k+d}}\right).}

La distribución del n -ésimo dígito, a medida que n aumenta, se aproxima rápidamente a una distribución uniforme con un 10% para cada uno de los diez dígitos, como se muestra a continuación. [71] Cuatro dígitos suelen ser suficientes para suponer una distribución uniforme del 10%, ya que "0" aparece el 10,0176% del tiempo en el cuarto dígito, mientras que "9" aparece el 9,9824% del tiempo.

Dígito0123456789
30,1%17,6%12,5%9,7%7,9%6,7%5,8%5,1%4,6%
2do12,0%11,4%10,9%10,4%10,0%9,7%9,3%9.0%8,8%8,5%
10,2%10,1%10,1%10,1%10,0%10,0%9,9%9,9%9,9%9,8%

Momentos

Se han calculado los promedios y momentos de variables aleatorias para los dígitos 1 a 9 siguiendo esta ley: [72]

Para la distribución de dos dígitos según la ley de Benford también se conocen estos valores: [73]

Está disponible una tabla de las probabilidades exactas para la ocurrencia conjunta de los dos primeros dígitos según la ley de Benford, [73] así como la correlación poblacional entre el primer y el segundo dígito: [73] ρ = 0,0561 .

La ley de Benford ha aparecido como un recurso argumental en algunos programas de entretenimiento popular del siglo XXI.

  • El drama policial televisivo NUMB3RS utilizó la ley de Benford en el episodio de 2006 "The Running Man" para ayudar a resolver una serie de robos. [30]
  • La película de 2016 The Accountant se basó en la ley de Benford para exponer el robo de fondos de una empresa de robótica.
  • La serie de Netflix de 2017, Ozark, utilizó la ley de Benford para analizar los estados financieros de un miembro del cártel y descubrir un fraude.
  • La novela Infinite 2 de Jeremy Robinson de 2021 aplicó la ley de Benford para probar si los personajes están en una simulación o en la realidad.
  • En la novela Tom Clancy Point of Contact de Mike Maiden, Paul Brown (contador forense en Hendley Associates) explica la ley de Benford a Jack Ryan Jr. cuando discuten métodos para descubrir fraudes en los libros de contabilidad.

Véase también

Referencias

  1. ^ Arno Berger y Theodore P. Hill, La ley de Benford contraataca: No hay una explicación sencilla a la vista para esta joya matemática, 2011.
  2. ^ Weisstein, Eric W. "Ley de Benford". MathWorld, un recurso web de Wolfram . Consultado el 7 de junio de 2015 .
  3. ^ Hill, Theodore (1995). "Una derivación estadística de la ley del dígito significativo". Ciencia estadística . 10 (4). doi : 10.1214/ss/1177009869 .
  4. ^ Paul H. Kvam, Brani Vidakovic, Estadística no paramétrica con aplicaciones a la ciencia y la ingeniería , pág. 158.
  5. ^ ab Berger, Arno; Hill, Theodore P. (30 de junio de 2020). "Las matemáticas de la ley de Benford: una introducción". Stat. Methods Appl . 30 (3): 779–795. arXiv : 1909.07527 . doi :10.1007/s10260-020-00532-8. S2CID  202583554.
  6. ^ Cai, Zhaodong; Faust, Matthew; Hildebrand, AJ; Li, Junxian; Zhang, Yuan (15 de marzo de 2020). "La sorprendente precisión de la ley de Benford en matemáticas". The American Mathematical Monthly . 127 (3): 217–237. arXiv : 1907.08894 . doi :10.1080/00029890.2020.1690387. ISSN  0002-9890. S2CID  198147766.
  7. ^ por Frank Benford (marzo de 1938). "La ley de los números anómalos". Proc. Am. Philos. Soc. 78 (4): 551–572. Bibcode :1938PAPhS..78..551B. JSTOR  984802.
  8. ^ ab Simon Newcomb (1881). "Nota sobre la frecuencia de uso de los diferentes dígitos en los números naturales". American Journal of Mathematics . 4 (1/4): 39–40. Bibcode :1881AmJM....4...39N. doi :10.2307/2369148. JSTOR  2369148. S2CID  124556624.
  9. ^ abcd Formann, AK (2010). Morris, Richard James (ed.). "La ley de Newcomb–Benford en su relación con algunas distribuciones comunes". PLOS ONE . ​​5 (5): e10541. Bibcode :2010PLoSO...510541F. doi : 10.1371/journal.pone.0010541 . PMC 2866333 . PMID  20479878. 
  10. ^ ab Miller, Steven J. , ed. (9 de junio de 2015). Ley de Benford: teoría y aplicaciones. Princeton University Press. pág. 309. ISBN 978-1-4008-6659-5.
  11. ^ Deben ser estrictamente barras, pero se muestran como líneas para mayor claridad.
  12. ^ Pimbley, JM (2014). "La ley de Benford como transformación logarítmica" (PDF) . Maxwell Consulting, LLC . Archivado (PDF) del original el 9 de octubre de 2022 . Consultado el 15 de noviembre de 2020 .
  13. ^ Khosravani, A. (2012). Invariancia de transformación de variables de Benford y su modelado numérico . Investigaciones recientes en control automático y electrónica. pp. 57–61. ISBN 978-1-61804-080-0.
  14. ^ ab Ralph Raimi menciona que las primeras 100 potencias de 2 satisfacen aproximadamente la ley de Benford. Raimi, Ralph A. (1976). "El problema del primer dígito". American Mathematical Monthly . 83 (7): 521–538. doi :10.2307/2319349. JSTOR  2319349.
  15. ^ ab Theodore P. Hill (1995). "Una derivación estadística de la ley del dígito significativo". Ciencia estadística . 10 (4): 354–363. doi : 10.1214/ss/1177009869 . MR  1421567.
  16. ^ Hill, Theodore P. (1995). "La invariancia de la base implica la ley de Benford". Actas de la American Mathematical Society . 123 (3): 887–895. doi : 10.1090/S0002-9939-1995-1233974-8 . ISSN  0002-9939.
  17. ^ abc Steven W. Smith. "Capítulo 34: Explicación de la Ley de Benford. El poder del procesamiento de señales". Guía del científico y el ingeniero para el procesamiento de señales digitales . Consultado el 15 de diciembre de 2012 .
  18. ^ abc Fewster, RM (2009). "Una explicación sencilla de la ley de Benford" (PDF) . The American Statistician . 63 (1): 26–32. CiteSeerX 10.1.1.572.6719 . doi :10.1198/tast.2009.0005. S2CID  39595550. Archivado (PDF) desde el original el 9 de octubre de 2022. 
  19. ^ Arno Berger y Theodore P. Hill, Benford's Law Strikes Back: No Simple Explanation in Sight for Mathematical Gem, 2011. Los autores describen este argumento pero dicen que "aún deja abierta la cuestión de por qué es razonable suponer que el logaritmo de la dispersión, en oposición a la dispersión en sí misma -o, digamos, el logaritmo de la dispersión- debería ser grande" y que "asumir una gran dispersión en una escala logarítmica es equivalente a suponer una conformidad aproximada con [la ley de Benford]" (cursiva añadida), algo que, según ellos, carece de una "explicación simple".
  20. ^ Krieger, Wolfgang (1970). "Sobre la entropía y los generadores de transformaciones que preservan la medida". Transactions of the American Mathematical Society . 149 (2): 453. doi : 10.1090/S0002-9947-1970-0259068-3 . ISSN  0002-9947.
  21. ^ Downarowicz, Tomasz (12 de mayo de 2011). Entropía en sistemas dinámicos. Cambridge University Press. pág. 106. ISBN 978-1-139-50087-6.
  22. ^ Smorodinsky, Meir (1971). "Capítulo IX. Entropía y generadores. Teorema de Krieger". Teoría ergódica, Entropía . Lecture Notes in Mathematics. Vol. 214. Berlín, Heidelberg: Springer. págs. 54–57. doi :10.1007/BFb0066096. ISBN. 978-3-540-05556-3.
  23. ^ Jolion, Jean-Michel (2001). "Imágenes y la ley de Benford". Revista de imágenes y visión matemáticas . 14 (1): 73–81. Bibcode :2001JMIV...14...73J. doi :10.1023/A:1008363415314. ISSN  0924-9907. S2CID  34151059.
  24. ^ Lemons, Don S. (2019). "Termodinámica de la ley del primer dígito de Benford". American Journal of Physics . 87 (10): 787–790. arXiv : 1604.05715 . Código Bibliográfico :2019AmJPh..87..787L. doi :10.1119/1.5116005. ISSN  0002-9505. S2CID  119207367.
  25. ^ ab L. Pietronero; E. Tosatti; V. Tosatti; A. Vespignani (2001). "Explicación de la distribución desigual de números en la naturaleza: las leyes de Benford y Zipf". Physica A . 293 (1–2): 297–304. arXiv : cond-mat/9808305 . Código Bibliográfico :2001PhyA..293..297P. doi :10.1016/S0378-4371(00)00633-6.
  26. ^ Formann, AK (2010). "La ley de Newcomb-Benford en su relación con algunas distribuciones comunes". PLOS ONE . ​​5 (5): e10541. Bibcode :2010PLoSO...510541F. doi : 10.1371/journal.pone.0010541 . PMC 2866333 . PMID  20479878. 
  27. ^ Theodore P. Hill (julio-agosto de 1998). "El fenómeno del primer dígito" (PDF) . American Scientist . 86 (4): 358. Bibcode :1998AmSci..86..358H. doi :10.1511/1998.4.358. S2CID  13553246.
  28. ^ Janvresse, Élise; Thierry (2004). "From Uniform Distributions to Benford's Law" (PDF) . Journal of Applied Probability . 41 (4): 1203–1210. doi :10.1239/jap/1101840566. MR  2122815. Archivado desde el original (PDF) el 4 de marzo de 2016 . Consultado el 13 de agosto de 2015 .
  29. ^ Pinkham, Roger S. (1961). "Sobre la distribución de los primeros dígitos significativos". Ann. Math. Statist . 32 (4): 1223–1230. doi : 10.1214/aoms/1177704862 .
  30. ^ de Weisstein, Eric W. "Ley de Benford". mathworld.wolfram.com .
  31. ^ Jamain, Adrien (septiembre de 2001). «La ley de Benford» (PDF) . Imperial College of London . Archivado (PDF) del original el 9 de octubre de 2022. Consultado el 15 de noviembre de 2020 .
  32. ^ Berger, Arno (junio de 2011). "Una teoría básica de la ley de Benford". Probability Surveys . 8 (2011): 1–126.
  33. ^ Varian, Hal (1972). "Ley de Benford (Cartas al editor)". The American Statistician . 26 (3): 65. doi :10.1080/00031305.1972.10478934.
  34. ^ "De Benford a Erdös". Radio Lab . Episodio del 9 de octubre de 2009. 30 de septiembre de 2009.
  35. ^ Walter R. Mebane, Jr., "Análisis forense electoral: recuentos de votos y ley de Benford" (18 de julio de 2006).
  36. ^ "Análisis forense electoral", The Economist (22 de febrero de 2007).
  37. ^ Deckert, Joseph; Myagkov, Mikhail; Ordeshook, Peter C. (2011). "La ley de Benford y la detección del fraude electoral". Análisis político . 19 (3): 245–268. doi : 10.1093/pan/mpr014 . ISSN  1047-1987.
  38. ^ Mebane, Walter R. (2011). "Comentario sobre la "Ley de Benford y la detección del fraude electoral"". Análisis político . 19 (3): 269–272. doi : 10.1093/pan/mpr024 .
  39. ^ Stephen Battersby Las estadísticas apuntan a un fraude en las elecciones iraníes New Scientist 24 de junio de 2009
  40. ^ Walter R. Mebane, Jr., "Nota sobre las elecciones presidenciales en Irán, junio de 2009" (Universidad de Michigan, 29 de junio de 2009), págs. 22-23.
  41. ^ Roukema, Boudewijn F. (2014). "Una anomalía de primer dígito en las elecciones presidenciales iraníes de 2009". Revista de Estadística Aplicada . 41 : 164–199. arXiv : 0906.2789 . Código Bibliográfico :2014JApS...41..164R. doi :10.1080/02664763.2013.838664. S2CID  88519550.
  42. ^ Bernd Beber y Alexandra Scacco, "El diablo está en los dígitos: evidencia de que las elecciones en Irán fueron manipuladas", The Washington Post (20 de junio de 2009).
  43. ^ Mark J. Nigrini, Ley de Benford: aplicaciones para contabilidad forense, auditoría y detección de fraudes (Hoboken, Nueva Jersey: Wiley, 2012), págs. 132-135.
  44. ^ de Walter R. Mebane, Jr., "Análisis forense electoral: la prueba de la ley de Benford del segundo dígito y las recientes elecciones presidenciales estadounidenses" en Fraude electoral: detección y disuasión de la manipulación electoral , editado por R. Michael Alvarez et al. (Washington, DC: Brookings Institution Press, 2008), págs. 162-81. PDF
  45. ^ Shikano, Susumu; Mack, Verena (2011). "¿Cuándo la prueba legal de Benford de segundo dígito indica un fraude electoral? Hechos o resultados de prueba engañosos". Jahrbücher für Nationalökonomie und Statistik . 231 (5–6): 719–732. doi :10.1515/jbnst-2011-5-610. S2CID  153896048.
  46. ^ "Verificación de hechos: la desviación de la Ley de Benford no prueba fraude electoral". Reuters . 10 de noviembre de 2020.
  47. ^ Dacey, James (19 de noviembre de 2020). «La ley de Benford y las elecciones presidenciales estadounidenses de 2020: nada fuera de lo común». Physics World .
  48. ^ William Goodman, Las promesas y las trampas de la ley de Benford, Significance , Royal Statistical Society (junio de 2016), pág. 38.
  49. ^ Goldacre, Ben (16 de septiembre de 2011). "El truco especial que ayuda a identificar estadísticas dudosas". The Guardian . Consultado el 1 de febrero de 2019 .
  50. ^ Sehity, Tarek el; Hoelzl, Erik; Kirchler, Erich (1 de diciembre de 2005). "Evolución de los precios tras un shock nominal: Ley de Benford y fijación psicológica de precios tras la introducción del euro". Revista Internacional de Investigación en Marketing . 22 (4): 471–480. doi :10.1016/j.ijresmar.2005.09.002. S2CID  154273305.
  51. ^ Friar, JL; Goldman, T; Pérez-Mercader, J (2012). "Tamaños del genoma y la distribución de Benford". PLOS ONE . ​​7 (5): e36624. arXiv : 1205.6512 . Bibcode :2012PLoSO...736624F. doi : 10.1371/journal.pone.0036624 . PMC 3356352 . PMID  22629319. 
  52. ^ Diekmann, A (2007). "¡No es el primer dígito! Uso de la ley de Benford para detectar datos científicos fraudulentos". J Appl Stat . 34 (3): 321–329. Bibcode :2007JApSt..34..321D. doi :10.1080/02664760601004940. hdl : 20.500.11850/310246 . S2CID  117402608.
  53. ^ Tošić, Aleksandar; Vičič, Jernej (1 de agosto de 2021). "Uso de la ley de Benford en redes de publicaciones académicas". Revista de Informetría . 15 (3): 101163. doi : 10.1016/j.joi.2021.101163. ISSN  1751-1577.
  54. ^ Stephens, MA (1970). "Uso de las estadísticas de Kolmogorov–Smirnov, Cramér–von Mises y otras relacionadas sin tablas extensas". Journal of the Royal Statistical Society, Serie B . 32 (1): 115–122. doi :10.1111/j.2517-6161.1970.tb00821.x.
  55. ^ abcd Morrow, John (agosto de 2014). Ley de Benford, familias de distribuciones y una base de prueba. Londres, Reino Unido . Consultado el 11 de marzo de 2022 .{{cite book}}: Mantenimiento de CS1: falta la ubicación del editor ( enlace )
  56. ^ abc Leemis, LM; Schmeiser, BW; Evans, DL (2000). "Distribuciones de supervivencia que satisfacen la ley de Benford". The American Statistician . 54 (4): 236–241. doi :10.1080/00031305.2000.10474554. S2CID  122607770.
  57. ^ Cho, WKT; Gaines, BJ (2007). "Rompiendo la ley (Benford): detección de fraude estadístico en la financiación de campañas". The American Statistician . 61 (3): 218–223. doi :10.1198/000313007X223496. S2CID  7938920.
  58. ^ Suh, IS; Headrick, TC; Minaburo, S. (2011). "Una técnica analítica eficaz y eficiente: un procedimiento de regresión bootstrap y la Ley de Benford". J. Forensic & Investigative Accounting . 3 (3).
  59. ^ Ostrovski, Vladimir (mayo de 2017). "Prueba de equivalencia de distribuciones multinomiales". Statistics & Probability Letters . 124 : 77–82. doi :10.1016/j.spl.2017.01.004. S2CID  126293429.
  60. ^ Washington, LC (1981). "Ley de Benford para los números de Fibonacci y Lucas". The Fibonacci Quarterly . 19 (2): 175–177.
  61. ^ Duncan, RL (1967). "Una aplicación de la distribución uniforme a los números de Fibonacci". The Fibonacci Quarterly . 5 : 137–140.
  62. ^ Sarkar, PB (1973). "Una observación sobre los dígitos significativos de los coeficientes binomiales y factoriales". Sankhya B. 35 : 363–364.
  63. ^ ab En general, la secuencia k 1 , k 2 , k 3 , etc., satisface exactamente la ley de Benford, bajo la condición de que log 10 k sea un número irracional . Esta es una consecuencia directa del teorema de equidistribución .
  64. ^ ab Raimi, Ralph A. (agosto–septiembre de 1976). "El problema del primer dígito". American Mathematical Monthly . 83 (7): 521–538. doi :10.2307/2319349. JSTOR  2319349.
  65. ^ Zyga, Lisa; Phys.org. "Nuevo patrón encontrado en números primos". phys.org . Consultado el 23 de enero de 2022 .
  66. ^ Cho, Wendy K. Tam; Gaines, Brian J. (2007). "Rompiendo la ley (Benford): detección de fraude estadístico en la financiación de campañas". The American Statistician . 61 (3): 218–223. doi :10.1198/000313007X223496. ISSN  0003-1305. JSTOR  27643897. S2CID  7938920 . Consultado el 8 de marzo de 2022 .
  67. ^ Beer, Trevor W. (2009). "Preferencia de dígitos terminales: cuidado con la ley de Benford". J. Clin. Pathol. 62 (2): 192. doi :10.1136/jcp.2008.061721. PMID  19181640. S2CID  206987736.
  68. ^ Singleton, Tommie W. (1 de mayo de 2011). "Understanding and Applying Benford's Law", ISACA Journal , Information Systems Audit and Control Association . Consultado el 9 de noviembre de 2020.
  69. ^ Durtschi, C; Hillison, W; Pacini, C (2004). "El uso eficaz de la ley de Benford para ayudar a detectar fraudes en datos contables". J Forensic Accounting . 5 : 17–34.
  70. ^ ab Dümbgen, L; Leuenberger, C (2008). "Límites explícitos para el error de aproximación en la Ley de Benford". Comunicaciones electrónicas en probabilidad . 13 : 99–112. arXiv : 0705.4488 . doi :10.1214/ECP.v13-1358. S2CID  2596996.
  71. ^ abc Hill, Theodore P. (1995). "El fenómeno del dígito significativo". The American Mathematical Monthly . 102 (4): 322–327. doi :10.1080/00029890.1995.11990578. JSTOR  2974952.
  72. ^ Scott, PD; Fasli, M. (2001) "Ley de Benford: una investigación empírica y una explicación novedosa" Archivado el 13 de diciembre de 2014 en Wayback Machine . Informe técnico 349 del CSM, Departamento de Ciencias de la Computación, Univ. Essex
  73. ^ abc Suh, IS; Headrick, TC (2010). "Un análisis comparativo de los procedimientos estadísticos bootstrap versus los tradicionales aplicados al análisis digital basado en la ley de Benford" (PDF) . Journal of Forensic and Investigative Accounting . 2 (2): 144–175. Archivado desde el original (PDF) el 7 de octubre de 2018 . Consultado el 30 de junio de 2012 .

Lectura adicional

  • Arno Berger; Theodore P. Hill (2017). "¿Qué es... la ley de Benford?" (PDF) . Avisos de la AMS . 64 (2): 132–134. doi : 10.1090/noti1477 .
  • Arno Berger y Theodore P. Hill (2015). Introducción a la Ley de Benford . Princeton University Press. ISBN 978-0-691-16306-2.
  • Alex Ely Kossovsky. Ley de Benford: teoría, ley general de cantidades relativas y aplicaciones para la detección de fraudes forenses , 2014, World Scientific Publishing. ISBN 978-981-4583-68-8 . 
  • "Ley de Benford – Wolfram MathWorld". Mathworld.wolfram.com. 14 de junio de 2012. Consultado el 26 de junio de 2012 .
  • Alejandro Gambini; et al. (2012). "Probabilidad de dígitos dividiendo números aleatorios: un enfoque de funciones ψ y ζ" (PDF) . Exposiciones Mathematicae . 30 (4): 223–238. doi : 10.1016/j.exmath.2012.03.001 .
  • Sehity; Hoelzl, Erik; Kirchler, Erich (2005). "Evolución de los precios tras un shock nominal: Ley de Benford y fijación psicológica de precios tras la introducción del euro". Revista Internacional de Investigación en Marketing . 22 (4): 471–480. doi :10.1016/j.ijresmar.2005.09.002. S2CID  154273305.
  • Nicolas Gauvrit; Jean-Paul Delahaye (2011). Dispersión y regularidad implican la ley de Benford... y más . pp. 58–69. arXiv : 0910.1359 . Bibcode :2009arXiv0910.1359G. doi :10.1142/9789814327756_0004. ISBN . 978-9814327756.S2CID88518074  .
  • Bernhard Rauch; Max Göttsche; Gernot Brähler; Stefan Engel (agosto de 2011). "Realidad y ficción en los datos económicos gubernamentales de la UE". Revista económica alemana . 12 (3): 243–255. doi :10.1111/j.1468-0475.2011.00542.x. S2CID  155072460.
  • Wendy Cho y Brian Gaines (agosto de 2007). "Rompiendo la ley (Benford): detección de fraude estadístico en la financiación de campañas". The American Statistician . 61 (3): 218–223. doi :10.1198/000313007X223496. S2CID  7938920.
  • Geiringer, Hilda ; Furlan, LV (1948). "La ley de la armonía en las estadísticas: una investigación de la interdependencia métrica de los fenómenos sociales. por LV Furlan". Revista de la Asociación Estadounidense de Estadística . 43 (242): 325–328. doi :10.2307/2280379. JSTOR  2280379.
  • Bibliografía en línea de Benford, una base de datos bibliográfica en línea sobre la ley de Benford.
  • Probando la Ley de Benford Un proyecto de código abierto que muestra la Ley de Benford en acción contra conjuntos de datos disponibles públicamente.
  • Benford, Frank (1938). "La ley de los números anómalos". Actas de la American Philosophical Society . 78 (4): 551–572. Código Bibliográfico :1938PAPhS..78..551B. ISSN  0003-049X. JSTOR  984802.- Publicación original de Benford
Obtenido de "https://es.wikipedia.org/w/index.php?title=Ley_de_Benford&oldid=1253182442"