- Ley de Benford
-
La ley de Benford, también conocida como la ley del primer dígito, asegura que, en los números que existen en la vida real, la primera cifra es 1 con mucha más frecuencia que el resto de los números. Además, según crece este primer dígito, más improbable es que se encuentre en la primera posición. Esta ley se puede aplicar a hechos relacionados con el mundo natural o con elementos sociales:
- facturas
- artículos en revistas
- direcciones de calles
- precios de acciones
- número de habitantes
- tasas de mortalidad
- longitud de los ríos
- Física
- constantes matemáticas
- números primos[1]
Contenido
Historia
En 1881 el astrónomo y matemático Simon Newcomb observó que las primeras páginas de las tablas de logaritmos estaban manifiestamente más usadas que las finales de lo que dedujo que aparentemente los dígitos iniciales de los números (al menos los utilizados en su trabajo por quienes habían consultado las tablas) no son equiprobables sino que el 1 aparece como dígito inicial más frecuente, seguido del 2, etc. hasta el 9 que es el menos frecuente. En lo sucesivo se considerará el primer dígito no nulo o significativo; p.e. el dígito inicial de 24,8 es 2 y el de 0,034 es 3. Mediante un breve e ingenioso razonamiento, aunque sin presentar realmente un argumento formal ni fórmula matemática, Newcomb enunció verbalmente una relación o ley logarítmica: “la ley de probabilidad de la ocurrencia de números es tal que las mantisas de sus logaritmos son equiprobables” de la que derivó probabilidades para el valor del primer dígito más significativo:
Dígito d P(d) 1 0,301 2 0,176 3 0,125 4 0,097 5 0,079 6 0,067 7 0,058 8 0,051 9 0,046 Obsérvese que como primer dígito no se toma nunca el 0. El resultado más llamativo es el predominio del dígito 1 con una probabilidad del 30% mientras que la del 9 no alcanza el 5%, valores muy distintos al valor equiprobable de (100/9) % que cabría esperar. Es mucho más probable que el primer dígito sea impar (61%) que par (39%).
En 1938 y de manera independiente el físico Frank Benford observó el mismo fenómeno en las tablas de logaritmos y realizó una comprobación empírica sobre un total de 20.229 números agrupados en 20 muestras de gran diversidad: áreas fluviales, constantes y magnitudes físicas y químicas, funciones matemáticas e incluso números de direcciones de personas y tomados de portadas de revistas. A partir de los resultados empíricos Benford postuló una “ley de los números anómalos” para la probabilidad de que el primer dígito sea d. Esta ley logarítmica se conoce como “ley de Benford”
Formulación matemática
Más precisamente la ley de Benford establece que la primera cifra no nula n (n = 1, ..., 9) ocurre con una probabilidad igual a ( log10(n + 1) − log10(n) ), o
Primera cifra Probabilidad 1 30.1 % 2 17.6 % 3 12.5 % 4 9.7 % 5 7.9 % 6 6.7 % 7 5.8 % 8 5.1 % 9 4.6 % Podemos formular una ley para las dos primeras cifras: la probabilidad de que las dos primeras cifras no nulas sean igual a n (n = 10, ..., 99) es igual a ( log10(n+1) − log10(n) ).
De un modo similar se puede enunciar una ley para las tres primeras cifras, para las cuatro primeras cifras, etc.
Así mismo, existe una fórmula general que permite conocer la probabilidad de que un determinado número empiece, por ejemplo, con '325' ó '7234' : P(325)=log(1+1/325) , P(7234)=log(1+1/7234).-
Curiosamente, la anomalía de Newcomb-Benford también se cumple para un mínimo de 200 términos cualesquiera de la Serie de Fibonacci, sea la original (1,2,3,5,8...) o la obtenida a partir de dos enteros semilla elegidos al azar (3,7,10,17,27,44...).
Explicación
El hecho de que la primera cifra sea la cifra 1 con mayor frecuencia que las demás, puede ser entendido si tenemos en cuenta que comenzamos a contar desde 1 (1, 2, 3, ...) hasta llegar al 9, momento en que cada cifra tiene la misma probabilidad. Pero de 10 a 19 sólo tenemos como primera cifra el 1, y sólo cuando llegamos al 99 todos las cifras tendrán la misma probabilidad de nuevo.
Los tipos de muestras que lo cumplen pueden venir de muy diferentes lugares. En general para datos ordinales que en algún momento se acaban (números de casas), la distribución ya es exponencial. Para el número de la última casa de la calle, la distribución también es exponencial así como para los valores de bolsa, y esto es sabido desde el concepto de exponencial. El asunto del primer número es tomar la distribución de la primera década (1-9), que será exponencial, y montar encima el de la primera década pero de un orden superior (10-90), y así consecutivamente. Total que siempre resultarán exponenciales.
Por supuesto, existen listas que no cumplen la dicha ley, pero parece ser que si se toman términos al azar de varias listas no-Benford en número suficiente para formar otra lista heterogénea, esta si tiende a cumplirla, dada una longitud suficiente.
Referencias
- ↑ Bartolo Luque and Lucas LacasaThe first digit frequencies of primes and Riemann zeta zeros Proceedings of the Royal Society A. doi: 10.1098/rspa.2009.0126.
Categorías:- Teoremas de teoría de la información
- Lingüística computacional
- Lingüística cuantitativa
Wikimedia foundation. 2010.