En teoría de probabilidad y estadística , la ley de Zipf-Mandelbrot es una distribución de probabilidad discreta . También conocida como ley de Pareto- Zipf, es una distribución de ley de potencias sobre datos clasificados , que lleva el nombre del lingüista George Kingsley Zipf, quien sugirió una distribución más simple llamada ley de Zipf , y del matemático Benoit Mandelbrot , quien posteriormente la generalizó.
Parámetros | ( entero ) ( real ) ( real ) | ||
---|---|---|---|
Apoyo | |||
PMF | |||
CDF | |||
Significar | |||
Modo | |||
Entropía |
La función de masa de probabilidad viene dada por:
dónde es dado por:
que puede considerarse como una generalización de un número armónico . En la fórmula, es el rango de los datos, y y son parámetros de la distribución. En el limite comose acerca al infinito, esto se convierte en la función zeta de Hurwitz . Para finito y la ley de Zipf-Mandelbrot se convierte en la ley de Zipf . Por infinito y se convierte en una distribución Zeta .
Aplicaciones
La distribución de palabras clasificadas por su frecuencia en un corpus de texto aleatorio se aproxima mediante una distribución de ley de potencia , conocida como ley de Zipf .
Si se grafica el rango de frecuencia de las palabras contenidas en un corpus de datos de texto de tamaño moderado versus el número de ocurrencias o frecuencias reales, se obtiene una distribución de ley de potencias , con exponente cercano a uno (pero ver Powers, 1998 y Gelbukh & Sidorov, 2001). La ley de Zipf asume implícitamente un tamaño de vocabulario fijo, pero la serie Armónica con s = 1 no converge, mientras que la generalización de Zipf-Mandelbrot con s > 1 sí. Además, existe evidencia de que la clase cerrada de palabras funcionales que definen un idioma obedece a una distribución Zipf-Mandelbrot con parámetros diferentes de las clases abiertas de palabras contenidas que varían por tema, campo y registro. [1]
En los estudios ecológicos de campo, la distribución de la abundancia relativa (es decir, el gráfico del número de especies observadas en función de su abundancia) a menudo se ajusta a la ley de Zipf-Mandelbrot. [2]
Dentro de la música, muchas métricas para medir la música "agradable" se ajustan a las distribuciones de Zipf-Mandelbrot. [3]
Notas
- ^ Poderes, David MW (1998). "Aplicaciones y explicaciones de la ley de Zipf". Asociación de Lingüística Computacional: 151–160. Parámetro desconocido
|conference=
ignorado ( ayuda );Cite journal requiere|journal=
( ayuda ) - ^ Mouillot, D; Lepretre, A (2000). "Introducción de índices de distribución de abundancia relativa (RAD), estimados a partir de los diagramas de rango-frecuencia (RFD), para evaluar los cambios en la diversidad de la comunidad" . Monitoreo y Evaluación Ambiental . Saltador. 63 (2): 279–295. doi : 10.1023 / A: 1006297211561 . S2CID 102285701 . Consultado el 24 de diciembre de 2008 .
- ^ Manaris, B; Vaughan, D; Wagner, CS; Romero, J; Davis, RB. "Música evolutiva y la ley Zipf-Mandelbrot: desarrollo de funciones de aptitud para la música agradable" . Actas del 1er Taller Europeo sobre Música y Arte Evolutivos (EvoMUSART2003) . 611 .
Referencias
- Mandelbrot, Benoît (1965). "Teoría de la información y psicolingüística". En BB Wolman y E. Nagel (ed.). Psicología científica . Libros básicos. Reimpreso como
- Mandelbrot, Benoît (1968) [1965]. "Teoría de la información y psicolingüística". En RC Oldfield y JC Marchall (ed.). Idioma . Libros de pingüinos.
- Powers, David MW (1998). "Aplicaciones y explicaciones de la ley de Zipf". Asociación de Lingüística Computacional : 151–160. Parámetro desconocido
|conference=
ignorado ( ayuda );Cite journal requiere|journal=
( ayuda ) - Zipf, George Kingsley (1932). Estudios seleccionados del principio de frecuencia relativa en el lenguaje . Cambridge, MA: Harvard University Press.
- Van Droogenbroeck FJ, 'Una reformulación esencial de la ley Zipf-Mandelbrot para resolver las aplicaciones de atribución de autoría según las estadísticas gaussianas' (2019) [1]
enlaces externos
- ZK Silagadze: Citas y la ley de Zipf-Mandelbrot
- NIST: ley de Zipf
- Referencias de W. Li sobre la ley de Zipf
- Gelbukh y Sidorov, 2001: Los coeficientes de las leyes de Zipf y Heaps dependen del idioma
- Biblioteca C ++ para generar desvíos Zipf-Mandelbrot aleatorios.