En estadística , un modelo de urna de Pólya (también conocido como esquema de urna de Pólya o simplemente como urna de Pólya ), que lleva el nombre de George Pólya , es un tipo de modelo estadístico utilizado como un marco de ejercicio mental idealizado , que unifica muchos tratamientos.
En un modelo de urna , los objetos de interés real (como átomos, personas, automóviles, etc.) se representan como bolas de colores en una urna u otro recipiente. En el modelo básico de urna de Pólya, la urna contiene x bolas blancas ey negras; se saca una bola al azar de la urna y se observa su color; luego se devuelve en la urna y se agrega una bola adicional del mismo color a la urna, y se repite el proceso de selección. Las cuestiones de interés son la evolución de la población de urnas y la secuencia de colores de las bolas extraídas.
Esto dota a la urna de una propiedad que se refuerza a sí misma a veces expresada a medida que los ricos se hacen más ricos .
Nótese que en cierto sentido, el modelo de urna de Pólya es el "opuesto" del modelo de muestreo sin reemplazo , donde cada vez que se observa un valor particular, es menos probable que se vuelva a observar, mientras que en un modelo de urna de Pólya, un valor observado es más probable que se vuelva a observar el valor. En ambos modelos, el acto de medir tiene un efecto sobre el resultado de futuras mediciones. (A modo de comparación, cuando se realiza un muestreo con reemplazo , la observación de un valor particular no tiene ningún efecto sobre la probabilidad de que se observe ese valor nuevamente). En un modelo de urna de Pólya, los sucesivos actos de medición a lo largo del tiempo tienen cada vez menos efecto en las mediciones futuras, mientras que en el muestreo sin reemplazo, ocurre lo contrario: después de un cierto número de mediciones de un valor particular, ese valor nunca se volverá a ver.
Una de las razones del interés en este modelo de urna en particular bastante elaborado (es decir, con la duplicación y luego el reemplazo de cada bola extraída) es que proporciona un ejemplo en el que el recuento (inicialmente x negras y y blancas) de bolas en la urna no es oculto, que es capaz de aproximar la correcta actualización de las probabilidades subjetivas adecuadas a un caso diferente en el que se oculta el contenido de la urna original mientras se realiza el muestreo ordinario con reposición (sin el duplicado de bolas de Pólya). Debido al esquema simple de "muestreo con reemplazo" en este segundo caso, el contenido de la urna ahora es estático , pero esta mayor simplicidad se compensa con la suposición de que el contenido de la urna ahora es desconocido para un observador. Se puede realizar un análisis bayesiano de la incertidumbre del observador sobre el contenido inicial de la urna, utilizando una elección particular de distribución previa (conjugada). Específicamente, suponga que un observador sabe que la urna contiene solo bolas idénticas, cada una de color negro o blanco, pero no conoce el número absoluto de bolas presentes, ni la proporción que son de cada color. Suponga que tiene creencias previas sobre estas incógnitas: para él, la distribución de probabilidad del contenido de la urna está bien aproximada por alguna distribución previa para el número total de bolas en la urna, y una distribución previa beta con parámetros (x, y) para la proporción inicial de estos que son negros, siendo esta proporción (para él) considerada aproximadamente independiente del número total. Entonces, el proceso de resultados de una sucesión de extracciones de la urna (con reemplazo pero sin la duplicación) tiene aproximadamente la misma ley de probabilidad que el esquema de Pólya anterior en el que el contenido real de la urna no le estaba oculto. El error de aproximación aquí se relaciona con el hecho de que una urna que contiene un número finito conocido m de bolas, por supuesto, no puede tener una proporción desconocida exactamente distribuida en beta de bolas negras, ya que el dominio de los valores posibles para esa proporción se limita a ser múltiplos de, en lugar de tener plena libertad para asumir cualquier valor en el intervalo unitario continuo, como lo haría una proporción exactamente distribuida en beta. Este relato ligeramente informal se proporciona por motivos de motivación y puede hacerse más preciso matemáticamente.
Este modelo básico de urna de Pólya se ha enriquecido y generalizado de muchas formas.
- Distribución beta-binomial : La distribución del número de sorteos exitosos (ensayos), por ejemplo, número de extracciones de bola blanca, dado extrae de una urna de Pólya.
- Distribución de Dirichlet-multinomial (también conocida como distribución multivariada de Pólya ): La distribución sobre el número de bolas de cada color, dado extrae de una urna Pólya donde hay colores diferentes en lugar de solo dos.
- martingalas , la distribución beta-binomial y la distribución beta : sean w y b el número de bolas blancas y negras inicialmente en la urna, yel número de bolas blancas que hay actualmente en la urna después de n sorteos. Entonces la secuencia de valores por es una versión normalizada de la distribución Beta-binomial . Es una martingala y converge a la distribución beta cuando n → ∞.
- Proceso de Dirichlet , proceso de restaurante chino , urna Hoppe : Imagine un esquema de urna Pólya modificado de la siguiente manera. Empezamos con una urna conbolas negras. Cuando extraemos una bola de la urna, si sacamos una bola negra, devolvemos la bola junto con una nueva bola de un nuevo color no negro generada aleatoriamente a partir de una distribución uniforme sobre un conjunto infinito de colores disponibles, y consideramos el recién generado color para ser el "valor" del sorteo. De lo contrario, vuelva a colocar la bola junto con otra bola del mismo color, como en el esquema de urna estándar de Pólya. Los colores de una secuencia infinita de dibujos de este esquema de urna Pólya modificado siguen un proceso de restaurante chino . Si, en lugar de generar un nuevo color, extraemos un valor aleatorio de una distribución base dada y usamos ese valor para etiquetar la bola, las etiquetas de una secuencia infinita de dibujos siguen un proceso de Dirichlet . [1]
- Modelo de Moran : un modelo de urna utilizado para modelar la deriva genética en la genética de poblaciones teóricas . Esto es muy similar al modelo de urna de Pólya excepto que, además de agregar una nueva bola del mismo color, se saca una bola extraída al azar de la urna. El número de bolas en la urna permanece constante. El muestreo continuo conduce finalmente a una urna con todas las bolas de un color, siendo la probabilidad de que cada color sea la proporción de ese color en la urna original. Hay variantes del modelo de Moran que insisten en que la bola extraída de la urna sea una bola diferente de la originalmente muestreada en ese paso, y variantes que hacen la extracción de una bola inmediatamente después de que la nueva bola se coloca en la urna, de modo que la nueva bola es una de las bolas disponibles para ser removida. Esto hace una pequeña diferencia en el tiempo necesario para alcanzar el estado en el que todas las bolas son del mismo color. El proceso de Moran modela la deriva genética en una población con generaciones superpuestas.
Ver también
Referencias
- ^ Hoppe, Fred (1984). "Urnas tipo Pólya y fórmula de muestreo de Ewens". Revista de Biología Matemática . 20 : 91. doi : 10.1007 / BF00275863 . hdl : 2027,42 / 46944 .
Otras lecturas
- F. Alajaji y T. Fuja, "Un canal de comunicación basado en el contagio", IEEE Transactions on Information Theory, vol. 40, págs. 2035-2041, noviembre de 1994.
- A. Banerjee, P. Burlina y F. Alajaji, "Segmentación y etiquetado de imágenes mediante el modelo de urna Pólya", Transacciones IEEE sobre procesamiento de imágenes, vol. 8, núm. 9, págs. 1243-1253, septiembre de 1999.
Bibliografía
- NL Johnson y S. Kotz, (1977) "Modelos de urnas y su aplicación". John Wiley.
- Hosam Mahmoud, (2008) "Modelos de urnas de Pólya". Chapman y Hall / CRC. ISBN 978-1420059830 .