Variables aleatorias independientes e idénticamente distribuidas


En teoría de probabilidad y estadística , una colección de variables aleatorias es independiente e idénticamente distribuida si cada variable aleatoria tiene la misma distribución de probabilidad que las demás y todas son mutuamente independientes . [1] Esta propiedad suele abreviarse como iid o iid o IID . IID se utilizó por primera vez en estadísticas. Con el desarrollo de la ciencia, IID se ha aplicado en diferentes campos, como la minería de datos y el procesamiento de señales.

En estadística, comúnmente tratamos con muestras aleatorias. Una muestra aleatoria se puede considerar como un conjunto de objetos que se eligen al azar. O, más formalmente, es "una secuencia de variables aleatorias independientes, idénticamente distribuidas (IID)".

En otras palabras, los términos muestra aleatoria e IID son básicamente lo mismo. En estadística, generalmente decimos "muestra aleatoria", pero en probabilidad es más común decir "IID".

Las variables aleatorias independientes e idénticamente distribuidas a menudo se utilizan como suposición, lo que tiende a simplificar las matemáticas subyacentes. Sin embargo, en las aplicaciones prácticas de los modelos estadísticos , la suposición puede o no ser realista. [3]

La suposición iid también se usa en el teorema del límite central , que establece que la distribución de probabilidad de la suma (o promedio) de las variables iid con varianza finita se aproxima a una distribución normal . [4]

A menudo, la suposición iid surge en el contexto de secuencias de variables aleatorias. Entonces, "independiente e idénticamente distribuido" implica que un elemento en la secuencia es independiente de las variables aleatorias que lo precedieron. De esta manera, una secuencia iid es diferente de una secuencia de Markov , donde la distribución de probabilidad para la n -ésima variable aleatoria es una función de la variable aleatoria anterior en la secuencia (para una secuencia de Markov de primer orden). Una secuencia iid no implica que las probabilidades de todos los elementos del espacio muestral o espacio de eventos deban ser las mismas. [5] Por ejemplo, los lanzamientos repetidos de dados cargados producirán una secuencia iid, a pesar de que los resultados estén sesgados.