La razón Lexis [1] se utiliza en estadística como una medida que busca evaluar las diferencias entre las propiedades estadísticas de los mecanismos aleatorios donde el resultado tiene dos valores, por ejemplo, "éxito" o "fracaso", "ganar" o "perder". . La idea es que la probabilidad de éxito puede variar entre diferentes conjuntos de ensayos en diferentes situaciones. Esta relación no se utiliza mucho en la actualidad y ha sido reemplazada en gran medida por el uso de la prueba de chi-cuadrado en las pruebas de homogeneidad de las muestras.
Esta medida compara la varianza entre conjuntos de las proporciones de la muestra (evaluadas para cada conjunto) con lo que debería ser la varianza si no hubiera diferencia entre las verdaderas proporciones de éxito en los diferentes conjuntos. Por lo tanto, la medida se utiliza para evaluar cómo se comparan los datos con una distribución de Bernoulli de probabilidad fija de éxito . El término "relación Lexis" a veces se denomina L o Q , donde
Dónde es la varianza de la muestra (ponderada) derivada de las proporciones observadas de éxito en conjuntos en "ensayos Lexis" yes la varianza calculada a partir de la distribución de Bernoulli esperada sobre la base de la proporción promedio general de éxito. Los ensayos en los que L cae significativamente por encima o por debajo de 1 se conocen como supernormales y subnormales, respectivamente.
Esta razón (Q) es una medida que se puede utilizar para distinguir entre tres tipos de variación en el muestreo de atributos: Bernoullian, Lexian y Poissonian. La relación Lexis a veces también se hace referencia como L .
Definición
Sea k muestras de tamaño n 1 , n 3 , n 3 , ..., n k y estas muestras tienen la proporción del atributo examinado de p 1 , p 2 , p 3 , ..., p k respectivamente . Entonces la relación Lexis es
Si la relación Lexis es significativamente inferior a 1, el muestreo se denomina Poissoniano (o subnormal); es igual a 1, el muestreo se denomina Bernoulliano (o normal); y si está por encima de 1, se denomina Lexian (o supranormal).
Chuprov demostró en 1922 que en el caso de la homogeneidad estadística
y
donde E () es la expectativa y var () es la varianza. La fórmula de la varianza es aproximada y solo se aplica a valores grandes de n .
Una definición alternativa es
aquí es la varianza de la muestra (ponderada) derivada de las proporciones observadas de éxito en conjuntos en "ensayos Lexis" y es la varianza calculada a partir de la distribución de Bernoulli esperada sobre la base de la proporción promedio general de éxito.
Variación de Lexis
Un concepto estrechamente relacionado es la variación Lexis. Sean k muestras de tamaño n cada una de ellas extraídas al azar. Sea la probabilidad de éxito ( p ) constante y la probabilidad real de éxito en la k- ésima muestra sea p 1 , p 2 , ..., p k .
La probabilidad media de éxito ( p ) es
La variación en el número de éxitos es
donde var ( p i ) es la varianza de p i .
Si todos los p i son iguales, se dice que el muestreo es Bernoulliano; donde los p i difieren, se dice que el muestreo es lexiano y que la dispersión es supranormal.
El muestreo lexiano se produce en el muestreo de estratos no homogéneos.
Historia
Wilhelm Lexis introdujo esta estadística para probar el supuesto entonces comúnmente sostenido de que los datos de muestreo podrían considerarse homogéneos.
Referencias
- ^ Lexis W (1877) Zur Theorie Der Massenerscheinungen en Der Menschlichen Gesellschaft.