Estadísticas no paramétricas


La estadística no paramétrica es la rama de la estadística que no se basa únicamente en familias parametrizadas de distribuciones de probabilidad (ejemplos comunes de parámetros son la media y la varianza). Las estadísticas no paramétricas se basan en no tener distribución o en tener una distribución específica pero con los parámetros de la distribución sin especificar. La estadística no paramétrica incluye tanto la estadística descriptiva como la inferencia estadística . Las pruebas no paramétricas se utilizan a menudo cuando se violan los supuestos de las pruebas paramétricas. [1]

El término "estadísticas no paramétricas" se ha definido de manera imprecisa de las dos formas siguientes, entre otras.

Las hipótesis estadísticas se refieren al comportamiento de las variables aleatorias observables ... Por ejemplo, la hipótesis (a) de que una distribución normal tiene una media y una varianza específicas es estadística; también lo es la hipótesis (b) de que tiene una media dada pero una varianza no especificada; también lo es la hipótesis (c) de que una distribución es de forma normal con media y varianza sin especificar; finalmente, también lo es la hipótesis (d) de que dos distribuciones continuas no especificadas son idénticas.

Se habrá notado que en los ejemplos (a) y (b) la distribución subyacente a las observaciones se consideró de cierta forma (la normal) y la hipótesis se refería enteramente al valor de uno o ambos de sus parámetros. Tal hipótesis, por razones obvias, se llama paramétrica .

La hipótesis (c) era de naturaleza diferente, ya que no se especifican valores de parámetro en el enunciado de la hipótesis; razonablemente podríamos llamar a tal hipótesis no paramétrica . La hipótesis (d) tampoco es paramétrica pero, además, ni siquiera especifica la forma subyacente de la distribución y ahora puede denominarse razonablemente libre de distribución . A pesar de estas distinciones, la literatura estadística ahora comúnmente aplica la etiqueta "no paramétrico" a los procedimientos de prueba que acabamos de denominar "sin distribución", perdiendo así una clasificación útil.

Los métodos no paramétricos se utilizan ampliamente para estudiar poblaciones que toman un orden de clasificación (como críticas de películas que reciben de una a cuatro estrellas). El uso de métodos no paramétricos puede ser necesario cuando los datos tienen una clasificación pero no tienen una interpretación numérica clara , como cuando se evalúan las preferencias . En términos de niveles de medición , los métodos no paramétricos dan como resultado datos ordinales .