Tasa de error de Bayes

En la clasificación estadística , la tasa de error de Bayes es la tasa de error más baja posible para cualquier clasificador de un resultado aleatorio (en, por ejemplo, una de dos categorías) y es análoga al error irreducible. ^[1]^[2]

Existen varios enfoques para la estimación de la tasa de error de Bayes. Un método busca obtener límites analíticos que son inherentemente dependientes de los parámetros de distribución y, por lo tanto, difíciles de estimar. Otro enfoque se centra en las densidades de clases, mientras que otro método combina y compara varios clasificadores. ^[2]

La tasa de error de Bayes encuentra un uso importante en el estudio de patrones y técnicas de aprendizaje automático . ^[3]

Determinación de errores

En términos de aprendizaje automático y clasificación de patrones, las etiquetas de un conjunto de observaciones aleatorias se pueden dividir en 2 o más clases. Cada observación se denomina instancia y la clase a la que pertenece es la etiqueta .

La tasa de error de Bayes de la distribución de datos es la probabilidad de que una instancia sea clasificada erróneamente por un clasificador que conoce las verdaderas probabilidades de clase dados los predictores.

Para un clasificador multiclase , el error de predicción esperado se puede calcular de la siguiente manera: ^[3]

{\ Displaystyle EPE = E_ {x} \ sum _ {k = 1} ^ {K} L (C_ {k}, {\ hat {C}} (x)) P (C_ {k} | x)}

donde x es la instancia, C _k es una clase en la que se clasifica una instancia, P (C _k | x) es la probabilidad condicional de la etiqueta k, por ejemplo x , y '' L () '' es la pérdida 0-1 función.

Cuando el alumno conoce la probabilidad condicional, entonces una solución es:

{\ Displaystyle {\ hat {C}} (x) = \ arg \ max _ {k \ in \ {1 ... K \}} P (C_ {k} | X = x)}

Esta solución se conoce como clasificador de Bayes. El error de predicción esperado correspondiente se denomina tasa de Bayes:

{\ Displaystyle BE = E_ {x} \ sum _ {k = 1, \ k \ neq {\ hat {C}} (x)} ^ {K} P (C_ {k} | x)}

El error de Bayes es distinto de cero si las etiquetas de clasificación no son deterministas, es decir, hay una probabilidad distinta de cero de que una instancia determinada pertenezca a más de una clase. ^{[ cita requerida ]} . En un contexto de regresión con error al cuadrado, el error de Bayes es igual a la varianza del ruido ^[3] .

Prueba de minimidad

La prueba de que la tasa de error de Bayes es de hecho la mínima posible y que, por tanto, el clasificador de Bayes es óptimo, se pueden encontrar juntos en la página de Wikipedia del clasificador de Bayes .

Ver también

Clasificador ingenuo de Bayes

Referencias

^ Fukunaga, Keinosuke (1990). Introducción al reconocimiento estadístico de patrones . págs. 3, 97. ISBN 0122698517.
^ ^a ^b K. Tumer, K. (1996) "Estimación de la tasa de error de Bayes mediante la combinación de clasificadores" en Actas de la 13ª Conferencia Internacional sobre el reconocimiento de patrones , volumen 2, 695-699
^ ^a ^b ^c Hastie, Trevor (2009). Los elementos del aprendizaje estadístico (2ª ed.). https://web.stanford.edu/~hastie/ElemStatLearn/ : Springer. pag. 21 . ISBN 978-0387848570.

Este artículo relacionado con las estadísticas es un resumen . Puedes ayudar a Wikipedia expandiéndolo .

[stat-1] Fukunaga, Keinosuke (1990). Introducción al reconocimiento estadístico de patrones . págs. 3, 97. ISBN 0122698517.

[Tumer-2] K. Tumer, K. (1996) "Estimación de la tasa de error de Bayes mediante la combinación de clasificadores" en Actas de la 13ª Conferencia Internacional sobre el reconocimiento de patrones , volumen 2, 695-699

[ESL-3] Hastie, Trevor (2009). Los elementos del aprendizaje estadístico (2ª ed.). https://web.stanford.edu/~hastie/ElemStatLearn/ : Springer. pag. 21 . ISBN 978-0387848570.

[1]