Aventar (algoritmo)

El algoritmo de aventar ^[1] es una técnica de aprendizaje automático para aprender un clasificador lineal a partir de ejemplos etiquetados. Es muy similar al algoritmo del perceptrón . Sin embargo, el algoritmo de perceptrón usa un esquema de actualización de peso aditivo, mientras que Winnow usa un esquema multiplicativo que le permite funcionar mucho mejor cuando muchas dimensiones son irrelevantes (de ahí su nombre winnow ). Es un algoritmo simple que se adapta bien a datos de alta dimensión. Durante el entrenamiento, se muestra a Winnow una secuencia de ejemplos positivos y negativos. De estos aprende un hiperplano de decisiónque luego se puede usar para etiquetar ejemplos nuevos como positivos o negativos. El algoritmo también se puede utilizar en el entorno de aprendizaje en línea , donde el aprendizaje y la fase de clasificación no están claramente separados.

Algoritmo

El algoritmo básico, Winnow1, es el siguiente. El espacio de instancia es ${\ Displaystyle X = \ {0,1 \} ^ {n}}$ , es decir, cada instancia se describe como un conjunto de características con valor booleano . El algoritmo mantiene pesos no negativos. ${\ Displaystyle w_ {i}}$ por ${\ Displaystyle i \ in \ {1, \ ldots, n \}}$ , que inicialmente se establecen en 1, un peso para cada función. Cuando se le da un ejemplo al alumno ${\ Displaystyle (x_ {1}, \ ldots, x_ {n})}$ , aplica la regla de predicción típica para clasificadores lineales:

Si ${\ Displaystyle \ sum _ {i = 1} ^ {n} w_ {i} x_ {i}> \ Theta}$ , luego predice 1
De lo contrario, predice 0

Aquí ${\ Displaystyle \ Theta}$ es un número real que se llama umbral . Junto con los pesos, el umbral define un hiperplano divisor en el espacio de la instancia. Se obtienen buenos límites si ${\ Displaystyle \ Theta = n / 2}$ (vea abajo).

Para cada ejemplo con el que se presenta, el alumno aplica la siguiente regla de actualización:

Si un ejemplo está clasificado correctamente, no haga nada.
Si un ejemplo se predice incorrectamente y el resultado correcto fue 0, para cada característica ${\ Displaystyle x_ {i} = 1}$ , el peso correspondiente ${\ Displaystyle w_ {i}}$ se establece en 0 (paso de degradación).
${\ Displaystyle \ forall x_ {i} = 1, w_ {i} = 0}$
Si un ejemplo se predice incorrectamente y el resultado correcto fue 1, para cada característica ${\ Displaystyle x_ {i} = 1}$ , el peso correspondiente ${\ Displaystyle w_ {i}}$ multiplicado por $α$ (paso de promoción).
${\ Displaystyle \ forall x_ {i} = 1, w_ {i} = \ alpha w_ {i}}$

Un valor típico de $α$ es 2.

Hay muchas variaciones de este enfoque básico. Winnow2 ^[1] es similar excepto que en el paso de degradación los pesos se dividen por $α en$ lugar de establecerse en 0. Balanced Winnow mantiene dos conjuntos de pesos y, por lo tanto, dos hiperplanos. Luego, esto puede generalizarse para la clasificación de múltiples etiquetas .

Límites de error

En determinadas circunstancias, se puede demostrar que el número de errores que comete Winnow a medida que aprende tiene un límite superior que es independiente del número de instancias con las que se presenta. Si el algoritmo Winnow1 usa ${\ Displaystyle \ alpha> 1}$ y ${\ Displaystyle \ Theta \ geq 1 / \ alpha}$ en una función de destino que es un ${\ Displaystyle k}$ -Disyunción monótona literal dada por ${\ Displaystyle f (x_ {1}, \ ldots, x_ {n}) = x_ {i_ {1}} \ cup \ cdots \ cup x_ {i_ {k}}}$ , entonces, para cualquier secuencia de instancias, el número total de errores está limitado por: ${\ Displaystyle \ alpha k (\ log _ {\ alpha} \ Theta +1) + {\ frac {n} {\ Theta}}}$ . ^[2]

Referencias

↑ ^a ^b Nick Littlestone (1988). "Aprendizaje rápido cuando abundan los atributos irrelevantes: un nuevo algoritmo de umbral lineal", Machine Learning 285–318 (2) .
^ Nick Littlestone (1989). "Límites de error y algoritmos de aprendizaje de umbral lineal logarítmico". Informe técnico UCSC-CRL-89-11, Universidad de California, Santa Cruz.

[littlestone88-1] Nick Littlestone (1988). "Aprendizaje rápido cuando abundan los atributos irrelevantes: un nuevo algoritmo de umbral lineal", Machine Learning 285–318 (2) .

[2] Nick Littlestone (1989). "Límites de error y algoritmos de aprendizaje de umbral lineal logarítmico". Informe técnico UCSC-CRL-89-11, Universidad de California, Santa Cruz.

[1]