Clasificador lineal

En el campo del aprendizaje automático , el objetivo de la clasificación estadística es utilizar las características de un objeto para identificar a qué clase (o grupo) pertenece. Un clasificador lineal logra esto tomando una decisión de clasificación basada en el valor de una combinación lineal de las características. Las características de un objeto también se conocen como valores de características y normalmente se presentan a la máquina en un vector llamado vector de características . Dichos clasificadores funcionan bien para problemas prácticos como la clasificación de documentos y, en general, para problemas con muchas variables ( características), alcanzando niveles de precisión comparables a los de los clasificadores no lineales con menos tiempo de entrenamiento y uso. ^[1]

Si el vector de características de entrada al clasificador es un vector real , entonces la puntuación de salida es ${\ Displaystyle {\ vec {x}}}$

donde es un vector real de pesos yf es una función que convierte el producto escalar de los dos vectores en la salida deseada. (En otras palabras, es un mapeo funcional lineal o de una forma en R ). El vector de peso se aprende a partir de un conjunto de muestras de entrenamiento etiquetadas. A menudo, f es una función de umbral , que asigna todos los valores por encima de cierto umbral a la primera clase y todos los demás valores a la segunda clase; p.ej, ${\ Displaystyle {\ vec {w}}}$ ${\ Displaystyle {\ vec {w}}}$ ${\ Displaystyle {\ vec {x}}}$ ${\ Displaystyle {\ vec {w}}}$ ${\ Displaystyle {\ vec {w}} \ cdot {\ vec {x}}}$

El superíndice T indica la transposición y es un umbral escalar. Una f más compleja podría dar la probabilidad de que un artículo pertenezca a una determinada clase. ${\ Displaystyle \ theta}$

Para un problema de clasificación de dos clases, se puede visualizar la operación de un clasificador lineal como dividir un espacio de entrada de alta dimensión con un hiperplano : todos los puntos en un lado del hiperplano se clasifican como "sí", mientras que los otros se clasifican como "No".

Un clasificador lineal se usa a menudo en situaciones donde la velocidad de clasificación es un problema, ya que a menudo es el clasificador más rápido, especialmente cuando es escaso. Además, los clasificadores lineales a menudo funcionan muy bien cuando el número de dimensiones en es grande, como en la clasificación de documentos , donde cada elemento es típicamente el número de apariciones de una palabra en un documento (ver matriz documento-término ). En tales casos, el clasificador debe estar bien regularizado . ${\ Displaystyle {\ vec {x}}}$ ${\ Displaystyle {\ vec {x}}}$ ${\ Displaystyle {\ vec {x}}}$

En este caso, los puntos sólidos y vacíos pueden clasificarse correctamente mediante cualquier número de clasificadores lineales. H1 (azul) los clasifica correctamente, al igual que H2 (rojo). H2 podría considerarse "mejor" en el sentido de que también está más alejado de ambos grupos. H3 (verde) no clasifica correctamente los puntos.