Conocimientos previos para el reconocimiento de patrones

El reconocimiento de patrones es un campo de investigación muy activo íntimamente ligado al aprendizaje automático . También conocido como clasificación o clasificación estadística , el reconocimiento de patrones tiene como objetivo construir un clasificador que pueda determinar la clase de un patrón de entrada. Este procedimiento, conocido como entrenamiento, corresponde al aprendizaje de una función de decisión desconocida basada únicamente en un conjunto de pares de entrada-salida. ${\ displaystyle ({\ boldsymbol {x}} _ {i}, y_ {i})}$ que forman los datos de entrenamiento (o conjunto de entrenamiento). No obstante, en aplicaciones del mundo real como el reconocimiento de caracteres , se suele conocer de antemano cierta cantidad de información sobre el problema. La incorporación de este conocimiento previo a la formación es el elemento clave que permitirá incrementar el rendimiento en muchas aplicaciones.

Conocimiento previo

El conocimiento previo ^{[1] se} refiere a toda la información disponible sobre el problema además de los datos de entrenamiento. Sin embargo, en esta forma más general, determinar un modelo a partir de un conjunto finito de muestras sin conocimiento previo es un problema mal planteado , en el sentido de que puede que no exista un modelo único. Muchos clasificadores incorporan la suposición general de suavidad de que un patrón de prueba similar a una de las muestras de entrenamiento tiende a asignarse a la misma clase.

La importancia del conocimiento previo en el aprendizaje automático se sugiere por su papel en la búsqueda y la optimización. En términos generales, el teorema de no almuerzo gratis establece que todos los algoritmos de búsqueda tienen el mismo rendimiento promedio en todos los problemas y, por lo tanto, implica que para ganar rendimiento en una determinada aplicación se debe utilizar un algoritmo especializado que incluya algunos conocimientos previos sobre el problema.

Los diferentes tipos de conocimientos previos encontrados en el reconocimiento de patrones ahora se reagrupan en dos categorías principales: invariancia de clase y conocimiento sobre los datos.

Invariancia de clase

Un tipo muy común de conocimiento previo en el reconocimiento de patrones es la invariancia de la clase (o la salida del clasificador) a una transformación del patrón de entrada. Este tipo de conocimiento se conoce como transformación-invariancia . Las transformaciones más utilizadas en el reconocimiento de imágenes son:

Incorporando la invariancia a una transformación ${\ Displaystyle T _ {\ theta}: {\ boldsymbol {x}} \ mapsto T _ {\ theta} {\ boldsymbol {x}}}$ parametrizado en ${\ Displaystyle \ theta}$ en un clasificador de salida ${\ displaystyle f ({\ boldsymbol {x}})}$ para un patrón de entrada ${\ displaystyle {\ boldsymbol {x}}}$ corresponde a hacer cumplir la igualdad

{\ displaystyle f ({\ boldsymbol {x}}) = f (T _ {\ theta} {\ boldsymbol {x}}), \ quad \ forall {\ boldsymbol {x}}, \ theta.}

La invariancia local también se puede considerar para una transformación centrada en ${\ Displaystyle \ theta = 0}$ , así que eso ${\ displaystyle T_ {0} {\ boldsymbol {x}} = {\ boldsymbol {x}}}$ , utilizando la restricción

{\ Displaystyle \ left. {\ frac {\ partial} {\ partial \ theta}} \ right | _ {\ theta = 0} f (T _ {\ theta} {\ boldsymbol {x}}) = 0.}

La función ${\ Displaystyle f}$ en estas ecuaciones puede ser la función de decisión del clasificador o su salida de valor real.

Otro enfoque es considerar la invariancia de clase con respecto a un "dominio del espacio de entrada" en lugar de una transformación. En este caso, el problema se convierte en encontrar ${\ Displaystyle f}$ así que eso

{\ Displaystyle f ({\ boldsymbol {x}}) = y _ {\ mathcal {P}}, \ \ forall {\ boldsymbol {x}} \ in {\ mathcal {P}},}

dónde ${\ Displaystyle y _ {\ mathcal {P}}}$ es la clase de membresía de la región ${\ Displaystyle {\ mathcal {P}}}$ del espacio de entrada.

Un tipo diferente de invariancia de clase que se encuentra en el reconocimiento de patrones es la invariancia de permutación , es decir, la invariancia de la clase a una permutación de elementos en una entrada estructurada. Una aplicación típica de este tipo de conocimiento previo es un clasificador invariante a las permutaciones de filas de las entradas de la matriz.

Conocimiento de los datos

Otras formas de conocimiento previo además de la invariancia de clase se refieren a los datos de manera más específica y, por lo tanto, son de particular interés para las aplicaciones del mundo real. Los tres casos particulares que ocurren con mayor frecuencia al recopilar datos son:

Las muestras sin etiqueta están disponibles con supuestas membresías de clase;
Desequilibrio del conjunto de entrenamiento debido a una alta proporción de muestras de una clase;
La calidad de los datos puede variar de una muestra a otra.

El conocimiento previo de estos puede mejorar la calidad del reconocimiento si se incluye en el aprendizaje. Además, no tener en cuenta la mala calidad de algunos datos o un gran desequilibrio entre las clases puede inducir a error a la decisión de un clasificador.

Notas

^ B. Scholkopf y A. Smola, " Aprender con núcleos ", MIT Press 2002.

Referencias

E. Krupka y N. Tishby, " Incorporando conocimientos previos sobre características en el aprendizaje ", Undécima Conferencia Internacional sobre Inteligencia Artificial y Estadísticas (AISTATS 07)

[1] B. Scholkopf y A. Smola, " Aprender con núcleos ", MIT Press 2002.

[1] se