Teoría del reconocimiento por componentes


La teoría del reconocimiento por componentes , o teoría de los glóbulos rojos , [1] es un proceso propuesto por Irving Biederman en 1987 para explicar el reconocimiento de objetos . Según la teoría de RBC, podemos reconocer objetos separándolos en geones (las partes componentes principales del objeto). Biederman sugirió que los geones se basan en formas tridimensionales básicas (cilindros, conos, etc.) que se pueden ensamblar en varios arreglos para formar un número virtualmente ilimitado de objetos. [2]

La teoría del reconocimiento por componentes sugiere que hay menos de 36 geones que se combinan para crear los objetos que vemos en la vida cotidiana. [3] Por ejemplo, cuando miramos una taza, la dividimos en dos componentes: "cilindro" y "asa". Esto también funciona para objetos más complejos, que a su vez están formados por una mayor cantidad de geones. Luego, los geones percibidos se comparan con objetos en nuestra memoria almacenada para identificar qué es lo que estamos mirando. La teoría propone que cuando miramos objetos buscamos dos componentes importantes.

En su propuesta de RBC, Biederman hace una analogía con la composición del habla y los objetos que ayuda a respaldar su teoría. La idea es que se necesitan alrededor de 44 fonemas individuales o "unidades de sonido" para componer cada palabra en el idioma inglés, y solo se necesitan alrededor de 55 para componer cada palabra en todos los idiomas. Aunque pueden existir pequeñas diferencias entre estos fonemas, todavía hay un número discreto que componen todos los idiomas.

Se puede utilizar un sistema similar para describir cómo se perciben los objetos. Biederman sugiere que de la misma manera que el habla está formada por fonemas, los objetos están formados por geones, y como hay una gran variación de fonemas, también existe una gran variación de geones. Se comprende más fácilmente cómo 36 geones pueden componer la suma de todos los objetos, cuando la suma de todo el lenguaje y el habla humana se compone de solo 55 fonemas.

Uno de los factores más definitorios de la teoría del reconocimiento por componentes es que nos permite reconocer objetos independientemente del ángulo de visión; esto se conoce como invariancia del punto de vista. Se propone que la razón de este efecto son las propiedades de borde invariantes de los geones. [4]

Nuestro conocimiento de estas propiedades significa que cuando vemos un objeto o un geón, podemos percibirlo desde casi cualquier ángulo. Por ejemplo, al ver un ladrillo podremos ver conjuntos horizontales de líneas paralelas y verticales, y al considerar dónde se encuentran estos puntos (co-terminación) podemos percibir el objeto.


Desglose de objetos en geones.