Reconocimiento visual de objetos (prueba con animales)


El reconocimiento de objetos visuales se refiere a la capacidad de identificar los objetos a la vista en función de la información visual. Una firma importante del reconocimiento de objetos visuales es la "invariancia del objeto", o la capacidad de identificar objetos a través de cambios en el contexto detallado en el que se ven los objetos, incluidos los cambios en la iluminación, la pose del objeto y el contexto de fondo. [1]

La evidencia neuropsicológica afirma que hay cuatro etapas específicas identificadas en el proceso de reconocimiento de objetos. [2] [3] [4] Estas etapas son:

Dentro de estas etapas, hay procesos más específicos que tienen lugar para completar los diferentes componentes de procesamiento. Además, otros modelos existentes han propuesto jerarquías integradoras (de arriba hacia abajo y de abajo hacia arriba), así como el procesamiento paralelo, en contraposición a esta jerarquía general de abajo hacia arriba.

El procesamiento de reconocimiento visual se considera típicamente como una jerarquía ascendente en la que la información se procesa secuencialmente con complejidades crecientes. Durante este proceso, los procesadores corticales de nivel inferior, como la corteza visual primaria , se encuentran en la parte inferior de la jerarquía. Los procesadores corticales de nivel superior, como la corteza inferotemporal (TI), se encuentran en la parte superior, donde se facilita el reconocimiento visual. [5] Una teoría jerárquica ascendente altamente reconocida es la descripción de Untangling de James DiCarlo [6]mediante el cual cada etapa de la vía visual ventral ordenada jerárquicamente realiza operaciones para transformar gradualmente las representaciones de objetos en un formato fácilmente extraíble. Por el contrario, una teoría de procesamiento de reconocimiento cada vez más popular es la del procesamiento de arriba hacia abajo. Un modelo, propuesto por Moshe Bar (2003), describe un método de "atajo" en el que las entradas visuales tempranas se envían, parcialmente analizadas, desde la corteza visual temprana a la corteza prefrontal (PFC). Las posibles interpretaciones de la entrada visual cruda se generan en el PFC y luego se envían a la corteza inferotemporal(IT) activando posteriormente representaciones de objetos relevantes que luego se incorporan al proceso ascendente más lento. Este "atajo" está destinado a minimizar el número de representaciones de objetos necesarias para la coincidencia, facilitando así el reconocimiento de objetos. [5] Los estudios de lesiones han respaldado esta propuesta con hallazgos de tiempos de respuesta más lentos para las personas con lesiones de PFC, lo que sugiere el uso únicamente del procesamiento de abajo hacia arriba. [7]

Un aspecto significativo del reconocimiento de objetos es el de la constancia del objeto: la capacidad de reconocer un objeto en diferentes condiciones de visualización. Estas condiciones variables incluyen la orientación del objeto, la iluminación y la variabilidad del objeto (tamaño, color y otras diferencias dentro de la categoría). Para que el sistema visual logre la constancia del objeto, debe poder extraer una similitud en la descripción del objeto a través de diferentes puntos de vista y las descripciones retinianas. [9] Los participantes que realizaron tareas de categorización y reconocimiento mientras se sometían a un magnético funcional encontraron un aumento del flujo sanguíneo que indica la activación en regiones específicas del cerebro. La tarea de categorización consistió en que los participantes colocaran objetos de vistas canónicas o inusuales como objetos interiores o exteriores.La tarea de reconocimiento se produce al presentar a los participantes imágenes que habían visto anteriormente. La mitad de estas imágenes estaban en la misma orientación que se mostró anteriormente, mientras que la otra mitad se presentó en el punto de vista opuesto. Las regiones del cerebro implicadas en la rotación mental, como las vías visuales ventral y dorsal y la corteza prefrontal, mostraron el mayor aumento en el flujo sanguíneo durante estas tareas, demostrando que son críticas para la capacidad de ver objetos desde múltiples ángulos.demostrando que son fundamentales para la capacidad de ver objetos desde múltiples ángulos.demostrando que son fundamentales para la capacidad de ver objetos desde múltiples ángulos.[8] Se han generado varias teorías para proporcionar información sobre cómo se puede lograr la constancia de objetos con el propósito de reconocimiento de objetos, incluidas las teorías de puntos de vista invariantes, dependientes de puntos de vista y múltiples vistas.


Figura 1. Esta imagen, creada en base a la teoría de reconocimiento por componentes de Biederman (1987), es un ejemplo de cómo los objetos se pueden descomponer en geones.
texto alternativo
La corriente dorsal se muestra en verde y la corriente ventral en violeta.