La arquitectura Pandemonium surgió en respuesta a la incapacidad de las teorías de coincidencia de plantillas para ofrecer una explicación biológicamente plausible de los fenómenos de constancia de la imagen . Contemporáneo [ ¿cuándo? ] los investigadores elogian esta arquitectura por su elegancia y creatividad; que la idea de tener múltiples sistemas independientes (por ejemplo, detectores de características ) trabajando en paralelo para abordar los fenómenos de constancia de imagen del reconocimiento de patrones es poderosa pero simple. La idea básica de la arquitectura del pandemónium es que un patrón se percibe primero en sus partes antes que el "todo". [1]
La arquitectura Pandemonium fue uno de los primeros modelos computacionales en el reconocimiento de patrones. Aunque no es perfecta, la arquitectura del pandemónium influyó en el desarrollo de modelos modernos de conexión , inteligencia artificial y reconocimiento de palabras . [2]
Historia
La mayor parte de la investigación en percepción se ha centrado en el sistema visual, investigando los mecanismos de cómo vemos y entendemos los objetos. Una función crítica de nuestro sistema visual es su capacidad para reconocer patrones, pero el mecanismo por el cual esto se logra no está claro. [3]
La primera teoría que intentó explicar cómo reconocemos patrones es el modelo de coincidencia de plantillas. Según este modelo, comparamos todos los estímulos externos con una representación mental interna. Si hay una superposición "suficiente" entre el estímulo percibido y la representación interna, "reconoceremos" el estímulo. Aunque algunas máquinas siguen un modelo de coincidencia de plantillas (p. Ej., Máquinas bancarias que verifican firmas y números de contabilidad), la teoría tiene fallas críticas al explicar los fenómenos de la constancia de la imagen: podemos reconocer fácilmente un estímulo independientemente de los cambios en su forma de presentación (p. Ej. , T y T se reconocen fácilmente como la letra T). Es muy poco probable que tengamos una plantilla almacenada para todas las variaciones de cada patrón. [4]
Como resultado de la crítica de plausibilidad biológica del modelo de coincidencia de plantillas, los modelos de detección de características comenzaron a aumentar. En un modelo de detección de características, la imagen se percibe primero en sus elementos individuales básicos antes de que se reconozca como un objeto completo. Por ejemplo, cuando se nos presenta la letra A, primero veríamos una línea horizontal corta y dos líneas diagonales largas inclinadas. Luego, combinaríamos las características para completar la percepción de A. Cada patrón único consta de una combinación diferente de características, lo que significa que aquellas que se forman con las mismas características generarán el mismo reconocimiento. Es decir, independientemente de cómo rotamos la letra A, todavía se percibe como la letra A. Es fácil para este tipo de arquitectura dar cuenta de los fenómenos de constancia de la imagen porque solo necesita "hacer coincidir" en el nivel de características básico, que se presume que es limitado y finito, por lo que es biológicamente plausible. El modelo de detección de características más conocido se llama arquitectura pandemonium. [4]
Arquitectura Pandemonium
La arquitectura del pandemónium fue desarrollada originalmente por Oliver Selfridge a fines de la década de 1950. La arquitectura está compuesta por diferentes grupos de "demonios" que trabajan de forma independiente para procesar el estímulo visual. A cada grupo de demonios se le asigna una etapa específica de reconocimiento, y dentro de cada grupo, los demonios trabajan en paralelo. Hay cuatro grupos principales de demonios en la arquitectura original. [3]
Etapa | Nombre del demonio | Función |
---|---|---|
1 | Demonio de la imagen | Registra la imagen que se recibe en la retina. |
2 | Característica demonios | Hay muchos demonios de características, cada uno de los cuales representa una característica específica. Por ejemplo, hay un demonio de características para líneas rectas cortas, otro para líneas curvas, etc. El trabajo de cada demonio de características es "gritar" si detectan una característica a la que corresponden. Tenga en cuenta que los demonios de características no están destinados a representar ninguna neurona específica , sino a un grupo de neuronas que tienen funciones similares. Por ejemplo, el demonio de la característica de línea vertical se usa para representar las neuronas que responden a las líneas verticales en la imagen de la retina. |
3 | Demonios cognitivos | Mira los "gritos" de los demonios de funciones. Cada demonio cognitivo es responsable de un patrón específico (por ejemplo, una letra del alfabeto). El "grito" de los demonios cognitivos se basa en cuánto de su patrón fue detectado por los demonios característicos. Cuantas más características encuentren los demonios cognitivos que se correspondan con su patrón, más fuerte "gritarán". Por ejemplo, si los demonios de característica de línea curva, recta larga y de ángulo corto están gritando muy fuerte, el demonio cognitivo de la letra R podría emocionarse mucho y el demonio cognitivo de la letra P podría estar algo emocionado también; pero es muy probable que el demonio cognitivo de la letra Z esté callado. |
4 | Demonio de decisión | Representa la etapa final del procesamiento. Escucha los "gritos" producidos por los demonios cognitivos. Selecciona el demonio cognitivo más ruidoso. El demonio que se selecciona se convierte en nuestra percepción consciente. Continuando con nuestro ejemplo anterior, el demonio cognitivo R sería el más ruidoso, secundado por P; por lo tanto, percibiremos R, pero si cometiéramos un error debido a las malas condiciones de visualización (por ejemplo, las letras parpadean rápidamente o tienen partes ocluidas), es probable que sea P. Tenga en cuenta que el "pandemonio" simplemente representa el valor acumulativo "gritos" producidos por el sistema. |
El concepto de demonios de características, que existen neuronas específicas dedicadas a realizar un procesamiento especializado, está respaldado por la investigación en neurociencia. Hubel y Wiesel descubrieron que había células específicas en el cerebro de un gato que respondían a longitudes y orientaciones específicas de una línea. Se descubrieron hallazgos similares en ranas , pulpos y una variedad de otros animales. Se descubrió que los pulpos solo eran sensibles a la verticalidad de las líneas, mientras que las ranas demostraron un rango más amplio de sensibilidad. Estos experimentos con animales demuestran que los detectores de características parecen ser un desarrollo muy primitivo. Es decir, no resultó del mayor desarrollo cognitivo de los seres humanos. No es sorprendente que también haya evidencia de que el cerebro humano también posee estos detectores de características elementales. [5] [6] [7]
Además, esta arquitectura es capaz de aprender, de forma similar a una red neuronal con estilo de retropropagación . El peso entre los demonios cognitivos y de características se puede ajustar en proporción a la diferencia entre el patrón correcto y la activación de los demonios cognitivos. Para continuar con nuestro ejemplo anterior, cuando aprendimos por primera vez la letra R, sabemos que está compuesta por una línea curva, recta larga y una línea en ángulo corta. Por lo tanto, cuando percibimos esas características, percibimos R. Sin embargo, la letra P consta de características muy similares, por lo que durante las etapas iniciales del aprendizaje, es probable que esta arquitectura identifique erróneamente a R como P. Pero a través de la exposición constante de las R confirmadoras características que se van a identificar como R, los pesos de las características de R a P se ajustan para que la respuesta P se inhiba (por ejemplo, aprender a inhibir la respuesta P cuando se detecta una línea de ángulo corto). En principio, una arquitectura de pandemónium puede reconocer cualquier patrón. [8]
Como se mencionó anteriormente, esta arquitectura realiza predicciones de errores basadas en la cantidad de características superpuestas. Por ejemplo, el error más probable para R debería ser P. Por lo tanto, para mostrar que esta arquitectura representa el sistema de reconocimiento de patrones humanos, debemos poner a prueba estas predicciones. Los investigadores han construido escenarios donde se presentan varias letras en situaciones que las hacen difíciles de identificar; luego se observaron tipos de errores, los cuales se utilizaron para generar matrices de confusión: donde se registran todos los errores de cada letra. Generalmente, los resultados de estos experimentos coincidieron con las predicciones de error de la arquitectura pandemonium. También como resultado de estos experimentos, algunos investigadores han propuesto modelos que intentaron enumerar todas las características básicas del alfabeto romano . [9] [10] [11] [12]
Crítica
Una de las principales críticas a la arquitectura del pandemónium es que adopta un procesamiento completamente de abajo hacia arriba: el reconocimiento está impulsado por completo por las características físicas del estímulo objetivo. Esto significa que no puede tener en cuenta ningún efecto de procesamiento de arriba hacia abajo, como los efectos de contexto ( p . Ej. , Pareidolia ), donde las señales contextuales pueden facilitar (p. Ej., Efecto de superioridad de palabras: es relativamente más fácil identificar una letra cuando es parte de una palabra que de forma aislada). Sin embargo, esta no es una crítica fatal a la arquitectura en general, porque es relativamente fácil agregar un grupo de demonios contextuales para trabajar junto con los demonios cognitivos para explicar estos efectos contextuales. [13]
Aunque la arquitectura del pandemonio se basa en el hecho de que puede explicar los fenómenos de constancia de la imagen, algunos investigadores han argumentado lo contrario; y señaló que la arquitectura pandemonium podría compartir los mismos defectos de los modelos de coincidencia de plantillas. Por ejemplo, la letra H se compone de 2 líneas verticales largas y una línea horizontal corta; pero si giramos el H 90 grados en cualquier dirección, ahora se compone de 2 líneas horizontales largas y una línea vertical corta. Para reconocer el H rotado como H, necesitaríamos un demonio cognitivo H rotado. Por lo tanto, podríamos terminar con un sistema que requiere una gran cantidad de demonios cognitivos para producir un reconocimiento preciso, lo que conduciría a la misma crítica de plausibilidad biológica de los modelos de coincidencia de plantillas. Sin embargo, es bastante difícil juzgar la validez de esta crítica porque la arquitectura del pandemónium no especifica cómo y qué características se extraen de la información sensorial entrante, simplemente describe las posibles etapas del reconocimiento de patrones. Pero, por supuesto, eso plantea sus propias preguntas, a las que es casi imposible criticar tal modelo si no incluye parámetros específicos. Además, la teoría parece ser bastante incompleta sin definir cómo y qué características se extraen, lo que resulta ser especialmente problemático con patrones complejos (por ejemplo, extraer el peso y las características de un perro). [3] [14]
Algunos investigadores también han señalado que la evidencia que respalda la arquitectura del pandemonium ha sido muy limitada en su metodología. La mayoría de las investigaciones que respaldan esta arquitectura a menudo se han referido a su capacidad para reconocer dibujos esquemáticos simples que se seleccionan de un pequeño conjunto finito (por ejemplo, letras del alfabeto romano). La evidencia de este tipo de experimentos puede llevar a conclusiones excesivamente generalizadas y engañosas, porque el proceso de reconocimiento de patrones tridimensionales complejos podría ser muy diferente de los esquemas simples. Además, algunos han criticado la metodología utilizada para generar la matriz de confusión, porque confunde la confusión perceptiva (error en la identificación causado por características superpuestas entre el error y la respuesta correcta) con la conjetura posperceptual (las personas adivinan aleatoriamente porque no pueden estar seguras de qué ellos vieron). Sin embargo, estas críticas se abordaron de alguna manera cuando se replicaron resultados similares con otros paradigmas (por ejemplo, ir / no ir y tareas iguales), lo que respalda la afirmación de que los humanos tienen detectores de características elementales. Estos nuevos paradigmas se basaron en el tiempo de reacción como variable dependiente, lo que también evitó el problema de las celdas vacías inherente a la matriz de confusión (los análisis estadísticos son difíciles de realizar e interpretar cuando los datos tienen celdas vacías). [7]
Además, algunos investigadores han señalado que las teorías de acumulación de características como la arquitectura pandemonium tienen las etapas de procesamiento del reconocimiento de patrones casi al revés. Esta crítica fue utilizada principalmente por los defensores de la teoría global-to-local, quienes argumentaron y proporcionaron evidencia de que la percepción comienza con una visión borrosa del todo que refina con el tiempo, lo que implica que la extracción de características no ocurre en las primeras etapas del reconocimiento. [15] Sin embargo, no hay nada que impida que un demonio reconozca un patrón global en paralelo con otros demonios que reconocen patrones locales dentro del patrón global.
Aplicaciones e influencias
La arquitectura pandemonium se ha aplicado para resolver varios problemas del mundo real, como la traducción de códigos Morse enviados a mano y la identificación de letras impresas a mano. La precisión general de los modelos basados en pandemonium es impresionante, incluso cuando se le dio al sistema un período de aprendizaje corto. Por ejemplo, Doyle construyó un sistema basado en pandemónium con más de 30 analizadores de características complejas. Luego alimentó su sistema con varios cientos de letras para aprender. Durante esta fase, el sistema analizó la letra ingresada y generó su propia salida (con lo que el sistema identifica la letra). La salida del sistema se comparó con la identificación correcta, que envía una señal de error al sistema para ajustar los pesos entre los analizadores de características en consecuencia. En la fase de prueba, se presentaron letras desconocidas (diferente estilo y tamaño de las letras que las que se presentaron en la fase de aprendizaje), y el sistema pudo lograr una precisión cercana al 90%. Debido a su impresionante capacidad para reconocer palabras, todas las teorías modernas sobre cómo los humanos leen y reconocen palabras siguen esta estructura jerárquica: el reconocimiento de palabras comienza con extracciones de características de las letras, que luego activan los detectores de letras [16] (por ejemplo, SOLAR, [17 ] SERIOL, [18] IA, [19] DRC [20] ).
Basado en la arquitectura del pandemonio original, John Jackson ha extendido la teoría para explicar los fenómenos más allá de la percepción. Jackson ofreció la analogía de una arena para explicar la " conciencia ". Su arena consistía en una tribuna, un campo de juego y una arena secundaria. La arena estaba poblada por una multitud de demonios. Los demonios que fueron designados en los campos de juego fueron los demonios activos, ya que representan los elementos activos de la conciencia humana. Los demonios en las gradas deben vigilar a los que están en el campo de juego hasta que algo los excite; cada demonio está excitado por cosas diferentes. Cuanto más emocionados se ponen los demonios, más fuerte gritan. Si un demonio grita pasa un umbral establecido, se une a los otros demonios en el campo de juego y realiza su función, que luego puede excitar a otros demonios, y este ciclo continúa. La sub-arena en la analogía funciona como el mecanismo de aprendizaje y retroalimentación del sistema. El sistema de aprendizaje aquí es similar a cualquier otra red de estilo neuronal, que consiste en modificar la fuerza de la conexión entre los demonios; en otras palabras, cómo responden los demonios a los gritos de los demás. Este enfoque de agentes múltiples para el procesamiento de información humana se convirtió en el supuesto de muchos sistemas modernos de inteligencia artificial. [21] [22]
Comparaciones
Comparación con las teorías de coincidencia de plantillas
Aunque la arquitectura del pandemónium surgió como una respuesta para abordar una crítica importante de las teorías de coincidencia de plantillas, las dos son en realidad bastante similares en cierto sentido: hay un proceso en el que un conjunto específico de características para elementos se compara con algún tipo de representación mental. La diferencia crítica entre los dos es que la imagen se compara directamente con una representación interna en las teorías de coincidencia de plantillas, mientras que con la arquitectura pandemonium, la imagen primero se difunde y se procesa a nivel de características. Esto otorgó a las arquitecturas pandemonium un tremendo poder porque es capaz de reconocer un estímulo a pesar de sus cambios de tamaño, estilo y otras transformaciones; sin la presunción de una memoria de patrones ilimitada. También es poco probable que las teorías de coincidencia de plantillas funcionen correctamente cuando se enfrentan a entradas visuales realistas, donde los objetos se presentan en tres dimensiones y, a menudo, están ocluidos por otros objetos (por ejemplo, la mitad de un libro está cubierta por una hoja de papel, pero podemos todavía lo reconozco como un libro con relativa facilidad). No obstante, algunos investigadores han realizado experimentos comparando las dos teorías. No es sorprendente que los resultados a menudo favorecieran un modelo de construcción de características jerárquicas como la arquitectura pandemonium. [23] [24] [25]
Comparación con el reconocimiento de patrones hebbianos
El modelo de Hebbian se parece a las teorías orientadas a características como la arquitectura del pandemónium en muchos aspectos. El primer nivel de procesamiento en el modelo de Hebbian se llama ensamblajes de células, que tienen funciones muy similares para presentar demonios. Sin embargo, los ensamblajes de celdas son más limitados que los demonios de características, porque solo pueden extraer líneas, ángulos y contornos. Los conjuntos de células se combinan para formar secuencias de fase, que es muy similar a la función de los demonios cognitivos. En cierto sentido, muchos consideran que el modelo de Hebbian es un cruce entre la plantilla y las teorías de coincidencia de características, ya que las características extraídas de los modelos de Hebbian pueden considerarse plantillas simples. [8]
Ver también
- Aprendizaje competitivo
- Aprendizaje conjunto
- Mapa autoorganizado
- Conexionismo
- Teoría de integración de características
- Sistema adaptativo # Practopoyesis
Referencias
- ^ Anderson, James A .; Rosenfeld, Edward (1988). Neurocomputing (2ª edición impresa). Cambridge, Mass .: MIT Press. ISBN 978-0262010979.
- ^ Gernsbacher, Morton Ann (1998). Manual de psicolingüística ([Nachdr.] Ed.). San Diego, Calif. [Ua]: Academic Press. ISBN 978-0-12-280890-6.
- ^ a b c d Lindsay, Peter H .; Norman, Donald A. (1977). Procesamiento de información humana (2ª ed.). Nueva York: Academic Press. ISBN 978-0124509603.
- ^ a b Friedenberg, Jay; Silverman, Gordon (14 de julio de 2011). Ciencia cognitiva: Introducción al estudio de la mente (2ª ed.). Thousand Oaks, California: SABIO. ISBN 9781412977616.
- ^ Sutherland, Stuart (1957). "Discriminación visual de forma por pulpo". Revista británica de psicología . 48 (1): 55–70. doi : 10.1111 / j.2044-8295.1957.tb00599.x . PMID 13413184 .
- ^ Lettvin, J .; Maturana, H .; McCulloch, W .; Pitts, W. (1 de noviembre de 1959). "Lo que el ojo de la rana le dice al cerebro de la rana". Actas de la IRE . 47 (11): 1940-1951. doi : 10.1109 / JRPROC.1959.287207 .
- ^ a b Grainger, Jonathan; Rey, Arnaud; Dufau, Stéphane (1 de octubre de 2008). "Percepción de letras: de píxeles al pandemonio". Tendencias en ciencias cognitivas . 12 (10): 381–387. doi : 10.1016 / j.tics.2008.06.006 . PMID 18760658 .
- ^ a b Neisser, Ulric (1967). Psicología cognitiva . Nueva York: Appleton-Century-Crofts.
Neisser, Ulric.
- ^ Kinney, Glenn; Marsetta, Marion; Showman, Diana (1966). Estudios de legibilidad de símbolos de visualización, Parte XII: La legibilidad de símbolos alfanuméricos para televisión digitalizada . Bedford, Mass: The Mitre Corporation.
- ^ Gibson, Eleanor J. (1969). Principios de aprendizaje y desarrollo perceptual . Nueva York: Appleton-Century-Crofts. ISBN 9780390361455.
- ^ Geyer, LH; DeWald, CG (1 de octubre de 1973). "Listas de funciones y matrices de confusión" . Percepción y psicofísica . 14 (3): 471–482. doi : 10.3758 / BF03211185 .
- ^ Keren, Gideon; Baggen, Stan (1 de mayo de 1981). "Modelos de reconocimiento de caracteres alfanuméricos" . Percepción y psicofísica . 29 (3): 234–246. doi : 10.3758 / BF03207290 . PMID 7267275 .
- ^ Reicher, Gerald M. (1 de enero de 1969). "El reconocimiento perceptual en función de la significación del material de estímulo". Revista de Psicología Experimental . 81 (2): 275–280. doi : 10.1037 / h0027768 . PMID 5811803 .
- ^ Minsky, Marvin Lee ; Papert, Seymour (1969). Perceptrons: Una introducción a la geometría computacional (2ª impresión. Con corr. Ed.). Cambridge, Mass .: MIT Press. ISBN 978-0262630221.
- ^ Lupker, Stephen J. (1 de julio de 1979). "Sobre la naturaleza de la información perceptiva durante la percepción de letras" . Percepción y psicofísica . 25 (4): 303–312. doi : 10.3758 / BF03198809 . PMID 461090 .
- ^ Doyle, W. (1960). Reconocimiento de caracteres descuidados e impresos a mano . San Francisco, California: Proc. Conferencia de Computación de West Joint.
- ^ Davis, Colin J. (1 de enero de 2010). "El modelo de codificación espacial de la identificación visual de palabras" . Revisión psicológica . 117 (3): 713–758. doi : 10.1037 / a0019738 . PMID 20658851 .
- ^ Whitney, Carol (1 de junio de 2001). "Cómo el cerebro codifica el orden de las letras en una palabra impresa: El modelo SERIOL y revisión selectiva de la literatura" . Boletín y revisión psiconómica . 8 (2): 221–243. doi : 10.3758 / BF03196158 . PMID 11495111 .
- ^ McClelland, James L .; Rumelhart, David E. (1 de enero de 1981). "Un modelo de activación interactiva de efectos de contexto en la percepción de letras: I. Una descripción de los hallazgos básicos". Revisión psicológica . 88 (5): 375–407. doi : 10.1037 / 0033-295X.88.5.375 .
- ^ Coltheart, Max; Rastle, Kathleen; Perry, Conrad; Langdon, Robyn; Ziegler, Johannes (1 de enero de 2001). "DRC: un modelo en cascada de doble ruta de reconocimiento visual de palabras y lectura en voz alta". Revisión psicológica . 108 (1): 204–256. doi : 10.1037 / 0033-295X.108.1.204 . PMID 11212628 .
- ^ Jackson, John (julio de 1987). "Idea para una mente". Boletín Sigart .
- ^ Ntuen, Celestine A .; Park, Eui H. (1996). Interacciones humanas con sistemas complejos: principios conceptuales y práctica del diseño . Saltador. ISBN 978-0792397793.
- ^ Gibson, J (mayo de 1965). "Aprender a leer". Ciencia . 148 (3673): 1066–1072. Código Bibliográfico : 1965Sci ... 148.1066G . doi : 10.1126 / science.148.3673.1066 . PMID 14289608 .
- ^ Wheeler, Daniel D (1 de enero de 1970). "Procesos en reconocimiento de palabras". Psicología cognitiva . 1 (1): 59–85. doi : 10.1016 / 0010-0285 (70) 90005-8 . hdl : 2027,42 / 32833 .
- ^ Larsen, Axel; Bundesen, Claus (1 de marzo de 1996). "Un pandemonio de coincidencia de plantillas reconoce caracteres escritos a mano sin restricciones con alta precisión" . Memoria y cognición . 24 (2): 136-143. doi : 10.3758 / BF03200876 . PMID 8881318 .