En lingüística , la correferencia , a veces co-referencia escrita , ocurre cuando dos o más expresiones en un texto se refieren a la misma persona o cosa; tienen el mismo referente , por ejemplo, Bill dijo que vendría ; el nombre propio Bill y el pronombre él se refieren a la misma persona, a saber, Bill. [1] La correferencia es el concepto principal que subyace a los fenómenos vinculantes en el campo de la sintaxis. La teoría de la vinculación explora la relación sintáctica que existe entre expresiones correferenciales en oraciones y textos. Cuando dos expresiones son correferenciales, una suele ser una forma completa (el antecedente) y la otra es una forma abreviada ( proforma o anáfora). Lingüistas utilizan índices para mostrar la correferencia, al igual que con el índice i en el ejemplo de Bill Me dijo que me iba a venir . Las dos expresiones con la misma referencia están coindexadas , por lo tanto, en este ejemplo, Bill y él están coindexados, lo que indica que deben interpretarse como correferenciales.
Tipos
Al explorar correferencia, hay numerosas distinciones que se pueden hacer, por ejemplo anáfora , Cataphora , antecedentes split, coreferring frases nominales, etc. [2] Cuando se trata de proformas ( pronombres , pro-verbos , pro-adjetivos, etc.), uno distingue entre anáfora y catafora. Cuando la proforma sigue a la expresión a la que se refiere, la anáfora está presente (la proforma es una anáfora), y cuando precede a la expresión a la que se refiere, la catafora está presente (la proforma es una catáfora). Estas nociones se ilustran de la siguiente manera:
- Anáfora
- una. La música i era tan fuerte que lo que no podía ser disfrutado. -La anáfora que sigue a la expresión a la que se refiere (su antecedente).
- B. Nuestros vecinos i no les gusta la música. Si se me están enojados, los policías se mostrarán pronto. - La anáfora que sigue a la expresión a la que se refiere (su antecedente).
- Cataphora
- una. Si lo que están molestos por la música, los vecinos i van a llamar a la policía. - El cataphor que precede a la expresión a la que se refiere (su postcedent).
- B. A pesar de su i dificultad, Wilma i llegó a entender el punto. - La catafora la precede a la expresión a la que se refiere (su postcedent)
- Antecedentes divididos
- una. Carol i dijo Bob i asistir a la fiesta. Ellos me llegaron juntos. - La anáfora que tiene un antecedente de división, refiriéndose tanto a Carol y Bob .
- B. Cuando Carol i ayuda a Bob i y Bob i ayuda a Carol i , ellos yo puedo realizar cualquier tarea. - La anáfora que tiene un antecedente de división, refiriéndose tanto a Carol y Bob .
- Coreferir frases nominales
- una. El líder del proyecto i se niega a ayudar. La sacudida que sólo piensa en sí mismo. - Coreferring sintagmas nominales, donde el segundo sintagma nominal es una predicación sobre el primero.
- B. Algunos de nuestros colegas 1 nos apoyarán. Este tipo de personas 1 se ganará nuestra gratitud. - Coreferring sintagmas nominales, donde el segundo sintagma nominal es una predicación sobre el primero.
Versus variables ligadas
Los semánticos y los lógicos a veces hacen una distinción entre la correferencia y lo que se conoce como una variable ligada . [3] Una instancia de una variable ligada puede parecer una correferencia, pero desde un punto de vista técnico, se puede argumentar que en realidad no lo es. Las variables ligadas ocurren cuando el antecedente de la proforma es una expresión cuantificada indefinida, p. Ej. [4]
- una. Cada estudiante que ha recibido su i grado. - El pronombre his es un ejemplo de variable ligada
- B. Ningún estudiante que estaba molesto con su i grado. - El pronombre his es un ejemplo de variable ligada
Expresiones cuantificadas como cada alumno y ningún alumno son, desde un punto de vista técnico, no referenciales. Los sujetos, cada alumno y ningún alumno, son gramaticalmente singulares, pero no seleccionan referentes únicos en el mundo del discurso. Así, dado que los antecedentes del adjetivo posesivo his no son referenciales, tampoco se puede decir que his son referenciales. En cambio, se dice que es una variable que está limitada por su antecedente. Su referencia varía en función de cuál de los estudiantes en el mundo del discurso se piensa. Si Jack, John y Jerry son los tres estudiantes en el mundo del discurso, entonces el significado de los suyos varía en función de si Jack, John o Jerry es el foco del ojo de la mente. La existencia de variables ligadas es quizás más evidente con el siguiente ejemplo:
- C. Sólo Jack i le gusta su i grado. - El pronombre his puede ser una variable ligada.
Esta frase es ambigua. Puede significar que a Jack le gusta su calificación, pero a todos los demás no les gusta la calificación de Jack, o más probablemente, significa que a Jack le gusta su calificación, pero a John no le gusta su calificación (de John) y a Jerry no le gusta su calificación (de Jerry). La segunda lectura más natural es la lectura de variable ligada. Si bien la distinción entre correferencia y variables ligadas puede ser real, la coindexación puede interpretarse como que acomoda a ambas. Es decir, cuando dos o más expresiones están coindexadas, indica que se trata de una correferencia o una variable ligada.
Resolución de correferencia
En lingüística computacional , la resolución de correferencias es un problema bien estudiado en el discurso . Para obtener la interpretación correcta de un texto, o incluso para estimar la importancia relativa de varios temas mencionados, los pronombres y otras expresiones de referencia deben estar conectados a los individuos adecuados. Los algoritmos destinados a resolver correferencias suelen buscar primero el individuo precedente más cercano que sea compatible con la expresión de referencia. Por ejemplo, se podría unir a una expresión anterior como la mujer o Anne , pero no a Bill . Los pronombres como él tienen restricciones mucho más estrictas. Al igual que con muchas tareas lingüísticas, existe una compensación entre precisión y recuerdo , cuyo cálculo puede variar ya que no existe un algoritmo único para medir la calidad de las cadenas de correferencia. Las métricas de calidad del clúster que se utilizan comúnmente para evaluar los algoritmos de resolución de correferencia son el índice Rand , el índice Rand ajustado o diferentes métodos basados en información mutua .
Un problema clásico para la resolución de correferencia en inglés es el pronombre it , que tiene muchos usos. Se puede referir al igual que él y que , salvo que se refiere generalmente a los objetos inanimados (las reglas son en realidad más compleja: los animales pueden ser cualquiera de ella , él , o ella , así como barcos son tradicionalmente ella ; huracanes por lo general son que a pesar de tener nombres de género ). También puede referirse a abstracciones en lugar de seres, por ejemplo , le pagaron el salario mínimo, pero no pareció importarle. Por último, que también tiene pleonásticos usos, que no se refieren a nada específico:
- una. Esta lloviendo
- B. Es realmente una vergüenza.
- C. Se necesita mucho trabajo para tener éxito.
- D. A veces son los más ruidosos los que tienen más influencia.
Los usos pleonásticos no se consideran referenciales, por lo que no forman parte de la correferencia. [5]
Los enfoques para la resolución de correferencia se pueden dividir en general en algoritmos basados en entidades, ranking de menciones o pares de menciones. Los algoritmos de pares de menciones implican decisiones binarias si un par de dos menciones dadas pertenecen a la misma entidad. No se tienen en cuenta las limitaciones de toda la entidad, como el género , lo que conduce a la propagación de errores . Por ejemplo, los pronombres que él o ella pueden tener una alta probabilidad de correferencia con el maestro , pero no pueden ser correferenciales entre sí. Los algoritmos de clasificación de menciones amplían esta idea, pero en su lugar estipulan que una mención solo puede ser correferente con una mención (previa). Como resultado, a cada mención anterior se le debe asignar una puntuación y se vincula la mención con la puntuación más alta (o ninguna mención). Finalmente, en los métodos basados en entidades, las menciones se vinculan en función de la información de toda la cadena de correferencia en lugar de menciones individuales. La representación de una cadena de ancho variable es más compleja y computacionalmente costosa que los métodos basados en menciones, lo que lleva a que estos algoritmos se basen principalmente en arquitecturas de redes neuronales .
Ver también
- Anáfora (lingüística) : uso de una expresión cuya interpretación depende del contexto
- Antecedente - Expresión que da su significado a una forma pro en gramática.
- Enlace : la distribución de elementos anafóricos
- Cataphora : uso de una expresión o palabra que se corresponda con una expresión posterior y más específica.
- Referente más cercano
- Switch-reference : cualquier morfema a nivel de cláusula que indique si ciertos argumentos prominentes en cláusulas 'adyacentes' son correferenciales
- Desambiguación del sentido de la palabra : identificación del sentido de una palabra que se está utilizando
Notas
- ↑ Para las definiciones de correferencia, véanse, por ejemplo, Crystal (1997: 94) y Radford (2004: 332).
- ↑ Estas distinciones (anáfora, catafora, antecedentes divididos, sintagmas nominales correlacionados, etc.) se analizan en Jurafsky y Martin (2000: 669ss.).
- ^ Para discusiones sobre variables ligadas, vea, por ejemplo, Portner (2005: 102ff.).
- ^ Ver Jurafsky y Martin (2000: 701) para un ejemplo de una variable ligada como las que se dan aquí.
- ^ Li y col. (2009) han demostrado una alta precisión en la clasificación de pleonásticos que , y este éxito promesas para mejorar la precisión de la resolución de la correferencia general.
Referencias
- Crystal, D. 1997. Diccionario de lingüística y fonética. 4ª edición. Cambridge, MA: Blackwell Publishing.
- Jurafsky, D. y H. Martin 2000. Procesamiento del habla y el lenguaje: una introducción al procesamiento del lenguaje natural, la lingüística computacional y el reconocimiento del habla. Nueva Delhi, India: Pearson Education.
- Portner, P. 2005. ¿Qué es la semántica ?: Fundamentos de la semántica formal. Malden, MA: Blackwell Publishing.
- Radford, A. 2004. Sintaxis en inglés: una introducción . Cambridge, Reino Unido: Cambridge University Press.
- Yifan, L., P. Musilek, M. reformatear, y L. Wyard-Scott 2009. Identificación de pleonasmo que el uso de la web . Journal of Artificial Intelligence Research 34, 339–389.