La gramática categorial combinatoria ( CCG ) es un formalismo gramatical eficientemente analizable , pero lingüísticamente expresivo. Tiene una interfaz transparente entre la sintaxis superficial y la representación semántica subyacente, incluida la estructura de predicado-argumento, la cuantificación y la estructura de la información. El formalismo genera estructuras basadas en circunscripciones (a diferencia de las basadas en dependencias) y, por lo tanto, es un tipo de gramática de estructura de frases (a diferencia de una gramática de dependencia ).
CCG se basa en la lógica combinatoria , que tiene el mismo poder expresivo que el cálculo lambda , pero construye sus expresiones de manera diferente. Los primeros argumentos lingüísticos y psicolingüísticos para basar la gramática en combinadores fueron presentados por Steedman y Szabolcsi .
Los proponentes prominentes más recientes del enfoque son Pauline Jacobson y Jason Baldridge . En estos nuevos enfoques, el combinador B (el compositor) es útil para crear dependencias a larga distancia, como en "¿De quién crees que está hablando Mary?" y el combinador W (el duplicador) es útil como interpretación léxica de pronombres reflexivos, como en "Mary habla de sí misma". Junto con I (el mapeo de identidad) y C (el permutador), estos forman un conjunto de combinadores primitivos no interdefinibles. Jacobson interpreta los pronombres personales como el combinador I, y su enlace es ayudado por un combinador complejo Z, como en "Mary perdió su camino". Z se puede definir mediante W y B.
Partes del formalismo
El formalismo CCG define una serie de combinadores (la aplicación, la composición y el tipo de crianza son los más comunes). Estos operan sobre elementos léxicos tipificados sintácticamente, mediante pruebas de estilo de deducción natural . El objetivo de la prueba es encontrar alguna forma de aplicar los combinadores a una secuencia de elementos léxicos hasta que ningún elemento léxico quede sin usar en la prueba. El tipo resultante después de que se completa la demostración es el tipo de la expresión completa. Por lo tanto, lo que demuestra que algunos secuencia de palabras es una sentencia de un lenguaje equivale a probar que las palabras reducen al tipo S .
Tipos sintácticos
El tipo sintáctico de un elemento léxico puede ser o bien un tipo primitivo, tales como S , N , o NP , o complejo, tales como S \ NP , o NP / N .
Los tipos de complejos, schematizable como X / Y y X \ Y , tipos functor denotar que toman un argumento de tipo Y y devuelven un objeto de tipo X . Una barra inclinada indica que el argumento debe aparecer a la derecha, mientras que una barra invertida indica que el argumento debe aparecer a la izquierda. Cualquier tipo puede reemplazar la X y la Y aquí, lo que hace que los tipos sintácticos en CCG sean un sistema de tipos recursivos.
Combinadores de aplicaciones
Los combinadores de aplicaciones, a menudo indicados por > para la aplicación hacia adelante y < para la aplicación hacia atrás, aplican un elemento léxico con un tipo de functor a un argumento con un tipo apropiado. La definición de aplicación se da como:
Combinadores de composición
Los combinadores de composición, a menudo denotados por para composición futura y para la composición hacia atrás, son similares a la composición de funciones de las matemáticas y se pueden definir de la siguiente manera:
Combinadores de tipo elevado
Los combinadores de aumento de tipo, a menudo denotados como para la elevación de tipos hacia adelante y para la elevación de tipos hacia atrás, tome los tipos de argumentos (generalmente tipos primitivos) a los tipos de functor, que toman como su argumento los functores que, antes de la elevación de tipos, los habrían tomado como argumentos.
Ejemplo
La oración "el perro mordió a Juan" tiene varias pruebas posibles diferentes. A continuación se muestran algunos de ellos. La variedad de pruebas demuestra el hecho de que en CCG, las oraciones no tienen una estructura única, como en otros modelos gramaticales.
Dejemos que los tipos de estos elementos léxicos sean
Podemos realizar la prueba más simple (cambiando ligeramente la notación por brevedad) como:
Al optar por subir el tipo y componer algo, podríamos obtener una prueba totalmente incremental de izquierda a derecha. La capacidad de construir tal prueba es un argumento a favor de la plausibilidad psicolingüística de CCG, porque los oyentes de hecho construyen interpretaciones parciales (sintácticas y semánticas) de enunciados antes de que se hayan completado.
Propiedades formales
Se sabe que los CCG pueden generar el lenguaje (que es un lenguaje indexado sin contexto ). Se puede encontrar una gramática para este idioma en Vijay-Shanker y Weir (1994). [1]
Vijay-Shanker y Weir (1994) [1] demuestra que Lineal indexado gramáticas , Combinatoria categorial gramáticas, gramáticas Árbol-contigua , y la cabeza gramáticas son débilmente equivalentes formalismos, en la que todos ellos definen los mismos idiomas de cuerda. Kuhlmann y col. (2015) [2] muestran que esta equivalencia y la capacidad de CCG para describir, se basan fundamentalmente en la capacidad de restringir el uso de las reglas combinatorias a determinadas categorías, de formas no explicadas anteriormente.
Ver también
Referencias
- ^ a b Vijay-Shanker, K. y Weir, David J. 1994. La equivalencia de cuatro extensiones de gramáticas libres de contexto . Teoría de sistemas matemáticos 27 (6): 511–546.
- ^ Kuhlmann, M., Koller, A. y Satta, G. 2015. Lexicalización y poder generativo en CCG . Lingüística computacional 41 (2): 215-247.
- Baldridge, Jason (2002), " Control derivativo léxicamente especificado en gramática categórica combinatoria ". Tesis de Doctorado. Univ. de Edimburgo.
- Curry, Haskell B. y Richard Feys (1958), Combinatory Logic, vol. 1. Holanda Septentrional.
- Jacobson, Pauline (1999), " Hacia una semántica libre de variables ". Lingüística y Filosofía 22, 1999. 117-184
- Steedman, Mark (1987), " Gramáticas combinatorias y lagunas parasitarias ". Lenguaje natural y teoría lingüística 5, 403–439.
- Steedman, Mark (1996), Estructura e interpretación de la superficie. La prensa del MIT.
- Steedman, Mark (2000), El proceso sintáctico. La prensa del MIT.
- Szabolcsi, Anna (1989), " Variables enlazadas en sintaxis (¿hay alguna?) ". Semántica y expresión contextual, ed. por Bartsch, van Benthem y van Emde Boas. Foris, 294–318.
- Szabolcsi, Anna (1992), " Gramática combinatoria y proyección desde el léxico ". Materias léxicas. CSLI Lecture Notes 24, ed. por Sag y Szabolcsi. Publicaciones de Stanford, CSLI. 241–269.
- Szabolcsi, Anna (2003), “ Binding on the fly: anáfora cruzada en semántica libre de variables ”. Sensibilidad a los recursos en Binding and Anaphora, ed. por Kruijff y Oehrle. Kluwer, 215-229.
Otras lecturas
- Michael Moortgat, Lógica de tipo categórico , Capítulo dos en J. van Benthem y A. ter Meulen (eds.) Manual de lógica y lenguaje . Elsevier, 1997, ISBN 0-262-22053-9
- homepages.inf.ed.ac.uk
enlaces externos
- El sitio de gramática categórica combinatoria
- La página wiki de ACL CCG (probablemente esté más actualizada que esta)
- Análisis semántico con gramáticas categóricas combinatorias : tutorial que describe los principios generales para construir analizadores semánticos