PropBank es un corpus que se anota con proposiciones verbales y sus argumentos, un "banco de proposiciones". Aunque "PropBank" se refiere a un corpus específico producido por Martha Palmer et al. , [1] el término propbank también se está empezando a utilizar como un sustantivo común que se refiere a cualquier corpus que haya sido anotado con proposiciones y sus argumentos.
El proyecto PropBank ha jugado un papel en los últimos [ ¿cuándo? ] investigación en el procesamiento del lenguaje natural , [ cita requerida ] y se ha utilizado en el etiquetado de roles semánticos .
Comparación
PropBank se diferencia de FrameNet , el recurso con el que se compara con mayor frecuencia, de varias formas.
PropBank es un recurso orientado a verbos, mientras que FrameNet se centra en la noción más abstracta de marcos, que generaliza descripciones a través de verbos similares (por ejemplo, "describir" y "caracterizar"), así como sustantivos y otras palabras (por ejemplo, "descripción"). PropBank no anota eventos o situaciones descritas usando sustantivos. PropBank se compromete a anotar todos los verbos en un corpus, mientras que el proyecto FrameNet elige conjuntos de oraciones de ejemplo de un corpus grande y solo en unos pocos casos ha anotado tramos de texto continuos más largos.
Las anotaciones de estilo PropBank a menudo permanecen cerca del nivel sintáctico, mientras que las anotaciones de estilo FrameNet a veces tienen una motivación más semántica. Desde el principio, PropBank se desarrolló con la idea de servir como datos de entrenamiento para sistemas de etiquetado de roles semánticos basados en el aprendizaje automático . Requiere que todos los argumentos de un verbo sean constituyentes sintácticos y que los diferentes sentidos de una palabra solo se distingan si las diferencias se relacionan con los argumentos. [2] Debido a tales diferencias, el etiquetado de roles semánticos con respecto a PropBank es a menudo una tarea algo más fácil que producir anotaciones al estilo FrameNet.
Ver también
Referencias
- ^ Palmer M, Kingsbury P, Gildea D (2005). "El banco de propuestas: un corpus anotado de roles semánticos". Lingüística computacional . 31 (1): 71–106. CiteSeerX 10.1.1.136.8985 . doi : 10.1162 / 0891201053630264 . S2CID 2486369 .
- ^ Edward Loper; Szu-ting Yi y Martha Palmer (2007). "Combinación de recursos léxicos: mapeo entre PropBank y VerbNet" (PDF) . Actas del VII Taller Internacional de Lingüística Computacional .