En el procesamiento del lenguaje natural , el etiquetado de roles semánticos (también llamado análisis semántico superficial o relleno de espacios ) es el proceso que asigna etiquetas a palabras o frases en una oración que indica su rol semántico en la oración, como el de un agente , objetivo, o resultado.
Sirve para encontrar el significado de la oración. Para ello, detecta los argumentos asociados al predicado o verbo de una oración y cómo se clasifican en sus roles específicos . Un ejemplo común es la oración "María le vendió el libro a Juan". El agente es "María", el predicado es "vendido" (o más bien, "vender"), el tema es "el libro" y el destinatario es "Juan". Otro ejemplo es cómo "el libro me pertenece" necesitaría dos etiquetas como "poseído" y "poseedor" y "el libro fue vendido a John" necesitaría otras dos etiquetas, como tema y destinatario, a pesar de que estas dos cláusulas son similares. a las funciones "sujeto" y "objeto". [1]
Historia
En 1968, Charles J. Fillmore propuso la primera idea para el etiquetado de roles semánticos . [2] Su propuesta condujo al proyecto FrameNet que produjo el primer léxico computacional importante que describía sistemáticamente muchos predicados y sus roles correspondientes. Daniel Gildea ( Universidad de California, Berkeley / International Computer Science Institute ) y Daniel Jurafsky (actualmente enseñando en la Universidad de Stanford , pero anteriormente trabajando en la Universidad de Colorado y UC Berkeley ) desarrollaron el primer sistema de etiquetado de roles semántico automático basado en FrameNet. El corpus de PropBank agregó anotaciones de roles semánticas creadas manualmente al corpus de Penn Treebank de los textos del Wall Street Journal . Muchos sistemas de etiquetado de roles semánticos automáticos han utilizado PropBank como un conjunto de datos de entrenamiento para aprender a anotar nuevas oraciones automáticamente. [3]
Usos
El etiquetado de roles semánticos se usa principalmente para que las máquinas comprendan los roles de las palabras dentro de las oraciones. Esto beneficia a aplicaciones similares a los programas de procesamiento del lenguaje natural que necesitan comprender no solo las palabras de los idiomas, sino cómo se pueden usar en diferentes oraciones. [4] Una mejor comprensión del etiquetado de roles semánticos podría conducir a avances en la respuesta a preguntas , extracción de información , resumen de texto automático , minería de datos de texto y reconocimiento de voz . [5]
Ver también
Referencias
- ↑ Laux, Michael (13 de enero de 2019). "Si no lo sabías ya" . Blog de SunJackson (en chino) . Consultado el 8 de diciembre de 2020 .
- ^ Boas, Hans; Dux, Ryan. "Del pasado al presente: de los marcos de casos a los marcos semánticos" (PDF).
- ^ Gildea, Daniel; Jurafsky, Daniel (2000). "Etiquetado automático de roles semánticos" . Actas de la 38ª Reunión Anual de la Asociación de Lingüística Computacional - ACL '00 . Hong Kong: Asociación de Lingüística Computacional: 512–520. doi : 10.3115 / 1075218.1075283 .
- ^ Park, Jaehui (2019). "Autoatenciones conectadas selectivamente para el etiquetado de roles semánticos". Ciencias Aplicadas . 9 (8): a través de ProQuest.
- ^ Gildea, Daniel; Jurafsky, Daniel. "Etiquetado automático de roles semánticos" (PDF) . Asociación de Lingüística Computacional . 28 (3).
enlaces externos
- Tarea compartida CoNLL-2005: etiquetado de roles semánticos
- Illinois Semantic Role Labeler Sistema de etiquetado semántico de última generación Demostración
- Preposición SRL : identifica relaciones semánticas expresadas por preposiciones.
- Salmanasar es otro sistema de vanguardia para la asignación de roles y predicados semánticos.