Etiquetado semántico de roles

En el procesamiento del lenguaje natural , el etiquetado de roles semánticos (también llamado análisis semántico superficial o relleno de espacios ) es el proceso que asigna etiquetas a palabras o frases en una oración que indica su rol semántico en la oración, como el de un agente , objetivo, o resultado.

Sirve para encontrar el significado de la oración. Para ello, detecta los argumentos asociados al predicado o verbo de una oración y cómo se clasifican en sus roles específicos . Un ejemplo común es la oración "María le vendió el libro a Juan". El agente es "María", el predicado es "vendido" (o más bien, "vender"), el tema es "el libro" y el destinatario es "Juan". Otro ejemplo es cómo "el libro me pertenece" necesitaría dos etiquetas como "poseído" y "poseedor" y "el libro se vendió a John" necesitaría otras dos etiquetas, como tema y destinatario, a pesar de que estas dos cláusulas son similares. a "sujeto" y "objeto"funciones. ^[1]

En 1968, Charles J. Fillmore propuso la primera idea para el etiquetado de roles semánticos . ^[2] Su propuesta condujo al proyecto FrameNet que produjo el primer léxico computacional importante que describía sistemáticamente muchos predicados y sus roles correspondientes. Daniel Gildea (actualmente en la Universidad de Rochester , anteriormente Universidad de California, Berkeley / International Computer Science Institute ) y Daniel Jurafsky (actualmente enseñando en la Universidad de Stanford , pero anteriormente trabajando en la Universidad de Colorado y UC Berkeley).) desarrolló el primer sistema de etiquetado de roles semántico automático basado en FrameNet. El corpus de PropBank agregó anotaciones de roles semánticas creadas manualmente al corpus de Penn Treebank de los textos del Wall Street Journal . Muchos sistemas de etiquetado de roles semánticos automáticos han utilizado PropBank como un conjunto de datos de entrenamiento para aprender a anotar nuevas oraciones automáticamente. ^[3]

El etiquetado de roles semánticos se usa principalmente para que las máquinas comprendan los roles de las palabras dentro de las oraciones. Esto beneficia a aplicaciones similares a los programas de procesamiento del lenguaje natural que necesitan comprender no solo las palabras de los idiomas, sino cómo se pueden usar en diferentes oraciones. ^[4] Una mejor comprensión del etiquetado de roles semánticos podría conducir a avances en la respuesta a preguntas , extracción de información , resumen de texto automático , minería de datos de texto y reconocimiento de voz . ^[5]