En lingüística computacional , FrameNet es un proyecto alojado en el Instituto Internacional de Ciencias de la Computación en Berkeley, California, que produce un recurso electrónico basado en una teoría del significado llamada semántica de marcos . FrameNet revela, por ejemplo, que la frase "John vendió un coche a Mary" describe esencialmente la misma situación básica (marco semántico) que "Mary le compró un coche a John", solo que desde una perspectiva diferente. Se puede pensar en un marco semántico como una estructura conceptual que describe un evento, relación u objeto y los participantes en él. La base de datos léxica FrameNet contiene más de 1200 marcos semánticos , 13000 unidades léxicas(un emparejamiento de una palabra con un significado ; las palabras polisémicas están representadas por varias unidades léxicas ) y 202.000 oraciones de ejemplo. FrameNet es en gran parte la creación de Charles J. Fillmore , quien desarrolló la teoría de la semántica de marcos en la que se basa el proyecto, y fue inicialmente el líder del proyecto cuando el proyecto comenzó en 1997. [1] Collin Baker se convirtió en el gerente del proyecto en 2000. [2] El proyecto FrameNet ha influido tanto en la lingüística como en el procesamiento del lenguaje natural, donde dio lugar a la tarea de etiquetado automático de roles semánticos .
FrameNet | |
---|---|
Estado de la misión | Construyendo una base de datos léxica basada en una teoría del significado llamada Frame Semantics . |
¿Comercial? | No (disponible gratuitamente para descargar) |
Tipo de proyecto | Base de datos léxica (que contiene: marcos, elementos de marco (FE), unidades léxicas (LU), oraciones de ejemplo y relaciones de marco) |
Localización | Instituto Internacional de Ciencias de la Computación en Berkeley, California |
Dueño | Collin Baker (actual director de proyectos) |
Fundador | Charles J. Fillmore |
Establecido | 1997 |
Sitio web | framenet |
Conceptos
Marcos
Un marco es una representación esquemática de una situación que involucra a varios participantes, accesorios y otros roles conceptuales. Ejemplos de nombres de cuadros son Being_born
y Locative_relation
. Un marco en FrameNet contiene una descripción textual de lo que representa (una definición de marco), elementos de marco asociados, unidades léxicas, oraciones de ejemplo y relaciones marco a marco.
Elementos del marco
Los elementos de marco (FE) proporcionan información adicional a la estructura semántica de una oración. Cada marco tiene una serie de FE centrales y no centrales que pueden considerarse roles semánticos. Las FE centrales son esenciales para el significado del marco, mientras que las FE secundarias son generalmente descriptivas (como tiempo, lugar, manera, etc.). [3]
Algunos ejemplos incluyen:
- El único núcleo FE del
Being_born
marco se llamaChild
; FE no básicos siendoTime
,Place
,Relatives
, etc. [4] - Core FE de la
Commerce_goods-transfer
incluyen laSeller
,Buyer
,Goods
, entre otras cosas, mientras que las FE no básicos incluyen unaPlace
,Purpose
, etc. [5]
FrameNet incluye datos superficiales sobre los roles sintácticos que desempeñan los elementos del marco en las oraciones de ejemplo. Por ejemplo, para una oración como "Ella nació alrededor del año 460 d. C.", FrameNet marcaría "Ella" como un sintagma nominal que se refiere a la Child
FE, y "alrededor del 460 d. C." como un sintagma nominal correspondiente al Time
elemento marco. Los detalles de cómo se pueden realizar los elementos del marco en una oración son importantes porque esto revela información importante sobre los marcos de subcategorización , así como posibles alternancias de diátesis (por ejemplo, "Juan rompió la ventana" frente a "La ventana se rompió") de un verbo.
Unidades léxicas
Las unidades léxicas (LU) son lemas, con su parte del discurso, que evocan un marco específico. En otras palabras, cuando se identifica una LU en una oración, esa LU específica se puede asociar con su (s) trama (s) específica (s). Para cada trama, puede haber muchas LU asociadas a esa trama, y también puede haber muchas tramas que compartan una LU específica, este es típicamente el caso de las LU que tienen múltiples sentidos de palabra. [6] Junto al marco, cada unidad léxica se asocia con elementos específicos del marco mediante las oraciones de ejemplo anotadas.
Ejemplo:
Las unidades léxicas que evocan el Complaining
marco (o versiones en perspectiva más específicas del mismo, para ser precisos) incluyen los verbos "quejarse", "quejarse", "lamentar" y otros. [7]
Oraciones de ejemplo
Los marcos están asociados con oraciones de ejemplo y los elementos de marco están marcados dentro de las oraciones. Por tanto, la sentencia
- Ella nació alrededor del 460 d.C.
está asociado con el marco Being_born
, mientras que "Ella" está marcada como el elemento del marco Child
y "aproximadamente 460 d.C." está marcado como Time
. (Ver la anotación Informe FrameNet a born.v
.) Desde el principio, el proyecto FrameNet se ha comprometido a mirar a la evidencia de uso de la lengua real que se encuentran en colecciones de textos, como el British National Corpus . Basándose en tales oraciones de ejemplo, las herramientas de etiquetado de roles semánticos automáticos pueden determinar marcos y marcar elementos de marco en nuevas oraciones.
Valences
FrameNet también expone las estadísticas sobre las valencias de los marcos , es decir, el número y la posición de los elementos del marco dentro de oraciones de ejemplo. La frase
- Ella nació alrededor del 460 d.C.
cae en el patrón de valencia
- NP Ext, INI -, NP Dep
que ocurre dos veces en las oraciones de ejemplo en FrameNet, a saber, en:
- Ella fue nacido alrededor de 460 dC , hija y nieta de Romano y emperadores bizantinos, cuya familia había sido prominente en la política romana durante más de 700 años.
- Pronto fue enviado al norte de África y nunca conoció a su única hija, una hija nacida el 8 de junio de 1941 .
Relaciones marco
FrameNet, además, captura relaciones entre diferentes marcos usando relaciones. Estos incluyen los siguientes:
- Herencia: cuando un marco es una versión más específica de otro, marco padre más abstracto. Todo lo que sea cierto sobre el marco padre también debe ser cierto sobre el marco hijo, y se especifica un mapeo entre los elementos del marco del padre y los elementos del marco del hijo.
- Perspectivized_in: un marco neutral (como
Commerce_transfer-goods
) está conectado a un marco con una perspectiva específica del mismo escenario (por ejemplo, elCommerce_sell
marco, que asume la perspectiva del vendedor o elCommerce_buy
marco, que asume la perspectiva del comprador) - Bastidor auxiliar: Algunos marcos como el
Criminal_process
marco de referencia a escenarios complejos que constan de varios estados individuales o eventos que pueden ser descritos por marcos separados comoArrest
,Trial
, y así sucesivamente. - Precede: La relación Precede captura un orden temporal que se mantiene entre subtramas de un escenario complejo.
- Causative_of e Inchoative_of: existe una relación bastante sistemática entre descripciones estativas (como
Position_on_a_scale
marco, por ejemplo, "Ella tenía un salario alto") y descripciones causativas (comoCause_change_of_scalar_position
marco, por ejemplo, "Ella aumentó su salario") o descripciones incoativas (comoChange_position_on_a_scale
marco, por ejemplo " Su salario aumentó "). - Usando: Una relación que se mantiene entre un marco que de alguna manera involucra a otro marco. Por ejemplo, el
Judgment_communication
marco usa tanto elJudgment
marco como elStatement
marco, pero no hereda de ninguno de ellos porque no hay una correspondencia clara de los elementos del marco. - See_also: conecta marcos que se parecen un poco pero que deben distinguirse con cuidado.
Aplicaciones
FrameNet ha demostrado ser útil en una serie de aplicaciones computacionales, porque las computadoras necesitan conocimientos adicionales para reconocer que "John le vendió un coche a Mary" y "Mary le compró un coche a John" describen esencialmente la misma situación, a pesar de utilizar dos bastante diferentes verbos, diferentes preposiciones y un orden de palabras diferente. FrameNet se ha utilizado en aplicaciones como respuesta a preguntas , paráfrasis , reconocimiento de implicaciones textuales y extracción de información , ya sea directamente o mediante herramientas de etiquetado de roles semánticos . El primer sistema automático para el etiquetado de roles semánticos (SRL, a veces también denominado "análisis semántico superficial") fue desarrollado por Daniel Gildea y Daniel Jurafsky basado en FrameNet en 2002. [8] El etiquetado de roles semánticos se ha convertido desde entonces en una de las tareas estándar en procesamiento de lenguaje natural, con la última versión (1.7) de FrameNet ahora totalmente compatible con Natural Language Toolkit . [9]
Dado que los marcos son esencialmente descripciones semánticas, son similares en todos los idiomas, y a lo largo de los años han surgido varios proyectos que se han basado en el FrameNet original como base para FrameNets adicionales que no están en inglés, para español, japonés, alemán y polaco, entre otros. .
Ver también
- BabelNet : una red semántica multilingüe que integra FrameNet
- PropBank
- Instanciación nula
- Lenguaje del marco
- UBY : una base de datos de 10 recursos que incluye FrameNet
Referencias
- ^ Cliff Goddard (25 de septiembre de 2011). Análisis semántico: una introducción práctica . Prensa de la Universidad de Oxford. págs. 78–81. ISBN 978-0-19-956028-8. Consultado el 21 de marzo de 2012 .
- ^ Heine, Bernd; Narrog, Heiko, eds. (17 de diciembre de 2009). El manual de Oxford de análisis lingüístico . Prensa de la Universidad de Oxford. pag. 20. ISBN 978-0-19-160925-1. Consultado el 21 de marzo de 2012 .
- ^ https://framenet.icsi.berkeley.edu/fndrupal/glossary#core
- ^ https://framenet.icsi.berkeley.edu/fndrupal/index.php?q=frame_report&name=Being_born
- ^ https://framenet.icsi.berkeley.edu/fndrupal/index.php?q=frame_report&name=Commerce_goods-transfer
- ^ https://framenet.icsi.berkeley.edu/fndrupal/glossary
- ^ https://framenet2.icsi.berkeley.edu/fnReports/data/frameIndex.xml?frame=Complaining
- ^ Gildea, Daniel; Jurafsky, Daniel (2002). "Etiquetado automático de roles semánticos" (PDF) . Lingüística computacional . 28 (3): 245–288. doi : 10.1162 / 089120102760275983 . S2CID 207747200 .
- ^ Schneider, Nathan; Wooters, Chuck (2017). "La API NLTK FrameNet: diseño para la visibilidad con un rico recurso lingüístico". EMNLP 2017: Conferencia sobre métodos empíricos en el procesamiento del lenguaje natural . arXiv : 1703.07438 . Código bibliográfico : 2017arXiv170307438S .
Otras lecturas
- Ruppenhofer, Josef; Ellsworth, Michael; Petruck, Miriam RL ; Johnson, Christopher R .; Baker, Collin F .; Scheffczyk, Jan (1 de noviembre de 2016). FrameNet II: Teoría y práctica extendidas (edición revisada). Berkeley, CA: Instituto Internacional de Ciencias de la Computación.
enlaces externos
- Página de inicio de FrameNet
- FrameNet chino
- FrameNet danés
- FrameNet alemán
- FrameNet japonés
- FrameNet coreano
- FrameNet polaco
- FrameNet portugués (Brasil)
- FrameNet español
- FrameNet sueco