WordNet es una base de datos léxica de relaciones semánticas entre palabras en más de 200 idiomas. [2] WordNet vincula las palabras en relaciones semánticas que incluyen sinónimos , hipónimos y merónimos . Los sinónimos se agrupan en synsets con definiciones breves y ejemplos de uso. Por tanto, WordNet puede verse como una combinación y extensión de un diccionario y un tesauro . Si bien es accesible para usuarios humanos a través de un navegador web , [3] su uso principal es automático.aplicaciones de análisis de texto e inteligencia artificial . WordNet se creó por primera vez en inglés [4] y la base de datos y las herramientas de software de WordNet en inglés se han lanzado bajo una licencia de estilo BSD y están disponibles gratuitamente para su descarga desde ese sitio web de WordNet.
Desarrollador (es) | Universidad de Princeton |
---|---|
Versión inicial | mediados de la década de 1980 |
Lanzamiento estable | 3.1 / junio de 2011 [1] |
Escrito en | Prólogo |
Sistema operativo | Unix, Linux, Solaris, Windows |
Tamaño | 16 MB (incluidas 155,327 palabras organizadas en 175,979 synsets para un total de 207,016 pares de sentido de palabras) |
Disponible en | Más de 200 idiomas |
Tipo | Base de datos léxica |
Licencia | Tipo BSD |
Sitio web | wordnet |
Historia y miembros del equipo
WordNet se creó por primera vez en inglés únicamente en el Laboratorio de Ciencias Cognitivas de la Universidad de Princeton bajo la dirección del profesor de psicología George Armitage Miller a partir de 1985 y se ha dirigido en los últimos años [ ¿cuándo? ] de Christiane Fellbaum . El proyecto fue financiado inicialmente por la Oficina de Investigación Naval de EE. UU. Y más tarde también por otras agencias gubernamentales de EE. UU., Como la DARPA , la Fundación Nacional de Ciencias , la Oficina de Tecnología Disruptiva (anteriormente Actividad de Investigación y Desarrollo Avanzado) y REFLEX. George Miller y Christiane Fellbaum recibieron el premio Antonio Zampolli 2006 por su trabajo con WordNet.
La Asociación Global WordNet es una organización no comercial que proporciona una plataforma para debatir, compartir y conectar WordNets para todos los idiomas del mundo, y cuenta con Christiane Fellbaum y Piek Th.JM Vossen como copresidentes. [5]
Contenidos de la base de datos
La base de datos contiene 155 327 palabras organizadas en 175 979 synsets para un total de 207 016 pares de sentido de palabras; en forma comprimida , tiene un tamaño de aproximadamente 12 megabytes . [6]
WordNet incluye las categorías léxicas sustantivos , verbos , adjetivos y adverbios, pero ignora las preposiciones , determinantes y otras palabras funcionales.
Las palabras de la misma categoría léxica que son aproximadamente sinónimos se agrupan en synsets . Los synsets incluyen palabras simples y colocaciones como "comer fuera" y "car pool". Los diferentes sentidos de una palabra polisémica se asignan a diferentes synsets. El significado de un synset se aclara aún más con una breve descripción y uno o más ejemplos de uso. Un ejemplo de adjetivo synset es:
- bueno, correcto, maduro - (más adecuado o adecuado para un propósito particular; "un buen momento para plantar tomates"; "el momento adecuado para actuar"; "el momento es propicio para grandes cambios sociológicos")
Todos los synsets están conectados a otros synsets mediante relaciones semánticas. Estas relaciones, que no todas son compartidas por todas las categorías léxicas, incluyen:
- Sustantivos
- hiperónimos : Y es un hiperónimo de X si cada X es un (tipo de) Y ( canino es un hiperónimo de perro )
- Hipónimos : Y es un hipónimo de X si cada Y es un (tipo de) X (el perro es un hipónimo de canino )
- términos de coordenadas : Y es un término de coordenadas de X si X e Y comparten un hiperónimo ( lobo es un término de coordenadas de perro y perro es un término de coordenadas de lobo )
- merónimo : Y es un merónimo de X si Y es parte de X ( ventana es un merónimo de edificio )
- holónimo : Y es un holónimo de X si X es parte de Y ( edificio es un holónimo de ventana )
- Verbos
- hypernym : el verbo Y es un hypernym del verbo X si la actividad X es un (tipo de) Y ( percibir es un hiperónimo de escuchar )
- tropónimo : el verbo Y es un tropónimo del verbo X si la actividad Y está haciendo X de alguna manera ( cecear es un tropónimo de hablar )
- vinculación : el verbo Y está implicado por X si al hacer X debes estar haciendo Y ( dormir está implicado por roncar )
- términos coordinados : aquellos verbos que comparten un hiperónimo común ( cecear y gritar )
Estas relaciones semánticas se mantienen entre todos los miembros de los synsets vinculados. Los miembros individuales del synset (palabras) también se pueden conectar con relaciones léxicas. Por ejemplo, (un sentido de) el sustantivo "director" está vinculado a (un sentido de) el verbo "directo" del cual se deriva a través de un vínculo "morfosemántico".
Las funciones morfológicas del software distribuidas con la base de datos intentan deducir el lema o la forma de la raíz de una palabra a partir de la entrada del usuario. Las formas irregulares se almacenan en una lista, y buscar "comió" devolverá "comer", por ejemplo.
Estructura de conocimiento
Tanto los sustantivos como los verbos están organizados en jerarquías, definidas por hipernym o relaciones IS A. Por ejemplo, un sentido de la palabra perro se encuentra siguiendo la jerarquía de hiperónimos; las palabras del mismo nivel representan miembros de synset. Cada conjunto de sinónimos tiene un índice único.
- perro, perro doméstico, Canis familiaris
- canino, cánido
- carnívoro
- placentario, mamífero placentario, euterio, mamífero euterio
- mamífero
- vertebrado, craneal
- cordado
- animal, ser animado, bestia, bruto, criatura, fauna
- ...
- animal, ser animado, bestia, bruto, criatura, fauna
- cordado
- vertebrado, craneal
- mamífero
- placentario, mamífero placentario, euterio, mamífero euterio
- carnívoro
- canino, cánido
En el nivel superior, estas jerarquías están organizadas en 25 "árboles" para principiantes para sustantivos y 15 para verbos (llamados archivos lexicográficos en un nivel de mantenimiento). Todos están vinculados a un sistema único para principiantes, "entidad". Las jerarquías de sustantivos son mucho más profundas que las jerarquías de verbos
Los adjetivos no están organizados en árboles jerárquicos. En cambio, dos antónimos "centrales" como "caliente" y "frío" forman polos binarios, mientras que los sinónimos de "satélite" como "humeante" y "frío" se conectan a sus respectivos polos a través de relaciones de "similitud". Los adjetivos se pueden visualizar de esta manera como "mancuernas" en lugar de como "árboles".
Aspectos psicolingüísticos
El objetivo inicial del proyecto WordNet era construir una base de datos léxica que fuera consistente con las teorías de la memoria semántica humana desarrolladas a fines de la década de 1960. Los experimentos psicológicos indicaron que los hablantes organizaron su conocimiento de los conceptos de una manera económica y jerárquica. El tiempo de recuperación requerido para acceder al conocimiento conceptual parecía estar directamente relacionado con el número de jerarquías que el hablante necesitaba "atravesar" para acceder al conocimiento. Por lo tanto, los hablantes pudieron verificar más rápidamente que los canarios pueden cantar porque un canario es un pájaro cantor, pero requirieron un poco más de tiempo para verificar que los canarios pueden volar (donde tenían que acceder al concepto "pájaro" en el nivel superior) e incluso más tiempo para verificar que los canarios tengan piel (lo que requiere una búsqueda en múltiples niveles de hiponimia, hasta "animal"). [7] Si bien tales experimentos psicolingüísticos y las teorías subyacentes han sido objeto de críticas, parte de la organización de WordNet es consistente con la evidencia experimental. Por ejemplo, la afasia anómica afecta selectivamente la capacidad de los hablantes para producir palabras de una categoría semántica específica, una jerarquía de WordNet. Se encuentra que los adjetivos antónimos (los adjetivos centrales de WordNet en la estructura de pesas) coexisten con mucha más frecuencia que el azar, un hecho que se ha encontrado que se aplica a muchos idiomas.
Como ontología léxica
WordNet a veces se denomina ontología, una afirmación persistente que sus creadores no hacen. Las relaciones hiperónimo / hipónimo entre los sintetizadores de sustantivos pueden interpretarse como relaciones de especialización entre categorías conceptuales. En otras palabras, WordNet se puede interpretar y utilizar como una ontología léxica en el sentido de la informática . Sin embargo, dicha ontología debe corregirse antes de ser utilizada, porque contiene cientos de inconsistencias semánticas básicas; por ejemplo, hay (i) especializaciones comunes para categorías exclusivas y (ii) redundancias en la jerarquía de especialización. Además, la transformación de WordNet en una ontología léxica utilizable para la representación del conocimiento normalmente también debería implicar (i) distinguir las relaciones de especialización en relaciones subtipoOf e instanciaOf , y (ii) asociar identificadores únicos intuitivos a cada categoría. Aunque estas correcciones y transformaciones se han realizado y documentado como parte de la integración de WordNet 1.7 en la base de conocimientos actualizable de forma cooperativa de WebKB-2, [8] la mayoría de los proyectos que afirman reutilizar WordNet para aplicaciones basadas en el conocimiento (normalmente, conocimientos recuperación de información orientada) simplemente reutilícela directamente.
WordNet también se ha convertido a una especificación formal, mediante una metodología híbrida ascendente descendente para extraer automáticamente relaciones de asociación de WordNet e interpretar estas asociaciones en términos de un conjunto de relaciones conceptuales, formalmente definidas en la ontología fundamental de DOLCE. . [9]
En la mayoría de los trabajos que afirman haber integrado WordNet en ontologías, el contenido de WordNet no se ha corregido simplemente cuando parecía necesario; en cambio, WordNet se ha reinterpretado y actualizado en gran medida cuando ha sido adecuado. Este fue el caso cuando, por ejemplo, la ontología de nivel superior de WordNet fue reestructurada [10] de acuerdo con el enfoque basado en OntoClean o cuando WordNet se utilizó como fuente primaria para construir las clases inferiores de la ontología SENSUS.
Limitaciones
La limitación más discutida de WordNet (y recursos relacionados como ImageNet ) es que algunas de las relaciones semánticas son más adecuadas para conceptos concretos que para conceptos abstractos. [11] Por ejemplo, es fácil crear relaciones de hipónimos / hiperónimos para captar que una " conífera " es un tipo de " árbol ", un "árbol" es un tipo de " planta " y una "planta" es un tipo de " organismo ", pero es difícil clasificar emociones como "miedo" o "felicidad" en relaciones hipónimo / hipernimo igualmente profundas y bien definidas.
Muchos de los conceptos en WordNet son específicos de ciertos idiomas y el mapeo informado más preciso entre idiomas es del 94%. [12] Los sinónimos, hipónimos, merónimos y antónimos se encuentran en todos los idiomas con WordNet hasta ahora, pero otras relaciones semánticas son específicas del idioma. [13] Esto limita la interoperabilidad entre idiomas. Sin embargo, también convierte a WordNet en un recurso para resaltar y estudiar las diferencias entre idiomas, por lo que no es necesariamente una limitación para todos los casos de uso.
WordNet no incluye información sobre la etimología o la pronunciación de palabras y solo contiene información limitada sobre el uso. WordNet tiene como objetivo cubrir la mayoría de las palabras cotidianas y no incluye mucha terminología específica de dominio.
WordNet es el léxico computacional del inglés más comúnmente utilizado para la desambiguación del sentido de las palabras (WSD), una tarea cuyo objetivo es asignar los significados apropiados al contexto (es decir, miembros de synset) a las palabras de un texto. [14] Sin embargo, se ha argumentado que WordNet codifica distinciones de sentido que son demasiado detalladas. Este problema impide que los sistemas WSD alcancen un nivel de rendimiento comparable al de los humanos, que no siempre están de acuerdo cuando se enfrentan a la tarea de seleccionar un sentido de un diccionario que coincida con una palabra en un contexto. El problema de la granularidad se ha abordado proponiendo métodos de agrupación que agrupan automáticamente sentidos similares de la misma palabra. [15] [16] [17]
Contenido ofensivo
WordNet incluye palabras que pueden percibirse como peyorativas u ofensivas. [18] La interpretación de una palabra puede cambiar con el tiempo y entre grupos sociales , por lo que no siempre es posible para WordNet definir una palabra como " peyorativa " u "ofensiva" de forma aislada. Por lo tanto, las personas que utilizan WordNet deben aplicar sus propios métodos para identificar palabras ofensivas o peyorativas.
Sin embargo, esta limitación se aplica a otros recursos léxicos como diccionarios y tesauros , que también contienen palabras peyorativas y ofensivas. Algunos diccionarios indican palabras que son peyorativas , pero no incluyen todos los contextos en los que las palabras pueden ser aceptables u ofensivas para diferentes grupos sociales. Por lo tanto, las personas que utilizan diccionarios deben aplicar sus propios métodos para identificar todas las palabras ofensivas.
WordNets con licencia frente a Open WordNets
Posteriormente se crearon algunas redes de palabras para otros idiomas. Una encuesta de 2012 enumera las redes de palabras y su disponibilidad. [19] En un esfuerzo por propagar el uso de WordNets, la comunidad global de WordNet ha estado volviendo a licenciar lentamente sus WordNets a un dominio abierto donde los investigadores y desarrolladores pueden acceder fácilmente y utilizar WordNets como recursos lingüísticos para proporcionar conocimiento ontológico y léxico en Natural Tareas de procesamiento del lenguaje .
Open Multilingual WordNet [20] proporciona acceso a WordNet con licencia abierta en una variedad de idiomas, todos vinculados a Princeton Wordnet of English (PWN). El objetivo es facilitar el uso de wordnets en varios idiomas.
Aplicaciones
WordNet se ha utilizado para una serie de propósitos en los sistemas de información, incluyendo desambiguación lingüística , la recuperación de información , clasificación automática de texto , resumen automático de textos , la traducción automática e incluso la generación automática crucigrama.
Un uso común de WordNet es determinar la similitud entre palabras. Se han propuesto varios algoritmos, incluida la medición de la distancia entre palabras y synsets en la estructura gráfica de WordNet, por ejemplo, contando el número de bordes entre synsets. La intuición es que cuanto más cerca estén dos palabras o synsets, más cercano será su significado. Varios algoritmos de similitud de palabras basados en WordNet se implementan en un paquete de Perl llamado WordNet :: Similarity, [21] y en un paquete de Python llamado NLTK . [22] Otras técnicas de similitud basadas en WordNet más sofisticadas incluyen ADW, [23] cuya implementación está disponible en Java . WordNet también se puede utilizar para interconectar otros vocabularios. [24]
Interfaces
Princeton mantiene una lista de proyectos relacionados [25] que incluye enlaces a algunas de las interfaces de programación de aplicaciones ampliamente utilizadas disponibles para acceder a WordNet utilizando varios lenguajes y entornos de programación.
Proyectos y extensiones relacionados
WordNet está conectado a varias bases de datos de la Web Semántica . WordNet también se reutiliza comúnmente a través de asignaciones entre los synsets de WordNet y las categorías de ontologías. La mayoría de las veces, solo se asignan las categorías de nivel superior de WordNet.
Asociación Global WordNet
La Asociación Global WordNet (GWA) [26] es una organización pública y no comercial que proporciona una plataforma para debatir, compartir y conectar redes de palabras para todos los idiomas del mundo. La GWA también promueve la estandarización de wordnets en todos los idiomas, para garantizar su uniformidad en la enumeración de los synsets en idiomas humanos. La GWA mantiene una lista de redes de palabras desarrolladas en todo el mundo. [27]
Otros idiomas
- WordNet árabe : [28] [29] WordNet para el idioma árabe.
- Ontología árabe , una ontología lingüística que tiene la misma estructura que Wordnet y se asigna a ella.
- El proyecto BalkaNet [30] ha producido WordNets para seis idiomas europeos (búlgaro, checo, griego, rumano, turco y serbio). Para este proyecto, se desarrolló un editor WordNet basado en XML disponible gratuitamente. Este editor, VisDic, ya no está en desarrollo activo, pero todavía se usa para la creación de varias WordNets. Su sucesor, DEBVisDic, es una aplicación cliente-servidor y actualmente se utiliza para la edición de varias WordNets (holandés en el proyecto Cornetto, polaco, húngaro, varios idiomas africanos, chino).
- BulNet es una versión búlgara de WordNet desarrollada en el Departamento de Lingüística Computacional del Instituto de Lengua Búlgara, Academia de Ciencias de Bulgaria. [31]
- CWN (Wordnet chino o 中文 詞彙 網路) respaldado por la Universidad Nacional de Taiwán . [32]
- El proyecto EuroWordNet [33] ha producido WordNets para varios idiomas europeos y los ha vinculado; sin embargo, estos no están disponibles gratuitamente. El proyecto Global Wordnet intenta coordinar la producción y vinculación de "wordnets" para todos los idiomas. [34] Oxford University Press , el editor del Oxford English Dictionary , ha expresado sus planes de producir su propio competidor en línea para WordNet. [ cita requerida ]
- FinnWordNet es una versión finlandesa de WordNet donde se tradujeron todas las entradas del WordNet original en inglés. [35]
- GermaNet es una versión alemana de WordNet desarrollada por la Universidad de Tübingen. [36]
- El IndoWordNet [37] es una base de conocimiento léxico vinculado de wordnets de 18 idiomas programados de la India viz., Asamés , Bangla , Bodo , Gujarati , Hindi , Kannada , Kashmiri , konkani , Malayalam , Meitei (Manipuri), marathi , nepalí , Odia , Punjabi , sánscrito , tamil , telugu y urdu .
- JAWS (Just Another WordNet Subset), otra versión francesa de WordNet [38] construida usando Wiktionary y espacios semánticos
- WordNet Bahasa : WordNet para el idioma malayo e indonesio, desarrollado por la Universidad Tecnológica de Nanyang .
- Malayalam WordNet , desarrollado por la Universidad de Ciencia y Tecnología de Cochin . [39]
- El repositorio central multilingüe (MCR) se integra en el mismo marco de EuroWordNet wordnets del español, catalán, vasco, gallego y portugués al inglés. [40]
- El proyecto MultiWordNet, [41] una WordNet multilingüe destinada a producir una WordNet italiana fuertemente alineada con Princeton WordNet.
- OpenDutchWordNet, [42] es una base de datos semántica léxica holandesa.
- OpenWN-PT es una versión en portugués brasileño del WordNet original disponible gratuitamente para su descarga bajo licencia CC-BY-SA. [43]
- plWordNet [44] es una versión en polaco de WordNet desarrollada por la Universidad Tecnológica de Wrocław .
- PolNet [45] es una versión en polaco de WordNet desarrollada por la Universidad Adam Mickiewicz en Poznań (distribuida bajo licencia CC BY-NC-ND 3.0).
Proyectos como BalkaNet y EuroWordNet hicieron posible la creación de redes de palabras independientes vinculadas a la original. Uno de esos proyectos fue WordNet ruso patrocinado por la Universidad Estatal de Medios de Comunicación de Petersburgo [46] dirigido por SA Yablonsky [47] o Russnet [48] por la Universidad Estatal de San Petersburgo
- UWN es una base de conocimiento léxico multilingüe construida automáticamente que extiende WordNet para cubrir más de un millón de palabras en muchos idiomas diferentes. [49]
- WOLF (WordNet Libre du Français), una versión francesa de WordNet. [50]
Datos vinculados
- BabelNet , [51] una red semántica multilingüe muy grande con millones de conceptos obtenidos al integrar WordNet y Wikipedia usando un algoritmo de mapeo automático.
- La ontología SUMO [52] ha producido un mapeo entre todos los synsets de WordNet (incluidos sustantivos, verbos, adjetivos y adverbios) y clases SUMO . La adición más reciente de las asignaciones proporciona enlaces a todos los términos más específicos de la Ontología de nivel medio (MILO), que amplía SUMO.
- OpenCyc , [53] una ontología abierta y una base de conocimientos del conocimiento del sentido común cotidiano, tiene 12.000 términos vinculados a conjuntos de sinónimos de WordNet.
- DOLCE , [54] es el primer módulo de la Biblioteca de Ontologías Fundamentales de WonderWeb (WFOL). Esta ontología superior se ha desarrollado a la luz de rigurosos principios ontológicos inspirados en la tradición filosófica, con una clara orientación hacia el lenguaje y la cognición. OntoWordNet [55] es el resultado de una alineación experimental del nivel superior de WordNet con DOLCE. Se sugiere que tal alineación podría conducir a una WordNet "endulzada ontológicamente", destinada a ser conceptualmente más rigurosa, cognitivamente transparente y eficientemente explotable en varias aplicaciones.
- DBpedia , [56] una base de datos de información estructurada, está vinculada a WordNet.
- El eXtended WordNet [57] es un proyecto en la Universidad de Texas en Dallas , que tiene como objetivo mejorar WordNet mediante el análisis semántico de las glosas, con lo que la información contenida en estas definiciones disponibles para los sistemas de tratamiento automático de conocimiento. Está disponible gratuitamente bajo una licencia similar a la de WordNet.
- El proyecto GCIDE produjo un diccionario combinando un diccionario Webster de dominio público de 1913 con algunas definiciones de WordNet y material proporcionado por voluntarios. Fue lanzado bajo la licencia copyleft GPL .
- ImageNet es una base de datos de imágenes organizada según la jerarquía de WordNet (actualmente solo los sustantivos), en la que cada nodo de la jerarquía está representado por cientos y miles de imágenes. [58] Actualmente, tiene más de 500 imágenes por nodo en promedio.
- BioWordnet, una extensión biomédica de Wordnet, se abandonó debido a problemas de estabilidad en las versiones. [59]
- WikiTax2WordNet, un mapeo entre los synsets de WordNet y las categorías de Wikipedia . [60]
- WordNet ++, un recurso que incluye más de millones de bordes semánticos recolectados de Wikipedia y que conecta pares de synsets de WordNet. [61]
- SentiWordNet, un recurso para apoyar aplicaciones de minería de opiniones obtenidas al etiquetar todos los synsets de WordNet 3.0 de acuerdo con sus grados estimados de positividad, negatividad y neutralidad. [62]
- ColorDict, es una aplicación de Android para teléfonos móviles que utilizan la base de datos Wordnet y otros, como Wikipedia.
- UBY-LMF una base de datos de 10 recursos que incluye WordNet.
Proyectos relacionados
- FrameNet es una base de datos léxica que comparte algunas similitudes y hace referencia a WordNet.
- El marco de marcado léxico (LMF) es un estándar ISO especificado en ISO / TC37 para definir un marco estandarizado común para la construcción de léxicos, incluido WordNet. El subconjunto de LMF para Wordnet se llama Wordnet-LMF. Se ha realizado una instanciación dentro del proyecto KYOTO. [63]
- El Programa UNL es un proyecto auspiciado por UNO destinado a consolidar datos léxico-semánticos de muchos idiomas para su uso en sistemas de traducción automática y extracción de información .
Distribuciones
La base de datos WordNet se distribuye como un paquete de diccionario (generalmente un solo archivo) para el siguiente software:
- Babilonia [64]
- GoldenDict [65]
- Lingoes [66]
Ver también
- Marco de marcado léxico
- Diccionario legible por máquina
- Anillo de sinónimo
- Taxonomía
- Pensamiento Tesoro
Referencias
- ^ "Noticias de WordNet" .
- ^ "WordNets en el mundo" . Asociación Global WordNet . Consultado el 19 de enero de 2020 .
- ^ "Búsqueda de WordNet - 3.1" .
- ^ GA Miller, R. Beckwith, CD Fellbaum, D. Gross, K. Miller. 1990. WordNet: una base de datos léxica en línea. En t. J. Lexicograph. 3, 4, págs. 235–244.
- ^ "Acerca de la Asociación Global WordNet" . WordNet global . Consultado el 19 de enero de 2020 .
- ^ "Estadísticas de WordNet" . Wordnet.princeton.edu . Consultado el 22 de junio de 2018 .
- ^ Collins A., Quillian MR 1972. Experimentos sobre memoria semántica y comprensión del lenguaje. En cognición en el aprendizaje y la memoria . Wiley, Nueva York.
- ^ http://www.phmartin.info . "Integración de WordNet 1.7 en WebKB-2" . Webkb.org . Consultado el 11 de marzo de 2014 .
- ^ Gangemi, A .; Navigli, R .; Velardi, P. (2003). El proyecto OntoWordNet: extensión y axiomatización de relaciones conceptuales en WordNet (PDF) . Proc. de la Conferencia Internacional sobre Ontologías, Bases de Datos y Aplicaciones de la Semántica (ODBASE 2003) . Catania, Sicilia (Italia). págs. 820–838.
- ^ Oltramari, A .; Gangemi, A .; Guarino, N .; Masolo, C. (2002). Reestructuración del nivel superior de WordNet: el enfoque OntoClean . Taller OntoLex'2, Ontologías y bases de conocimiento léxico (LREC 2002). Las Palmas, España. págs. 17-26. CiteSeerX 10.1.1.19.6574 .
- ^ Rudnicka, Ewa; Bond, Francis; Grabowski, Łukasz; Piasecki, Maciej; Piotrowski, Tadeusz (2018). "Perspectiva léxica de Wordnet a mapeo de Wordnet". Actas de la 9a Conferencia Global WordNet (GWC 2018) : 210.
- ^ Bond, Francis; Foster, Ryan (2013). "Vinculación y ampliación de una Wordnet multilingüe abierta" (PDF) . Actas de la 51ª Reunión Anual de la Asociación de Lingüística Computacional : 1352-1362 . Consultado el 20 de enero de 2020 .
- ^ Fellbaum, Christiane; Vossen, Piek (2012). "Desafíos para una wordnet multilingüe". Recursos lingüísticos y evaluación . 46 (2): 313–326. doi : 10.1007 / s10579-012-9186-z . S2CID 10117946 .
- ^ R. Navigli. Desambiguación del sentido de las palabras: una encuesta , Encuestas de computación de ACM , 41 (2), 2009, págs. 1–69
- ^ E. Agirre, O. López. 2003. Agrupación de WordNet Word Senses. En Proc. de la Conferencia sobre los avances recientes en el lenguaje natural (RANLP'03) , Borovetz, Bulgaria, págs. 121–130.
- ^ R. Navigli. La agrupación significativa de sentidos ayuda a mejorar el rendimiento de la desambiguación del sentido de la palabra , en proceso . de la 44ª Reunión Anual de la Asociación de Lingüística Computacional en conjunto con la 21ª Conferencia Internacional sobre Lingüística Computacional (COLING-ACL 2006) , Sydney, Australia, 17 al 21 de julio de 2006, págs. 105–112.
- ^ R. Snow, S. Prakash, D. Jurafsky, AY Ng. 2007. Aprendiendo a fusionar los sentidos de las palabras , en proceso. de la Conferencia conjunta de 2007 sobre métodos empíricos en el procesamiento del lenguaje natural y el aprendizaje computacional del lenguaje natural (EMNLP-CoNLL) , Praga, República Checa, págs. 1005–1014.
- ^ Julia Carrie Wong. 2019. La aplicación viral de selfies ImageNet Roulette parecía divertida hasta que me llamó un insulto racista . El guardián
- ^ Francis Bond y Kyonghee Paik 2012a. Una encuesta sobre las redes de palabras y sus licencias . En Actas de la Sexta Conferencia Global WordNet (GWC 2012). Matsue. 64–71
- ^ "Abrir Wordnet multilingüe" . compling.hss.ntu.edu.sg . Consultado el 10 de abril de 2018 .
- ^ "Ted Pedersen - WordNet :: similitud" . D.umn.edu. 2008-06-16 . Consultado el 11 de marzo de 2014 .
- ^ PNL usando Python NLTK /
- ^ MT Pilehvar, D. Jurgens y R. Navigli. Alinear, desambiguar y caminar: un enfoque unificado para medir la similitud semántica. . Proc. de la 51ª Reunión Anual de la Asociación de Lingüística Computacional (ACL 2013), Sofía, Bulgaria, 4 al 9 de agosto de 2013, págs. 1341-1351.
- ^ Ballatore A y col. (2014). "Vinculación de vocabularios geográficos a través de WordNet". Anales de GIS . 20 (2): 73–84. arXiv : 1404.5372 . Código bibliográfico : 2014arXiv1404.5372B . doi : 10.1080 / 19475683.2014.904440 . S2CID 9246582 .
- ^ "Proyectos relacionados - WordNet - Proyectos relacionados" . Wordnet.princeton.edu. 2014-01-06 . Consultado el 22 de junio de 2018 .
- ^ La Asociación Global WordNet (2010-02-04). "globalwordnet.org" . globalwordnet.org . Consultado el 11 de marzo de 2014 .
- ^ "Wordnets en el mundo" . Archivado desde el original el 21 de octubre de 2011.
- ^ Black W., Elkateb S., Rodriguez H., Alkhalifa M., Vossen P., Pease A., Bertran M., Fellbaum C., (2006) The Arabic WordNet Project, Actas de LREC 2006
- ^ Lahsen Abouenour, Karim Bouzoubaa, Paolo Rosso (2013) Sobre la evaluación y mejora de la cobertura y usabilidad de WordNet árabe, Recursos lingüísticos y evaluación 47 (3) pp 891-917
- ↑ D. Tufis, D. Cristea, S. Stamou. 2004. Balkanet: Objetivos, métodos, resultados y perspectivas. Una descripción general . Rumano J. Sci. Tech. Informar. (Número especial sobre Balkanet) , 7 (1-2), págs. 9–43.
- ^ "BulNet" . dcl.bas.bg . Consultado el 7 de mayo de 2015 .
- ^ Página oficial de Wordnet chino (中文 詞彙 網路) en la Universidad Nacional de Taiwán
- ^ P. Vossen, Ed. 1998. EuroWordNet: una base de datos multilingüe con redes semánticas léxicas. Kluwer, Dordrecht, Países Bajos.
- ^ "La Asociación Global WordNet" . Globalwordnet.org. 2010-02-04 . Consultado el 5 de enero de 2014 .
- ^ "FinnWordNet - el finlandés WordNet - Departamento de lingüística general" . Ling.helsinki.fi . Consultado el 5 de enero de 2014 .
- ^ "GermaNet" . Sfs.uni-tuebingen.de . Consultado el 11 de marzo de 2014 .
- ^ Pushpak Bhattacharyya, IndoWordNet, Conferencia de ingeniería de recursos léxicos 2010 (LREC 2010), Malta, mayo de 2010.
- ^ C. Mouton, G. de Chalendar. 2010. JAWS: Solo otro subconjunto de WordNet . En Proc. de TALN 2010 .
- ^ Sitio web
- ^ http://adimen.si.ehu.es/web/mcr/
- ↑ E. Pianta, L. Bentivogli, C. Girardi. 2002. MultiWordNet: Desarrollo de una base de datos multilingüe alineada . En Proc. de la 1ª Conferencia Internacional sobre Global WordNet , Mysore, India, págs. 21-25.
- ^ http://wordpress.let.vupr.nl/odwn/
- ^ "arademaker / openWordnet-PT - GitHub" . Github.com . Consultado el 5 de enero de 2014 .
- ^ http://plwordnet.pwr.wroc.pl/wordnet/ página web oficial
- ^ http://www.ltc.amu.edu.pl/polnet/ página web oficial
- ^ "Русский WordNet" . Pgups.ru . Consultado el 5 de enero de 2014 .
- ^ Balkova, Valentina; Sukhonogov, Andrey; Yablonsky, Sergey (2003). "WordNet ruso de la notación UML a la implementación de la base de datos de Internet / Intranet" (PDF) . Actas de GWC 2004 : 31–38 . Consultado el 12 de marzo de 2017 .
- ^ "RussNet: Главная страница" . Project.phil.spbu.ru . Consultado el 11 de marzo de 2014 .
- ^ "UWN: Hacia una Wordnet universal y multilingüe - D5: Bases de datos y sistemas de información (Max-Planck-Institut für Informatik)" . Mpi-inf.mpg.de. 2011-08-14 . Consultado el 5 de enero de 2014 .
- ↑ S. Benoît, F. Darja. 2008. Creación de una red de palabras en francés gratuita a partir de recursos multilingües . En Proc. de Ontolex 2008 , Marrakech, Marruecos.
- ^ R. Navigli, SP Ponzetto. BabelNet: Construyendo una red semántica multilingüe muy grande . Proc. de la 48ª Reunión Anual de la Asociación de Lingüística Computacional (ACL 2010), Uppsala, Suecia, 11 al 16 de julio de 2010, págs. 216–225.
- ^ A. Pease, I. Niles, J. Li. 2002. La ontología combinada superior sugerida: una gran ontología para la Web Semántica y sus aplicaciones . En Proc. del Taller AAAI-2002 sobre Ontologías y Web Semántica , Edmonton, Canadá.
- ^ S. Reed y D. Lenat. 2002. Mapeo de Ontologías en Cyc . En Proc. del Taller de la Conferencia AAAI 2002 sobre Ontologías para la Web Semántica , Edmonton, Canadá, 2002
- ^ Masolo, C., Borgo, S., Gangemi, A., Guarino, N., Oltramari, A., Schneider, LS 2002. WonderWeb Deliverable D17. La biblioteca WonderWeb de ontologías fundamentales y la ontología DOLCE . Informe (ver. 2.0, 15-08-2002)
- ^ Gangemi, A., Guarino, N., Masolo, C., Oltramari, A. 2003 Endulzar WordNet con DOLCE . En AI Magazine 24 (3): otoño de 2003, págs. 13-24
- ^ C. Bizer, J. Lehmann, G. Kobilarov, S. Auer, C. Becker, R. Cyganiak, S. Hellmann, DBpedia - Un punto de cristalización para la Web de datos . Web Semantics, 7 (3), 2009, págs. 154-165
- ^ SM Harabagiu, GA Miller, DI Moldavo. 1999. WordNet 2 - Un recurso mejorado morfológica y semánticamente . En Proc. del taller ACL SIGLEX: estandarización de recursos léxicos , págs. 1–8.
- ^ J. Deng, W. Dong, R. Socher, L. Li, K. Li, L. Fei-Fei. ImageNet: una base de datos de imágenes jerárquicas a gran escala . En Proc. de la Conferencia IEEE de 2009 sobre visión por computadora y reconocimiento de patrones
- ^ M. Poprat, E. Beisswanger, U. Hahn. 2008. Creación de un BIOWORDNET mediante el uso de formatos de datos de WORDNET y la infraestructura de software de WORDNET: una historia de fallas . En Proc. del Taller de Ingeniería de Software, Pruebas y Garantía de Calidad para el Procesamiento del Lenguaje Natural , págs. 31–39.
- ^ S. Ponzetto, R. Navigli. Mapeo de taxonomía a gran escala para reestructurar e integrar Wikipedia , en proceso . de la 21ª Conferencia Internacional Conjunta sobre Inteligencia Artificial (IJCAI 2009) , Pasadena, California, 14-17 de julio de 2009, págs. 2083–2088.
- ^ SP Ponzetto, R. Navigli. La desambiguación del sentido de las palabras, rica en conocimientos, rivaliza con los sistemas supervisados . En Proc. de la 48ª Reunión Anual de la Asociación de Lingüística Computacional (ACL), 2010, págs. 1522–1531.
- ^ S. Baccianella, A. Esuli y F. Sebastiani. SentiWordNet 3.0: un recurso léxico mejorado para el análisis de sentimientos y la minería de opiniones . En Actas de la 7ª Conferencia sobre Evaluación y Recursos Lingüísticos (LREC'10), Valletta, MT, 2010, págs. 2200–2204.
- ^ Piek Vossen, Claudia Soria, Monica Monachini: Wordnet-LMF: una representación estándar para wordnets multilingües, en LMF Lexical Markup Framework , editado por Gil Francopoulo ISTE / Wiley 2013 ( ISBN 978-1-84821-430-9 )
- ^ "Babylon WordNet" . Babylon.com . Consultado el 11 de marzo de 2014 .
- ^ "GoldenDict - Examinar / diccionarios en Sourceforge.net" . Sourceforge.net. 2010-12-01 . Consultado el 5 de enero de 2014 .
- ^ "Lingoes WordNet" . Lingoes.net. 2007-11-16 . Consultado el 11 de marzo de 2014 .
enlaces externos
- Página web oficial
- "Malayalam WordNet" . Ciencias de la Computación . Universidad de Ciencia y Tecnología de Cochin.
- Pilato, María. "Tesauro de adjetivos, intensificadores, negaciones (AIN)" . Sentimiento italiano .