BabelNet es una ontología y red semántica lexicalizada multilingüe desarrollada en el grupo de PNL de la Universidad Sapienza de Roma . [1] [2] BabelNet se creó automáticamente al vincular Wikipedia al léxico computacional más popular del idioma inglés , WordNet . La integración se realiza mediante un mapeo automático y rellenando las lagunas léxicas en idiomas de escasos recursos mediante traducción automática estadística . El resultado es un diccionario enciclopédico que proporciona conceptosy entidades nombradas lexicalizadas en muchos idiomas y conectadas con grandes cantidades de relaciones semánticas . Se agregan lexicalizaciones y definiciones adicionales mediante enlaces a redes de palabras de licencia libre, OmegaWiki, el Wiktionary en inglés , Wikidata , FrameNet , VerbNet y otros. De manera similar a WordNet, BabelNet agrupa palabras en diferentes idiomas en conjuntos de sinónimos , llamados synsets de Babel . Para cada synset de Babel, BabelNet proporciona definiciones breves (llamadas glosas ) en muchos idiomas extraídos de WordNet y Wikipedia.
![]() | |
Lanzamiento estable | BabelNet 5.0 / febrero de 2021 |
---|---|
Sistema operativo | |
Tipo | |
Licencia | Attribution-NonCommercial-ShareAlike 3.0 Unported |
Sitio web | babelnet |

Estadísticas de BabelNet
A abril de 2021[actualizar], BabelNet (versión 5.0) cubre 500 idiomas . Contiene casi 20 millones de synsets y alrededor de 1.400 millones de sentidos de palabras (independientemente de su idioma). Cada synset de Babel contiene 2 sinónimos por idioma, es decir, sentidos de la palabra, en promedio. La red semántica incluye todas las relaciones léxico-semánticas de WordNet ( hipernimia e hiponimia , meronimia y holonimia , antonimia y sinonimia , etc., con un total de alrededor de 364.000 aristas de relación), así como una relación de parentesco subespecificada de Wikipedia (con un total de alrededor de 1.300 millones de aristas). . [1] La versión 5.0 también asocia alrededor de 51 millones de imágenes con los synsets de Babel y proporciona una codificación Lemon RDF del recurso, [3] disponible a través de un punto final SPARQL . A 2,67 millones de synsets se les asignan etiquetas de dominio.
Aplicaciones
Se ha demostrado que BabelNet habilita aplicaciones multilingües de procesamiento del lenguaje natural . Se ha demostrado que el conocimiento lexicalizado disponible en BabelNet obtiene resultados de vanguardia en:
- relación semántica [4] [5]
- Desambiguación del sentido de la palabra multilingüe [6]
- Desambiguación multilingüe del sentido de la palabra y vinculación de entidades con el sistema Babelfy [7]
- videojuegos con un propósito [8]
Premios y reconocimientos
BabelNet recibió el premio META 2015 por "un trabajo pionero en la superación de las barreras del idioma a través de una red semántica lexicalizada multilingüe y una ontología que utiliza fuentes de datos heterogéneas".
Babelnet un lugar destacado en la revista TIME 's artículo [9] sobre la nueva era de recursos innovadores y hasta a la fecha de conocimiento léxico disponible en la Web.
Ver también
- Babelfy
- EuroWordNet
- Adquisición de conocimientos
- Datos abiertos vinculados lingüísticamente
- Red semántica
- Relación semántica
- Wikidata
- Wikcionario
- Desambiguación del sentido de las palabras
- Inducción del sentido de la palabra
- UBY
Referencias
- ^ R. Navigli, SP Ponzetto. BabelNet: Construyendo una red semántica multilingüe muy grande . Proc. de la 48ª Reunión Anual de la Asociación de Lingüística Computacional (ACL 2010), Uppsala, Suecia, 11 al 16 de julio de 2010, págs. 216–225.
- ^ M. Ehrmann, F. Cecconi, D. Vannella, J. McCrae, P. Cimiano, R. Navigli. Representar datos multilingües como datos enlazados: el caso de BabelNet 2.0 . Proc. de la Novena Conferencia de Evaluación y Recursos Lingüísticos (LREC 2014), Reykjavik, Islandia, 26-31 de mayo de 2014.
- ^ R. Navigli y S. Ponzetto. 2012. BabelRelate! Un enfoque multilingüe conjunto para calcular la relación semántica . Proc. de la 26a Conferencia AAAI sobre Inteligencia Artificial (AAAI 2012), Toronto, Canadá, págs. 108-114.
- ^ J. Camacho-Collados, MT Pilehvar y R. Navigli. NASARI: un enfoque novedoso para una representación semánticamente consciente de elementos . Proc. de la Conferencia de 2015 del Capítulo Norteamericano de la Asociación de Lingüística Computacional (NAACL 2015), Denver, Colorado (EE. UU.), 31 de mayo a 5 de junio de 2015, págs. 567-577.
- ^ R. Navigli y S. Ponzetto. Unir fuerzas da resultado: desambiguación multilingüe de sentido común de palabras . Proc. de la Conferencia de 2012 sobre métodos empíricos en el procesamiento del lenguaje natural (EMNLP 2012), Jeju, Corea, 12 al 14 de julio de 2012, págs. 1399-1410.
- ^ A. Moro, A. Raganato, R. Navigli. Entity Linking se encuentra con Word Sense Disambiguation: a Unified Approach Archivado el 8 de agosto de 2014 en Wayback Machine Transactions de la Asociación de Lingüística Computacional (TACL), 2, págs. 231-244, 2014.
- ^ D. Jurgens, R. Navigli. "Todo es diversión y juegos hasta que alguien anota: videojuegos con un propósito para la anotación lingüística" (PDF) . Archivado desde el original el 3 de enero de 2015 . Consultado el 3 de enero de 2015 .CS1 maint: bot: estado de URL original desconocido ( enlace ) Transacciones de la Asociación de Lingüística Computacional (TACL), 2, págs. 449-464, 2014.
- ^ Katy Steinmetz. Redefiniendo el diccionario moderno , revista TIME, vol. 187, 23 de mayo de 2016, págs. 20-21.
enlaces externos
- Página web oficial