En la lexicografía digital , el procesamiento del lenguaje natural y las humanidades digitales , un recurso léxico es un recurso lingüístico que consta de datos relacionados con los lexemas del léxico de uno o más idiomas , por ejemplo, en forma de una base de datos . [1]
Caracteristicas
Existen diferentes estándares para la edición legible por máquina de recursos léxicos, por ejemplo, Lexical Markup Framework (LMF), un estándar ISO para codificar recursos léxicos, que comprende un modelo de datos abstracto y una serialización XML , [2] y OntoLex-Lemon , un vocabulario RDF para publicar recursos léxicos como gráficos de conocimiento en la web, por ejemplo, como Linguistic Linked Open Data . [3]
Dependiendo del tipo de idiomas que se aborden, un recurso léxico puede calificarse como monolingüe , bilingüe o multilingüe . Para los recursos léxicos bilingües y multilingües, las palabras pueden estar conectadas o no conectadas de un idioma a otro. Cuando se conecta, la equivalencia de un idioma a otro se realiza a través de un enlace bilingüe (para recursos léxicos bilingües, por ejemplo, usando la relación vartrans: traducibleAs en OntoLex-Lemon ) o mediante notaciones multilingües (para recursos léxicos multilingües, por ejemplo, por referencia el mismo ontolex: Concepto en OntoLex-Lemon). [4]
También es posible construir y administrar un recurso léxico que consta de diferentes léxicos del mismo idioma, por ejemplo, un diccionario para palabras generales y uno o varios diccionarios para diferentes dominios especializados.
Diccionario legible por máquina frente a diccionario PNL
Los recursos léxicos en lexicografía digital a menudo se denominan diccionario legible por máquina ( MRD ), un diccionario almacenado como datos de máquina (computadora) en lugar de imprimirse en papel. Es un diccionario electrónico y base de datos léxica. El término MRD a menudo se contrasta con el diccionario de PNL , en el sentido de que un MRD es la forma electrónica de un diccionario que se imprimió antes en papel. Aunque ambos son utilizados por programas, por el contrario, se prefiere el término diccionario de PNL cuando el diccionario se creó desde cero teniendo en cuenta la PNL. [5]
Base de datos léxica
Una base de datos léxica es un recurso léxico que tiene asociada una base de datos de entorno de software que permite acceder a su contenido. La base de datos puede diseñarse a medida para la información léxica o una base de datos de propósito general en la que se ha ingresado la información léxica.
La información normalmente almacenada en una base de datos léxica incluye ortografía , categoría léxica y sinónimos de palabras, así como relaciones semánticas y fonológicas entre diferentes palabras o conjuntos de palabras.
Enlaces
Ver también
- Lexical Markup Framework (LMF) , estándar ISO para codificar recursos léxicos, que comprende un modelo de datos abstracto y una serialización XML
- OntoLex-Lemon , vocabulario RDF para publicar recursos léxicos en la web, por ejemplo, como Linguistic Linked Open Data
- Base de datos léxica
- Serie de conferencias LREC
- Diccionario legible por máquina
- WordNet
Recursos de muestra
enlaces externos
- La página de inicio de WordNet
- Motor de búsqueda lexicográfico
Referencias
- ^ SARMA, Shikhar Kr, et al. Construcción de recursos léxicos multilingües utilizando wordnets: estructura, diseño e implementación . En: Actas del 3er Taller sobre Aspectos Cognitivos del Léxico . 2012. S. 161-170.
- ^ Francopoulo, Gil; Bel, Nuria; George, Monte; Calzolari, Nicoletta; Monachini, Monica; Mascota, Mandy; Soria, Claudia (1 de marzo de 2009). "Recursos multilingües para PNL en el marco de marcado léxico (LMF)" (PDF) . Recursos lingüísticos y evaluación . 43 (1): 57–70. doi : 10.1007 / s10579-008-9077-5 . ISSN 1574-0218 . S2CID 7697316 .
- ^ Cimiano, Philipp; Chiarcos, Christian; McCrae, John P .; Gracia, Jorge (2020), Linguistic Linked Data: Representation, Generation and Applications , Springer International Publishing, págs. 45–59, doi : 10.1007 / 978-3-030-30225-2_4 , ISBN 978-3-030-30225-2
- ^ Cimiano, Phillip; McCrae, John P .; Buitelaar, Paul. "Modelo de léxico para ontologías: informe de la comunidad, 10 de mayo de 2016 Informe final del grupo de la comunidad 10 de mayo de 2016" . W3C . Consultado el 6 de diciembre de 2019 .
- ^ Gil Francopoulo (editado por) LMF Lexical Markup Framework, ISTE / Wiley 2013 ( ISBN 978-1-84821-430-9 )