Universal Networking Language ( UNL ) es un lenguaje formal declarativo diseñado específicamente para representar datos semánticos extraídos de textos en lenguaje natural . Se puede utilizar como lenguaje pivote en sistemas de traducción automática interlingüística o como lenguaje de representación del conocimiento en aplicaciones de recuperación de información .
Alcance y objetivos
UNL está diseñado para establecer una base simple para representar los aspectos más centrales de la información y el significado en una forma independiente del lenguaje humano y de la máquina. Como formalismo independiente del idioma, UNL tiene como objetivo codificar, almacenar, difundir y recuperar información independientemente del idioma original en el que se expresó. En este sentido, UNL busca brindar herramientas para superar la barrera del idioma de manera sistemática.
A primera vista, UNL parece ser una especie de interlingua, en el que los textos de origen se convierten antes de traducirse a los idiomas de destino. De hecho, puede usarse para este propósito y también de manera muy eficiente. Sin embargo, su verdadera fortaleza es la representación del conocimiento y su objetivo principal es proporcionar una infraestructura para manejar el conocimiento que ya existe o puede existir en cualquier idioma.
No obstante, es importante señalar que en la actualidad sería una tontería pretender representar el significado “completo” de cualquier palabra, oración o texto en cualquier idioma. Las sutilezas de la intención y la interpretación hacen que el "significado pleno", como sea que lo concibamos, sea demasiado variable y subjetivo para cualquier tratamiento sistemático. Por lo tanto, la UNL evita las trampas de tratar de representar el "significado completo" de las oraciones o los textos, y en su lugar se enfoca en el significado "central" o "consensual" que se les atribuye con mayor frecuencia. En este sentido, gran parte de la sutileza de la poesía, la metáfora, el lenguaje figurativo, las insinuaciones y otros comportamientos comunicativos indirectos complejos están más allá del alcance y los objetivos actuales de la UNL. En cambio, UNL se enfoca en el comportamiento comunicativo directo y el significado literal como una base tangible y concreta para la mayoría de la comunicación humana en entornos prácticos del día a día.
Estructura
En el enfoque UNL, la información transmitida por el lenguaje natural se representa oración por oración como un hipergrama compuesto por un conjunto de enlaces etiquetados binarios dirigidos (referidos como relaciones ) entre nodos o hipernodos (las Palabras Universales , o simplemente UW ), que significan conceptos. Los UW también se pueden anotar con atributos que representan información de contexto.
Como ejemplo, la oración en inglés '¡¿El cielo era azul ?!' se puede representar en UNL de la siguiente manera:
En el ejemplo anterior, "cielo (icl> mundo natural)" y "azul (icl> color)", que representan conceptos individuales, son UW; "aoj" (= atributo de un objeto) es una relación semántica binaria dirigida que une los dos UW; y "@def", "@interrogative", "@past", "@exclamation" y "@entry" son atributos que modifican UW.
Los UW están destinados a representar conceptos universales, pero se expresan en palabras en inglés o en cualquier otro idioma natural para que sean legibles por humanos. Consisten en una "palabra clave" (la raíz UW) y una "lista de restricciones" (el sufijo UW entre paréntesis), donde las restricciones se utilizan para eliminar la ambigüedad del concepto general transmitido por la palabra principal. El conjunto de UW se organiza en la Ontología UNL, en la que los conceptos de alto nivel se relacionan con los de nivel inferior a través de las relaciones "icl" (= es una especie de), "iof" (= es una instancia de) y " equ "(= es igual a).
Las relaciones están destinadas a representar vínculos semánticos entre palabras en todos los idiomas existentes. Pueden ser ontológicos (como "icl" e "iof", mencionados anteriormente), lógicos (como "y" y "o") y temáticos (como "agt" = agente, "ins" = instrumento, "tim" = tiempo, "plc" = lugar, etc.). Actualmente hay 46 relaciones en las especificaciones de la UNL. Definen conjuntamente la sintaxis UNL.
Los atributos representan información que los UW y las relaciones no pueden transmitir. Normalmente, representan información relativa al tiempo ("@past", "@future", etc.), referencia ("@def", "@indef", etc.), modalidad ("@can", "@must", etc.), enfoque ("@tema", "@enfoque", etc.), etc.
Dentro del Programa UNL, el proceso de representar oraciones en lenguaje natural en gráficos UNL se llama UNLization , y el proceso de generar oraciones en lenguaje natural a partir de gráficos UNL se llama NLization . La UNLization, que implica el análisis y la comprensión del lenguaje natural, está destinada a ser realizada de forma semiautomática (es decir, por humanos con ayudas informáticas); y NLization está destinado a realizarse de forma totalmente automática.
Historia
El Programa UNL comenzó en 1996, como una iniciativa del Instituto de Estudios Avanzados de la Universidad de las Naciones Unidas en Tokio, Japón. En enero de 2001, la Universidad de las Naciones Unidas creó una organización autónoma, la Fundación UNDL, que se encargaría del desarrollo y la gestión del Programa UNL. La fundación, una organización internacional sin fines de lucro, tiene una identidad independiente de la Universidad de las Naciones Unidas, aunque tiene vínculos especiales con la ONU. Heredó de la UNU / IAS el mandato de implementar el Programa UNL para que pueda cumplir con su misión.
El programa ya ha superado hitos importantes. La arquitectura general del Sistema UNL se ha desarrollado con un conjunto de software y herramientas básicos necesarios para su funcionamiento. Estos se están probando y mejorando. En los últimos años se ha acumulado una gran cantidad de recursos lingüísticos de las distintas lenguas nativas ya en desarrollo, así como de la expresión UNL. Además, ya se cuenta con la infraestructura técnica para ampliar estos recursos, lo que facilita la participación de muchos más idiomas en el sistema UNL a partir de ahora. Cada año se publica un número creciente de artículos científicos y disertaciones académicas sobre la UNL.
El logro más visible hasta ahora es el reconocimiento por parte del Tratado de Cooperación en materia de Patentes (PCT) del carácter innovador y la aplicabilidad industrial de la UNL, que se obtuvo en mayo de 2002 a través de la Organización Mundial de la Propiedad Intelectual (OMPI). Adquirir las patentes (patentes estadounidenses 6.704.700 y 7.107.206) para la UNL es un logro completamente nuevo dentro de las Naciones Unidas.
Ver también
enlaces externos
- UNLweb , el portal de UNLweb
- Fundación UNDL donde se coordina el desarrollo de UNL.
- Libro en línea sobre UNL
- Descripción del sistema UNL