Diccionario combinatorio explicativo

Un diccionario combinatorio explicativo (ECD) es un tipo de diccionario monolingüe diseñado para ser parte de un modelo lingüístico de significado-texto de un lenguaje natural. ^[1]^[2]^[3] Se pretende que sea un registro completo del léxico de un idioma determinado. ^[4] Como tal, identifica y describe, en entradas separadas, cada uno de los lexemas del idioma (hablando en términos generales, cada palabra o conjunto de formas flexionadas basadas en una sola raíz) y frases (hablando en términos generales, modismos y otras palabras fijas de varias palabras). expresiones). Entre otras cosas, cada entrada contiene (1) una definición que incorpora los actantes semánticos de un lexema (por ejemplo, el definiendum dedar toma la forma X da Y a Z , donde se expresan sus tres actantes: el dador X , la cosa dada Y y la persona dada a, Z ) (2) información completa sobre la co-ocurrencia léxica (por ejemplo, la entrada para el ataque le dice que una de sus colocaciones es lanzar un ataque , la entrada para fiesta proporciona lanzar una fiesta y la entrada para conferencia proporciona entregar una conferencia , lo que permite al usuario evitar cometer un error como * entregar una fiesta ); (3) un extenso conjunto de ejemplos. El ECD es un diccionario de producción, es decir, tiene como objetivo proporcionar toda la información necesaria para que un alumno o autómata extranjero produzca expresiones del idioma perfectamente formadas. Dado que los lexemas y frases de un lenguaje natural se cuentan por cientos de miles, un ECD completo, en papel, ocuparía el espacio de una gran enciclopedia. Ese trabajo aún no se ha realizado; aunque se han publicado ECD en ruso y francés, cada uno describe menos del uno por ciento del vocabulario de los respectivos idiomas.

El ECD fue propuesto a finales de la década de 1960 por Aleksandr Žolkovskij e Igor Mel'čuk ^[5]^[6]^[7] y posteriormente fue desarrollado por Jurij Apresjan. ^[8]^[9]^[10]^[11]^[12]^[13]^[14]^[15]^[16] Actualmente hay tres ECD disponibles impresos, uno para ruso, ^[17] y dos para francés. ^[18]^[19] Se está desarrollando un diccionario de colocaciones en español —DICE (= Diccionario de colocaciones del español). ^[20]^[21]

Características de un ECD

Un ECD completo de un idioma proporcionaría una entrada para cada lexema, construcción o expresión idiomática, denominados colectivamente "Unidades Léxicas" (LU), en uso en el idioma. Las entradas en el ECD se basan en la definición semántica de una LU, y cada entrada contiene una lista completa de sus colocaciones y funciones léxicas también. ^[22]

Las entradas para Unidades Léxicas históricamente relacionadas que son homófonas y comparten un componente semántico significativo (es decir, significados) se agrupan en unidades más grandes llamadas "vocablos", reconociendo así la polisemia mientras se mantiene el estado distintivo de los elementos independientes en cuestión. El mejoramiento del vocabulario en inglés , por ejemplo, incluye seis unidades léxicas, cada una de las cuales tiene una entrada léxica separada:

MEJORAR , verbo

MEJORAR I.1a X mejora ≡ 'El valor o la calidad de X aumenta'

[ El clima mejoró repentinamente; El sistema mejorará con el tiempo ]

MEJORAR I.1b X mejora Y ≡ 'X provoca ₁ que Y mejora I.1a '

[ Los cambios más recientes mejoraron drásticamente el sistema ]

MEJORA I.2 X mejora ≡ 'La salud de una persona enferma X mejora I.1a '

[ Jim está mejorando constantemente ]

MEJORA I.3 X mejora en Y ≡ 'La ejecución de X de Y mejora I.1a , que es causada ₁ por X que ha practicado o practicado Y'

[ Jim está mejorando constantemente en álgebra ]

MEJORAR II X mejora Y al hacer Z-ing ≡ 'X causa voluntariamente ₂ que el valor de mercado de una propiedad inmobiliaria Y aumenta al hacer Z-ing a Y'

[ Jim mejoró su casa instalando plomería interior ]

MEJORA III X mejora Y ≡ 'X crea una nueva Y´ mejorando I.1b Y'

[ Jim ha mejorado drásticamente la traducción de Patrick ]

Los números lexicográficos (en negrita después de la palabra de entrada) reflejan grados o niveles de distancia semántica entre Unidades Léxicas dentro de un vocablo: los números romanos marcan las agrupaciones semánticas de nivel más alto, mientras que los números arábigos marcan el siguiente nivel más alto y las letras indican el nivel más bajo distancias niveladas. Los cuatro lexemas agrupados bajo MEJORAR I , por ejemplo, se consideran más cercanos entre sí que MEJORAR II o MEJORAR III , porque los significados de cada uno de MEJORAR I.1by MEJORAR I.2 en realidad incluyen el significado de MEJORAR I. 1a . MEJORAR I.1ay MEJORAR I.1b están aún más estrechamente relacionados porque en inglés hay muchos pares de palabras, específicamente, verbos lábiles o ambitransitivos , que están relacionados por la alternancia semántica 'P' ~ 'causa ₁ a P' (como por arriba, 'mejorar' ~ 'hacer mejorar').

Los números de subíndice y superíndice adjuntos a las palabras en la definición se refieren a subsensos (subíndices) y entradas homófonas (superíndices) de una palabra como se indica en el Longman Dictionary of Contemporary English ^{[23]; por lo} tanto, "dispositivo ₁¹ " se refiere a la primera entrada para dispositivo en este diccionario, primer subsense.

Estructura de la entrada ECD

Una entrada ECD para una unidad léxica determinada, llamémosla "L", se divide en tres secciones principales o "zonas":

La zona semántica

La zona semántica describe las propiedades semánticas de L y consta de dos subzonas:

1) la definición de L, que especifica completamente el significado de L; y

2) Connotaciones de L (significados que el lenguaje asocia con L, pero que no forman parte de su definición). ^[24]^[25]

La zona fonológica / grafemática

La zona fonológica / grafemática proporciona todos los datos sobre las propiedades fonológicas de L. Aquí nuevamente encontramos dos subzonas:

1) la pronunciación de L, incluida su silabificación y cualquier propiedad prosódica no estándar; ^[26] y

2) información ortográfica sobre las variantes ortográficas de L, etc.

La zona de co-ocurrencia

La zona de co-ocurrencia presenta todos los datos sobre las propiedades combinatorias de L. Está organizado en cinco subzonas: morfológica, sintáctica, léxica, estilística y pragmática.

La subzona morfológica contiene datos de inflexión, incluida la clase de conjugación / declinación, formas irregulares, formas faltantes, alternancias permitidas, etc. ^[27]

La subzona sintáctica tiene dos partes:

a) Patrón de gobierno, que describe los elementos que L puede gobernar sintácticamente (argumentos, complementos, etc.);

b) Parte del habla y características sintácticas, que describe las construcciones en las que L puede aparecer como dependiente sintáctico .

La subzona léxica especifica las funciones léxicas en las que participa L, cubriendo tanto las derivaciones semánticas como las colocaciones de L con otras LU individuales o grupos de LU muy pequeños e irregulares.

La subzona estilística especifica el registro de habla de L (informal, coloquial, vulgar, poético, etc.), la variabilidad temporal (obsolescente, arcaica) y geográfica (británica, india, australiana) y similares.

La subzona pragmática describe las situaciones de la vida real en las que una expresión en particular es apropiada o inapropiada.

Referencias

↑ Mel'čuk, Igor A. (2006). Diccionario Combinatorio Explicativo. En Giandomenico Sica (ed.), Problemas abiertos en lingüística y lexicografía, 225–355. Monza: Polimétrica
^ Pearson, Jennifer. 1998 Términos en contexto. Amsterdam: John Benjamins 76–82.
^ Fontenelle, Thierry. (2008) Uso de un diccionario bilingüe para crear redes semánticas. En Thierry Fontenelle (ed.), Practical Lexicography: A reader, 175. Oxford: Oxford University Press.
^ Frawley, William. (1988). Nuevas formas de diccionarios especializados. Revista Internacional de Lexicografía 1, 189–213.
^ Žolkovskij, Aleksandr; Igor A. Mel'čuk (1965). "O vozmožnom metode i instrumentax semantičeskogo sinteza [Sobre un posible método y herramientas para la síntesis semántica]". Naučno-texničeskaja informacija . 5 : 23-28.
^ Žolkovskij, Aleksandr; Igor A. Mel'čuk (1966). "O sisteme semantičeskogo sinteza. I. Stroenie slovarja [Sobre un sistema de síntesis semántica. I. Estructura del diccionario]". Naučno-texničeskaja informacija . 11 : 48–55.
^ Žolkovskij, Aleksandr; Igor A. Mel'čuk (1967). "O semantičeskom sinteze [sobre síntesis semántica]". Problemy Kibernetiki . 19 : 177-238.
^ Apresjan, Jurij (1969). "Tolkovanie leksičeskix značenij kak problema teoretičeskoj semantiki [Definición de significados léxicos como un problema de semántica teórica]". Izvestija Akademii Nauk SSSR, Serija Lit. Yo Jazyka . 28 : 11-23.
^ Apresjan, Jurij (1969). "O jazyke dlja opisanija značenij slov [En un lenguaje para la descripción de significados léxicos]". Izvestija Akademii Nauk SSSR, Serija Lit. Yo Jazyka . 28 : 415–428.
^ Apresjan, Jurij (1974). Leksičeskaja semantika. Sinonimičeskie sredstva jazyka [Semántica léxica. Medios sinonímicos de la lengua . Moscú: Nauka.
^ Apresjan, Jurij (1980). Tipy informacii dlja poverxnostno-semantičeskogo komponenta modeli Smysl ⇔ Tekst [Tipos de información para el componente semántico de superficie del modelo de texto de significado] . Viena: Wiener Slawistischer Almanach.
^ Apresjan, Juirj (1988). Karaulov, Jurij (ed.). "Morfologičeskaja informacija dlja tolkovogo slovarja [Información morfológica en un diccionario monolingüe]". Slovarnye Kategorii . Moscú: Nauka: 31–59.
^ Apresjan, Jurij (1988). "Tipy kommunikativnoj informacii dlja tolkovogo slovarja [Tipos de información comunicativa para un diccionario monolingüe]". Jazyk: Sistema I Funkcionirovanie . Moscú: Nauka: 10-22.
^ Apresjan, Jurij (1990). "Tipy leksikografičeskoj informacii ob označajuščem leksemy [Tipos de información lexicográfica sobre el significante de un Lexeme]". Tipologija I Grammatika . Moscú: Nauka: 91–108.
^ Apresjan, Jurij (1990). "Modelo formal´naja´ jazyka i predstavlenie leksikografičeskix znanij [Un modelo formal de lenguaje y representación del conocimiento lexicográfico]". IVoprosy Jazykoznanija . 6 : 91-108.
^ Apresjan, Jurij (1995). Izbrannye trudy. Tom II. Integral´noe opisanie jazyka i sistemnaja leksikografija [Escritos seleccionados. Vol II. Una descripción lingüística integral y lexicografía sistémica . Moscú: Škola «Jazyki russkoj kul´tury».
^ Mel'čuk, Igor A .; Alexander Zholkovsky (1984). Diccionario Combinatorio Explicativo del Ruso Moderno. Estudios semántico-sintácticos del vocabulario ruso . Viena: Wiener Slawistischer Almanach.
^ Mel'čuk, Igor A .; Arbatchewsky-Jumarie, N .; Iordanskaja, Lida; Mantha, S .; Polguère, Alain (1999). Dictionnaire explicatif et combinatoire du français contemporain. Recherches lexico-sémantiques IV . Montreal: Les Presses de l'Université de Montréal.
^ Mel'čuk, Igor A .; Alain Polguère (2007). Lexique actif du français: L'apprentissage du vocabulaire fondé sur 20000 dérivations sémantiques et collocations du français . París: Duculot.
^ Alonso Ramos, Margarita (2003). Fernández Montraveta, A., A. Martí Antonin y G. Vásquez García (ed.). "Hacia un diccionario de colocacionnes del español y su codificación". Lexicografía computacional y semántica . Barcelona: Universidad de Barcelona : 11–34.
^ Alonso Ramos, Margarita (2004). Bataner, P. y J. DeCesaris García (ed.). "Elaboración del Diccionario de colocaciones del español y sus aplicaciones". De lexicografia: Actes del I Symposium internacional de lexicografia, Barcelona: IULA : 149–162.
^ Frawley, William. (1988). Nuevas formas de diccionarios especializados. Revista Internacional de Lexicografía 1, 189–213.
^ Diccionario Longman de Inglés Contemporáneo . Londres: Longman. 1978.
^ Iordanskaja, Lida; Igor A. Mel'čuk (1984). "Connotación en sémantique et lexicographie". Dictionnaire explicatif et du français contemporain combinatoire: Recherches léxico-I sémantiques . Montreal: Presses de l'Université de Montréal: 33–40.
^ Iordanskaja, Lida; Igor A. Mel'čuk (2006). Berger, T., K. Gutschmidt, S. Kempgen y P. Kosta (ed.). "Connotación". Las lenguas eslavas: un manual internacional de su historia, su estructura y su investigación . Nueva York: Walter de Gruyter.
^ Apresjan, Jurij (1990). "Tipy leksikografičeskoj informacii ob označajuščem leksemy [Tipos de información lexicográfica sobre el significante de un Lexeme]". Tipologija I Grammatika . Moscú: Nauka: 91–108.
^ Apresjan, Juirj (1988). Karaulov, Jurij (ed.). "Morfologičeskaja informacija dlja tolkovogo slovarja [Información morfológica en un diccionario monolingüe]". Slovarnye Kategorii . Moscú: Nauka: 31–59.

[1] Mel'čuk, Igor A. (2006). Diccionario Combinatorio Explicativo. En Giandomenico Sica (ed.), Problemas abiertos en lingüística y lexicografía, 225–355. Monza: Polimétrica

[2] Pearson, Jennifer. 1998 Términos en contexto. Amsterdam: John Benjamins 76–82.

[3] Fontenelle, Thierry. (2008) Uso de un diccionario bilingüe para crear redes semánticas. En Thierry Fontenelle (ed.), Practical Lexicography: A reader, 175. Oxford: Oxford University Press.

[4] Frawley, William. (1988). Nuevas formas de diccionarios especializados. Revista Internacional de Lexicografía 1, 189–213.

[5] Žolkovskij, Aleksandr; Igor A. Mel'čuk (1965). "O vozmožnom metode i instrumentax semantičeskogo sinteza [Sobre un posible método y herramientas para la síntesis semántica]". Naučno-texničeskaja informacija . 5 : 23-28.

[6] Žolkovskij, Aleksandr; Igor A. Mel'čuk (1966). "O sisteme semantičeskogo sinteza. I. Stroenie slovarja [Sobre un sistema de síntesis semántica. I. Estructura del diccionario]". Naučno-texničeskaja informacija . 11 : 48–55.

[7] Žolkovskij, Aleksandr; Igor A. Mel'čuk (1967). "O semantičeskom sinteze [sobre síntesis semántica]". Problemy Kibernetiki . 19 : 177-238.

[8] Apresjan, Jurij (1969). "Tolkovanie leksičeskix značenij kak problema teoretičeskoj semantiki [Definición de significados léxicos como un problema de semántica teórica]". Izvestija Akademii Nauk SSSR, Serija Lit. Yo Jazyka . 28 : 11-23.

[9] Apresjan, Jurij (1969). "O jazyke dlja opisanija značenij slov [En un lenguaje para la descripción de significados léxicos]". Izvestija Akademii Nauk SSSR, Serija Lit. Yo Jazyka . 28 : 415–428.

[10] Apresjan, Jurij (1974). Leksičeskaja semantika. Sinonimičeskie sredstva jazyka [Semántica léxica. Medios sinonímicos de la lengua . Moscú: Nauka.

[11] Apresjan, Jurij (1980). Tipy informacii dlja poverxnostno-semantičeskogo komponenta modeli Smysl ⇔ Tekst [Tipos de información para el componente semántico de superficie del modelo de texto de significado] . Viena: Wiener Slawistischer Almanach.

[12] Apresjan, Juirj (1988). Karaulov, Jurij (ed.). "Morfologičeskaja informacija dlja tolkovogo slovarja [Información morfológica en un diccionario monolingüe]". Slovarnye Kategorii . Moscú: Nauka: 31–59.

[13] Apresjan, Jurij (1988). "Tipy kommunikativnoj informacii dlja tolkovogo slovarja [Tipos de información comunicativa para un diccionario monolingüe]". Jazyk: Sistema I Funkcionirovanie . Moscú: Nauka: 10-22.

[14] Apresjan, Jurij (1990). "Tipy leksikografičeskoj informacii ob označajuščem leksemy [Tipos de información lexicográfica sobre el significante de un Lexeme]". Tipologija I Grammatika . Moscú: Nauka: 91–108.

[15] Apresjan, Jurij (1990). "Modelo formal´naja´ jazyka i predstavlenie leksikografičeskix znanij [Un modelo formal de lenguaje y representación del conocimiento lexicográfico]". IVoprosy Jazykoznanija . 6 : 91-108.

[16] Apresjan, Jurij (1995). Izbrannye trudy. Tom II. Integral´noe opisanie jazyka i sistemnaja leksikografija [Escritos seleccionados. Vol II. Una descripción lingüística integral y lexicografía sistémica . Moscú: Škola «Jazyki russkoj kul´tury».

[17] Mel'čuk, Igor A .; Alexander Zholkovsky (1984). Diccionario Combinatorio Explicativo del Ruso Moderno. Estudios semántico-sintácticos del vocabulario ruso . Viena: Wiener Slawistischer Almanach.

[18] Mel'čuk, Igor A .; Arbatchewsky-Jumarie, N .; Iordanskaja, Lida; Mantha, S .; Polguère, Alain (1999). Dictionnaire explicatif et combinatoire du français contemporain. Recherches lexico-sémantiques IV . Montreal: Les Presses de l'Université de Montréal.

[19] Mel'čuk, Igor A .; Alain Polguère (2007). Lexique actif du français: L'apprentissage du vocabulaire fondé sur 20000 dérivations sémantiques et collocations du français . París: Duculot.

[20] Alonso Ramos, Margarita (2003). Fernández Montraveta, A., A. Martí Antonin y G. Vásquez García (ed.). "Hacia un diccionario de colocacionnes del español y su codificación". Lexicografía computacional y semántica . Barcelona: Universidad de Barcelona : 11–34.

[21] Alonso Ramos, Margarita (2004). Bataner, P. y J. DeCesaris García (ed.). "Elaboración del Diccionario de colocaciones del español y sus aplicaciones". De lexicografia: Actes del I Symposium internacional de lexicografia, Barcelona: IULA : 149–162.

[22] Frawley, William. (1988). Nuevas formas de diccionarios especializados. Revista Internacional de Lexicografía 1, 189–213.

[23] Diccionario Longman de Inglés Contemporáneo . Londres: Longman. 1978.

[24] Iordanskaja, Lida; Igor A. Mel'čuk (1984). "Connotación en sémantique et lexicographie". Dictionnaire explicatif et du français contemporain combinatoire: Recherches léxico-I sémantiques . Montreal: Presses de l'Université de Montréal: 33–40.

[25] Iordanskaja, Lida; Igor A. Mel'čuk (2006). Berger, T., K. Gutschmidt, S. Kempgen y P. Kosta (ed.). "Connotación". Las lenguas eslavas: un manual internacional de su historia, su estructura y su investigación . Nueva York: Walter de Gruyter.

[26] Apresjan, Jurij (1990). "Tipy leksikografičeskoj informacii ob označajuščem leksemy [Tipos de información lexicográfica sobre el significante de un Lexeme]". Tipologija I Grammatika . Moscú: Nauka: 91–108.

[27] Apresjan, Juirj (1988). Karaulov, Jurij (ed.). "Morfologičeskaja informacija dlja tolkovogo slovarja [Información morfológica en un diccionario monolingüe]". Slovarnye Kategorii . Moscú: Nauka: 31–59.

[1]