similitud léxica


En lingüística , la similitud léxica es una medida del grado en que los conjuntos de palabras de dos idiomas dados son similares. Una similitud léxica de 1 (o 100%) significaría una superposición total entre los vocabularios, mientras que 0 significa que no hay palabras comunes.

Hay diferentes formas de definir la similitud léxica y los resultados varían en consecuencia. Por ejemplo, el método de cálculo de Ethnologue consiste en comparar una lista de palabras estandarizada regionalmente (comparable a la lista Swadesh ) y contar aquellas formas que muestran similitud tanto en forma como en significado. Con este método, se evaluó que el inglés tenía una similitud léxica del 60 % con el alemán y del 27 % con el francés .

La similitud léxica se puede utilizar para evaluar el grado de relación genética entre dos idiomas. Los porcentajes superiores al 85 % suelen indicar que es probable que los dos idiomas que se comparan sean dialectos relacionados . [1]

La similitud léxica es sólo una indicación de la inteligibilidad mutua de las dos lenguas, ya que esta última también depende del grado de similitud fonética, morfológica y sintáctica. Las variaciones debidas a las diferentes listas de palabras pesan sobre esto. Por ejemplo, la similitud léxica entre el francés y el inglés es considerable en los campos léxicos relacionados con la cultura, mientras que su similitud es menor en lo que respecta a las palabras básicas (de función). A diferencia de la inteligibilidad mutua, la similitud léxica solo puede ser simétrica.

La siguiente tabla muestra algunos valores de similitud léxica para pares de lenguas romances, germánicas y eslavas seleccionadas, recopiladas y publicadas por Ethnologue . [2]