La diversidad léxica es un aspecto de la 'riqueza léxica' y se refiere a la proporción de diferentes raíces de palabras únicas (tipos) con respecto al número total de palabras ( tokens ). El término se utiliza en lingüística aplicada y se calcula cuantitativamente utilizando numerosas medidas diferentes, incluidas la relación de tipo de texto (TTR), vocd, [1] y la medida de diversidad léxica textual (MTLD). [2]
Un problema común con las medidas de diversidad léxica, especialmente TTR, es que las muestras de texto que contienen un gran número de tokens dan valores más bajos para TTR, ya que a menudo es necesario que el escritor o el hablante reutilice varias palabras funcionales . Una consecuencia de esto es que la diversidad léxica se utiliza mejor para comparar textos de igual extensión. [3] Las medidas más nuevas de diversidad léxica intentan explicar la sensibilidad a la longitud del texto.
Definiciones
En un artículo de 2013, Scott Jarvis propuso que la diversidad léxica, similar a la diversidad en la ecología, es un fenómeno de percepción. La redundancia léxica es una contraparte positiva de la diversidad léxica de la misma manera que la variabilidad léxica es la imagen especular de la repetición. Según el modelo de Jarvis, la diversidad léxica incluye variabilidad, volumen, uniformidad, rareza, dispersión y disparidad. [4]
Según Jarvis, las seis propiedades de la diversidad léxica deben medirse mediante los siguientes índices.
Propiedad | La medida |
---|---|
Variabilidad | Medida de la diversidad léxica textual (MTLD) |
Volumen | Número total de palabras en el texto |
Igualdad | Desviación estándar de tokens por tipo |
Rareza | Rango BNC medio |
Dispersión | Distancia media entre tokens de tipo |
Disparidad | Número medio de palabras por sentido o análisis semántico latente |
Referencias
- ^ McCarthy, Phillip; Jarvis, Scott (2007). "VOCD: Una evaluación teórica y empírica". Pruebas de idioma . 24 (4): 459–488. doi : 10.1177 / 0265532207080767 .
- ^ McCarthy, Phillip (2005). "Una evaluación del alcance y la utilidad de las medidas de diversidad léxica y el potencial de la medida de la diversidad léxica textual (MTLD)". Tesis de Doctorado - a través de Tesis y Disertaciones de Proquest. (UMI nº 3199485).
- ^ Diversidad léxica y densidad léxica en el habla y la escritura: una perspectiva del desarrollo - V Johansson - Working Papers in Linguistics, 2009
- ^ Jarvis, Scott (2013). "Capturando la diversidad en la diversidad léxica" . Aprendizaje de idiomas . 63 : 87-106. doi : 10.1111 / j.1467-9922.2012.00739.x .