Lexicoestadística

Este artículo incluye una lista de referencias generales , pero permanece en gran parte sin verificar porque carece de suficientes citas en línea correspondientes . Ayude a mejorar este artículo introduciendo citas más precisas. ( Agosto de 2014 ) ( Obtenga información sobre cómo y cuándo eliminar este mensaje de plantilla )

La léxicoestadística es un método de lingüística comparada que implica comparar el porcentaje de cognados léxicos entre lenguas para determinar su relación. Lexicoestadística se relaciona con el método comparativo , pero no reconstruye un lenguaje proto . Debe distinguirse de la glotocronología , que intenta utilizar métodos lexicoestadísticos para estimar el tiempo transcurrido desde que dos o más lenguas divergieron de un protolenguaje anterior común. Sin embargo, ésta es simplemente una aplicación de la lexicoestadística; otras aplicaciones pueden no compartir el supuesto de una tasa de cambio constante para los elementos léxicos básicos.

El término "lexicoestadística" es engañoso en el sentido de que se utilizan ecuaciones matemáticas pero no estadísticas. Se pueden usar otras características de un idioma además del léxico, aunque esto es inusual. Mientras que el método comparativo utilizó innovaciones identificadas compartidas para determinar subgrupos, la lexicoestadística no las identifica. La lexicoestadística es un método basado en la distancia, mientras que el método comparativo considera directamente los caracteres del idioma. El método lexicoestadístico es una técnica simple y rápida en relación con el método comparativo, pero tiene limitaciones (discutidas a continuación). Puede validarse mediante la verificación cruzada de los árboles producidos por ambos métodos.

Historia

La lexicoestadística fue desarrollada por Morris Swadesh en una serie de artículos en la década de 1950, basándose en ideas anteriores. ^[1]^[2]^[3] El primer uso conocido del concepto fue por Dumont d'Urville en 1834, quien comparó varios lenguajes "oceánicos" y propuso un método para calcular un coeficiente de relación. Hymes (1960) y Embleton (1986) revisan la historia de la lexicoestadística. ^[4]^[5]

Método

Crear lista de palabras

El objetivo es generar una lista de significados de uso universal (mano, boca, cielo, I). Luego, las palabras se recopilan para estos espacios de significado para cada idioma que se está considerando. Swadesh redujo un conjunto mayor de significados a 200 originalmente. Más tarde descubrió que era necesario reducirlo aún más, pero que podía incluir algunos significados que no estaban en su lista original, dando su lista posterior de 100 elementos. La lista de Swadesh en Wiktionary da un total de 207 significados en varios idiomas. Se han generado listas alternativas que aplican criterios más rigurosos, por ejemplo, la lista Dolgopolsky y la lista Leipzig-Yakarta , así como listas con un alcance más específico; por ejemplo, Dyen, Kruskal y Black tienen 200 significados para 84 lenguas indoeuropeasen formato digital. ^[6]

Determinar cogniciones

Se necesita un lingüista capacitado y experimentado para tomar decisiones de cognición. Sin embargo, es posible que sea necesario perfeccionar las decisiones a medida que aumenta el estado de los conocimientos. Sin embargo, la lexicoestadística no se basa en que todas las decisiones sean correctas. Para cada par de listas, la cognición de una forma puede ser positiva, negativa o indeterminada. A veces, un idioma tiene varias palabras para un significado, por ejemplo, pequeño y pequeño para no grande .

Calcular porcentajes lexicoestadísticos

Este porcentaje está relacionado con la proporción de significados de un par de idiomas en particular que son afines, es decir, en relación con el total sin indeterminación. Este valor se ingresa en una tabla de distancias N x N , donde N es el número de idiomas que se comparan. Cuando esté completa, esta tabla se completará a la mitad en forma triangular . Cuanto mayor es la proporción de cognición, más estrechamente relacionados están los idiomas.

Crear árbol genealógico

La creación del árbol de idiomas se basa únicamente en la tabla que se encuentra arriba. Se pueden utilizar varios métodos de subgrupos, pero el adoptado por Dyen, Krustal y Black fue:

todas las listas se colocan en un grupo
los dos miembros más cercanos se eliminan y forman un núcleo que se coloca en la piscina
este paso se repite
bajo ciertas condiciones, un núcleo se convierte en un grupo
esto se repite hasta que el grupo solo contiene un grupo.

Los cálculos deben ser de porcentajes léxicos de núcleo y grupo.

Aplicaciones

Un exponente destacado de la aplicación de la lexicoestadística ha sido Isidore Dyen . ^[7]^[8]^[9]^[10] Usó la lexicoestadística para clasificar las lenguas austronesias ^[11] así como las indoeuropeas . ^[6] Dyen, Kruskal y Black (1992) informaron de un importante estudio de este último. ^[6] También se han realizado estudios sobre las lenguas amerindias y africanas .

Pama-Nyungan

La cuestión de la ramificación interna dentro de la familia lingüística Pama-Nyungan ha sido un problema de larga data dentro de la lingüística australiana, y el consenso general sostuvo que las conexiones internas entre los más de 25 subgrupos diferentes de Pama-Nyungan eran imposibles de reconstruir o que los subgrupos eran imposibles de reconstruir. de hecho, no está genéticamente relacionado en absoluto. ^[12] En 2012, Claire Bowern y Quentin Atkinson publicaron los resultados de su aplicación de métodos filogenéticos computacionales en 194 documentos que representan todos los principales subgrupos y aislamientos de Pama-Nyungan. ^[13]Su modelo "recuperó" muchas de las ramas y divisiones que anteriormente habían sido propuestas y aceptadas por muchos otros australianos, al tiempo que proporcionaba una idea de las ramas más problemáticas, como Paman (que se complica por la falta de datos) y Ngumpin. Yapa (donde la imagen genética se ve oscurecida por tasas muy altas de préstamos entre idiomas). Su conjunto de datos forma el más grande de su tipo para una familia lingüística de cazadores-recolectores , y el segundo más grande en general después del austronesio ( Greenhill et al. 2008 ). Concluyen que las lenguas Pama-Nyungan, de hecho, no son excepcionales a los métodos lexicoestadísticos, que se han aplicado con éxito a otras familias lingüísticas del mundo.

Criticas

Personas como Hoijer (1956) han demostrado que había dificultades para encontrar equivalentes a los elementos de significado, mientras que muchos han considerado necesario modificar las listas de Swadesh. ^[14] Gudschinsky (1956) cuestionó si era posible obtener una lista universal. ^[15]

Factores como los préstamos , la tradición y el tabú pueden sesgar los resultados, como ocurre con otros métodos. A veces, se ha utilizado la lexicoestadística con la similitud léxica en lugar de la cognación para encontrar semejanzas. Entonces esto es equivalente a la comparación de masas .

La elección de espacios de significado es subjetiva, al igual que la elección de sinónimos .

Métodos mejorados

Algunos de los métodos modernos de prueba de hipótesis estadísticas computacionales pueden considerarse mejoras de la lexicoestadística en el sentido de que utilizan listas de palabras y medidas de distancia similares.

Ver también

Inglés básico
Cognado
Lingüística comparada
Método comparativo
Base de datos léxicoestadística mundial
Glotocronología
Lingüística histórica
Estudios indoeuropeos
Serie de diccionarios intercontinentales
Distancia lingüística
Comparación léxica de masas
Proto-lenguaje
Lista de Swadesh

Referencias

^ Swadesh, Morris (1955). "Hacia una mayor precisión en la datación lexicoestadística". Revista Internacional de Lingüística Estadounidense . 21 : 121-137.
^ Swadesh, Morris (1952). "Datación lexicoestadística de contactos étnicos prehistóricos". Actas de la American Philosophical Society . 96 : 452–463.
^ Swadesh, Morris (1950). "Relaciones internas de Salish". Revista Internacional de Lingüística Estadounidense . 16 : 157-167.
^ Hymes, Dell (1960). "Lexicoestadística hasta ahora". Antropología actual . 1 (1): 3–44.
^ Embleton, Sheila (1986). Estadística en Lingüística Histórica . Bochum.
^ a b c Dyen, Isidoro; Kruskal, Joseph; Negro, Paul (1992). "Una clasificación indoeuropea, un experimento lexicoestadístico". Transacciones de la American Philosophical Society . 82 (5).
^ Dyen, Isidore (1962). "La relación de un grupo lingüístico determinada léxicoestadísticamente". Revista Internacional de Lingüística Estadounidense . 28 (3).
^ Dyen, Isidore (1963). "Préstamo y tabú determinados léxico estadísticamente". Idioma . 39 : 60–66.
^ Dyen, Isidore (ed.) (1973). Lexicoestadística en Lingüística Genética . La Haya: Mouton.CS1 maint: texto adicional: lista de autores ( enlace )
^ Dyen, Isidore (1975). Subgrupos lingüísticos y lexicoestadística . La Haya: Mouton.
^ Dyen, Isidore (1965). "Una clasificación lexicoestadística de las lenguas austronesias". Revista Internacional de Lingüística Estadounidense . 19 .
^ Dixon, Robert MW (2002). Idiomas australianos: su naturaleza y desarrollo . Prensa de la Universidad de Cambridge. págs. 48, 53. Australia proporciona un ejemplo prototípico de un área lingüística. Tiene una considerable profundidad temporal, un terreno bastante uniforme que facilita la interacción y la comunicación, una buena proporción de matrimonios exógamos recíprocos, un multilingüismo desenfrenado y una actitud abierta hacia los préstamos ... Existe una uniformidad básica en las lenguas australianas que es el resultado natural de un largo período de difusión. Aunque no se había proporcionado ninguna justificación para 'Pama-Nyungan', llegó a ser aceptado. La gente lo aceptó porque fue aceptado, como una especie de creencia. … Está claro que 'Pama-Nyungan' no puede ser respaldado como grupo genético. Tampoco es una agrupación tipológica útil.
^ Bowern, Claire; Atkinson, Quentin (2012). "Filogenética computacional y la estructura interna de Pama-Nyungan". Idioma . 88 (4): 817–845.
^ Hoijer, Harry (1956). "Lexicoestadística: una crítica". Idioma . 32 : 49–60.
^ Gudschinsky, Sarah (1956). "El ABC de la lexicoestadística (glotocronología)". Palabra . 12 (2): 175–210.

Otras lecturas

Dobson, Annette (1969). Agrupación lexicoestadística. Lingüística antropológica 7, 216-221.
Dobson, Annette y Black, Paul (1979). Escalado multidimensional de algunos datos lexicoestadísticos. Científico matemático 1979/4, 55-61.
McMahon, April y McMahon, Robert (2005). Clasificación de idiomas por números. Prensa de la Universidad de Oxford.
Sankoff, David (1970). "Sobre la tasa de reemplazo de las relaciones de significado de palabras". Idioma 46.564-569.
Wittmann, Henri (1969). "Una investigación léxico-estadística sobre la diacronía del hitita". Indogermanische Forschungen 74.1-10. [1]
Wittmann, Henri (1973). "La clasificación lexicoestadística de las lenguas criollas de origen francés". Lexicoestadística en lingüística genética: Actas de la conferencia de Yale, 3-4 de abril de 1971 , dir. Isidore Dyen, 89-99. La Haye: Mouton. [2]

enlaces externos

Busque lexicoestadística en Wikcionario, el diccionario gratuito.

La base de datos global Lexicostatistical , que forma parte de la evolución de los lenguajes humanos proyecto
Base de datos IE
Una explicación simplificada de la diferencia entre glotocronología y lexicoestadística.

[1] Swadesh, Morris (1955). "Hacia una mayor precisión en la datación lexicoestadística". Revista Internacional de Lingüística Estadounidense . 21 : 121-137.

[2] Swadesh, Morris (1952). "Datación lexicoestadística de contactos étnicos prehistóricos". Actas de la American Philosophical Society . 96 : 452–463.

[3] Swadesh, Morris (1950). "Relaciones internas de Salish". Revista Internacional de Lingüística Estadounidense . 16 : 157-167.

[4] Hymes, Dell (1960). "Lexicoestadística hasta ahora". Antropología actual . 1 (1): 3–44.

[5] Embleton, Sheila (1986). Estadística en Lingüística Histórica . Bochum.

[Dyen&al1992-6] Dyen, Isidoro; Kruskal, Joseph; Negro, Paul (1992). "Una clasificación indoeuropea, un experimento lexicoestadístico". Transacciones de la American Philosophical Society . 82 (5).

[7] Dyen, Isidore (1962). "La relación de un grupo lingüístico determinada léxicoestadísticamente". Revista Internacional de Lingüística Estadounidense . 28 (3).

[8] Dyen, Isidore (1963). "Préstamo y tabú determinados léxico estadísticamente". Idioma . 39 : 60–66.

[9] Dyen, Isidore (ed.) (1973). Lexicoestadística en Lingüística Genética . La Haya: Mouton.CS1 maint: texto adicional: lista de autores ( enlace )

[10] Dyen, Isidore (1975). Subgrupos lingüísticos y lexicoestadística . La Haya: Mouton.

[11] Dyen, Isidore (1965). "Una clasificación lexicoestadística de las lenguas austronesias". Revista Internacional de Lingüística Estadounidense . 19 .

[Dixon2002-12] Dixon, Robert MW (2002). Idiomas australianos: su naturaleza y desarrollo . Prensa de la Universidad de Cambridge. págs. 48, 53. Australia proporciona un ejemplo prototípico de un área lingüística. Tiene una considerable profundidad temporal, un terreno bastante uniforme que facilita la interacción y la comunicación, una buena proporción de matrimonios exógamos recíprocos, un multilingüismo desenfrenado y una actitud abierta hacia los préstamos ... Existe una uniformidad básica en las lenguas australianas que es el resultado natural de un largo período de difusión. Aunque no se había proporcionado ninguna justificación para 'Pama-Nyungan', llegó a ser aceptado. La gente lo aceptó porque fue aceptado, como una especie de creencia. … Está claro que 'Pama-Nyungan' no puede ser respaldado como grupo genético. Tampoco es una agrupación tipológica útil.

[Bowern&Atkinson2012-13] Bowern, Claire; Atkinson, Quentin (2012). "Filogenética computacional y la estructura interna de Pama-Nyungan". Idioma . 88 (4): 817–845.

[14] Hoijer, Harry (1956). "Lexicoestadística: una crítica". Idioma . 32 : 49–60.

[15] Gudschinsky, Sarah (1956). "El ABC de la lexicoestadística (glotocronología)". Palabra . 12 (2): 175–210.

[1]