En lingüística, co-ocurrencia o co-ocurrencia es una frecuencia superior a la probabilidad de ocurrencia de dos términos (también conocidos como coincidencia o concurrencia ) de un corpus de texto al lado de otra en un cierto orden. La co-ocurrencia en este sentido lingüístico puede interpretarse como un indicador de proximidad semántica o una expresión idiomática . La lingüística de corpus y sus análisis estadísticos revelan patrones de co-ocurrencias dentro de una lengua y permiten resolver colocaciones típicas para sus elementos léxicos. Una restricción de co-ocurrenciase identifica cuando los elementos lingüísticos nunca ocurren juntos. El análisis de estas restricciones puede conducir a descubrimientos sobre la estructura y el desarrollo de una lengua. [1]
La co-ocurrencia puede verse como una extensión del conteo de palabras en dimensiones más altas. La co-ocurrencia se puede describir cuantitativamente usando medidas como correlación o información mutua .
Ver también
Referencias
- ^ Kroeger, Paul (2005). Analizando la gramática: una introducción . Cambridge: Cambridge University Press. pag. 20. ISBN 978-0-521-01653-7.
- ^ Bordag, Stefan. "Una comparación de medidas de coincidencia y similitud como simulaciones de contexto". CiteSeerX 10.1.1.471.5863 . Cite journal requiere
|journal=
( ayuda )