La estadística descriptiva espacial es la intersección de la estadística espacial y la estadística descriptiva ; estos métodos se utilizan para una variedad de propósitos en geografía, particularmente en análisis de datos cuantitativos que involucran Sistemas de Información Geográfica (SIG) .
Tipos de datos espaciales
Las formas más simples de datos espaciales son datos cuadriculados , en los que se mide una cantidad escalar para cada punto en una cuadrícula regular de puntos, y conjuntos de puntos, en los que se observa un conjunto de coordenadas (por ejemplo, de puntos en el plano). Un ejemplo de datos cuadriculados sería una imagen satelital de densidad forestal que se ha digitalizado en una cuadrícula. Un ejemplo de un conjunto de puntos serían las coordenadas de latitud / longitud de todos los olmos en una parcela de tierra en particular. Las formas de datos más complicadas incluyen conjuntos de puntos marcados y series temporales espaciales.
Medidas de tendencia central espacial
La media de coordenadas de un conjunto de puntos es el centroide , que resuelve el mismo problema variacional en el plano (o espacio euclidiano de mayor dimensión) que el promedio familiar resuelve en la línea real, es decir, el centroide tiene el promedio más pequeño posible. distancia al cuadrado a todos los puntos del conjunto.
Medidas de dispersión espacial
La dispersión captura el grado en que los puntos de un conjunto de puntos están separados entre sí. Para la mayoría de las aplicaciones, la dispersión espacial debe cuantificarse de forma invariable a las rotaciones y reflexiones. Se pueden definir varias medidas simples de dispersión espacial para un conjunto de puntos utilizando la matriz de covarianza de las coordenadas de los puntos. La traza , el determinante y el valor propio más grande de la matriz de covarianza se pueden utilizar como medidas de dispersión espacial.
Una medida de dispersión espacial que no se basa en la matriz de covarianza es la distancia promedio entre vecinos más cercanos. [1]
Medidas de homogeneidad espacial
Un conjunto homogéneo de puntos en el plano es un conjunto que se distribuye de manera que aproximadamente el mismo número de puntos ocurre en cualquier región circular de un área dada. Un conjunto de puntos que carece de homogeneidad puede agruparse espacialmente en una determinada escala espacial. Un modelo de probabilidad simple para puntos espacialmente homogéneos es el proceso de Poisson en el plano con función de intensidad constante.
Funciones K y L de Ripley
Las funciones K y L de Ripley [2] son estadísticas descriptivas estrechamente relacionadas para detectar desviaciones de la homogeneidad espacial. La función K (técnicamente su estimación basada en la muestra) se define como
donde d ij es la distancia euclidiana entre los puntos i- ésimo y j- ésimo en un conjunto de datos de n puntos, t es el radio de búsqueda, λ es la densidad promedio de puntos (generalmente estimado como n / A , donde A es el área de la región que contiene todos los puntos) e I es la función indicadora (1 si su operando es verdadero, 0 en caso contrario). [3] En 2 dimensiones, si los puntos son aproximadamente homogéneos,debe ser aproximadamente igual a π t 2 .
Para el análisis de datos, generalmente se usa la función K de Ripley estabilizada por varianza llamada función L. La versión de muestra de la función L se define como
Para datos aproximadamente homogéneos, la función L tiene un valor esperado t y su varianza es aproximadamente constante en t . Una gráfica común es una gráfica decontra t , que seguirá aproximadamente el eje cero horizontal con dispersión constante si los datos siguen un proceso de Poisson homogéneo.
Con la función K de Ripley, puede determinar si los puntos tienen un patrón de distribución aleatorio, disperso o agrupado en una determinada escala. [4]
Ver también
- Geoestadística
- Variograma
- Correlograma
- Kriging
- Prueba de Cuzick-Edwards para la agrupación de subpoblaciones dentro de poblaciones agrupadas
- Autocorrelación espacial
Referencias
- ^ Clark, Philip; Evans, Francis (1954). "Distancia al vecino más cercano como medida de relaciones espaciales en poblaciones". Ecología . 35 (4): 445–453. doi : 10.2307 / 1931034 . JSTOR 1931034 .
- ^ Ripley, BD (1976). "El análisis de segundo orden de procesos puntuales estacionarios" . Revista de probabilidad aplicada . 13 (2): 255–266. doi : 10.2307 / 3212829 . JSTOR 3212829 .
- ^ Dixon, Philip M. (2002). "Función K de Ripley" (PDF) . En El-Shaarawi, Abdel H .; Piegorsch, Walter W. (eds.). Enciclopedia de Medioambiente . John Wiley e hijos. págs. 1796–1803. ISBN 978-0-471-89997-6. Consultado el 25 de abril de 2014 .
- ^ Wilschut, LI; Laudisoit, A .; Hughes, NK; Addink, EA; de Jong, SM; Heesterbeek, JAP; Reijniers, J .; Eagle, S .; Dubyanskiy, VM; Begon, M. (2015). "Patrones de distribución espacial de hospedadores de plaga: análisis de patrón de puntos de las madrigueras de grandes jerbos en Kazajstán" . Revista de biogeografía . 42 (7): 1281-1292. doi : 10.1111 / jbi.12534 . PMC 4737218 . PMID 26877580 .