Aleatorización que conserva el grado


La aleatorización de conservación de grados es una técnica utilizada en la ciencia de redes que tiene como objetivo evaluar si las variaciones observadas en un gráfico dado podrían ser simplemente un artefacto de las propiedades estructurales inherentes del gráfico en lugar de propiedades únicas de los nodos, en una red observada.

Catalogada ya en 1996, [1] la implementación más simple de la aleatorización con preservación de grados se basa en un algoritmo de Monte Carlo que reordena o "reconecta" la red al azar de manera que, con un número suficiente de reconexiones, la distribución de grados de la red es idéntica a la distribución de grado inicial de la red, aunque la estructura topológica de la red se ha vuelto completamente distinta de la red original.

El grado de preservación de la aleatorización, si bien tiene muchas formas diferentes, generalmente adopta la forma de un enfoque relativamente simple: para cualquier red que consta de nodos con bordes, seleccione dos nodos unidos de forma diádica. Para cada uno de estos pares diádicos, cambie los bordes de modo que los nuevos pares diádicos no coincidan. Después de un número suficiente de estos desajustes, la red pierde cada vez más su topografía original observada.

Como es común con los algoritmos basados ​​en cadenas de Markov , se desconoce el número de iteraciones, o recableados individuales, que deben ocurrir en un gráfico dado, de modo que el gráfico sea lo suficientemente aleatorio y distinto del gráfico original, aunque Espinoza [2] afirma que un El umbral mínimo seguro es , donde "es al menos 100" (Espinoza). Otros han proporcionado información para este problema, incluido un autor que afirma que un mínimo seguro puede ser al menos , donde épsilon se encuentra en un rango entre y , aunque en última instancia no se conoce el número correcto. [3] [4]

Hay varios casos en los que las investigaciones publicadas han empleado explícitamente la aleatorización de preservación del grado para analizar las propiedades de la red. Dekker [5] utilizó el recableado para modelar con mayor precisión las redes sociales observadas agregando una variable secundaria , que introduce un sesgo de apego de alto grado. Liu y col. [6] han empleado además la aleatorización de preservación del grado para afirmar que la Centralidad de control , una métrica que identifican, altera poco en comparación con la Centralidad de control de un modelo Erdős-Rényi que contiene el mismo número de nodos en sus simulaciones - Liu et al. También han utilizado modelos de aleatorización que preservan el grado en trabajos posteriores de exploracióncontrolabilidad de la red . [7]

Además, se ha realizado algún trabajo para investigar cómo se puede utilizar la aleatorización de conservación de títulos para abordar las consideraciones de anonimato en la investigación de datos en red, que se ha demostrado que es motivo de preocupación en el análisis de redes sociales , como en el caso de un estudio de Lewis. et al. [8] [9] En última instancia, el trabajo realizado por Ying y Wu, partiendo de la base de la aleatorización de preservación de grados y luego reenviando varias modificaciones, ha mostrado avances moderados en la protección del anonimato sin comprometer la integridad de la utilidad subyacente de la red observada. [10]


Una demostración de una sola iteración del algoritmo de aleatorización de conservación de grados.
Resultados de los ensayos de aleatorización con conservación de títulos.