Similitud (ciencia de redes)

La similitud en el análisis de redes ocurre cuando dos nodos (u otras estructuras más elaboradas) caen en la misma clase de equivalencia.

Hay tres enfoques fundamentales para construir medidas de similitud de red: equivalencia estructural, equivalencia automórfica y equivalencia regular. ^[1] Existe una jerarquía de los tres conceptos de equivalencia: cualquier conjunto de equivalencias estructurales son también equivalencias automórficas y regulares. Cualquier conjunto de equivalencias automórficas también son equivalencias regulares. No todas las equivalencias regulares son necesariamente automórficas o estructurales; y no todas las equivalencias automórficas son necesariamente estructurales. ^[2]

Visualizando similitud y distancia

Herramientas de agrupación en clústeres

Aglomerativo la agrupación jerárquica de nodos sobre la base de la similitud de sus perfiles de vínculos a otros nodos proporciona un árbol de unión o dendrograma que visualiza el grado de similitud entre los casos - y se pueden utilizar para encontrar las clases de equivalencia aproximada. ^[2]

Herramientas de escalado multidimensionales

Por lo general, nuestro objetivo en el análisis de equivalencia es identificar y visualizar "clases" o grupos de casos. Al utilizar el análisis de conglomerados, asumimos implícitamente que la similitud o la distancia entre los casos se refleja como una única dimensión subyacente. Sin embargo, es posible que haya múltiples "aspectos" o "dimensiones" subyacentes a las similitudes observadas de los casos. El análisis de factores o componentes podría aplicarse a correlaciones o covarianzas entre casos. Alternativamente, se podría utilizar la escala multidimensional (no métrica para datos que son inherentemente nominales u ordinales; métrica para valorados). ^[2]

MDS representa los patrones de similitud o disimilitud en los perfiles de vínculo entre los actores (cuando se aplica a la adyacencia o distancias) como un "mapa" en el espacio multidimensional. Este mapa nos permite ver qué tan "cercanos" están los actores, si se "agrupan" en un espacio multidimensional y cuánta variación hay a lo largo de cada dimensión. ^[2]

Equivalencia estructural

Dos vértices de una red son estructuralmente equivalentes si comparten muchos de los mismos vecinos.

Equivalencia estructural

No hay actor que tenga exactamente el mismo conjunto de vínculos que el actor A, por lo que el actor A está en una clase por sí mismo. Lo mismo es cierto para los actores B, C, D y G. Cada uno de estos nodos tiene un conjunto único de bordes con respecto a otros nodos. Sin embargo, E y F pertenecen a la misma clase de equivalencia estructural. Cada uno tiene un solo borde; y ese vínculo es con B. Dado que E y F tienen exactamente el mismo patrón de aristas con todos los vértices, son estructuralmente equivalentes. Lo mismo es cierto en el caso de H e I. ^[2]

La equivalencia estructural es la forma más fuerte de similitud. En muchas redes reales, la equivalencia exacta puede ser poco común y podría ser útil para facilitar los criterios y medir la equivalencia aproximada.

Un concepto estrechamente relacionado es la equivalencia institucional : dos actores (por ejemplo, empresas) son institucionalmente equivalentes si operan en el mismo conjunto de campos institucionales. ^[3] Si bien los actores estructuralmente equivalentes tienen patrones relacionales o posiciones de red idénticos, la equivalencia institucional captura la similitud de las influencias institucionales que los actores experimentan al estar en los mismos campos, independientemente de cuán similares sean sus posiciones de red. Por ejemplo, dos bancos en Chicago pueden tener patrones de vínculos muy diferentes (por ejemplo, uno puede ser un nodo central y el otro puede estar en una posición periférica) de manera que no son equivalentes estructurales, pero porque ambos operan en el campo. de las finanzas y la banca y en el mismo campo geográficamente definido (Chicago), estarán sujetos a algunas de las mismas influencias institucionales. ^[3]

Medidas de equivalencia estructural

Similitud de coseno

Un simple recuento de vecinos comunes para dos vértices no es por sí solo una buena medida. Se debe conocer el grado de los vértices o cuántos vecinos comunes tienen otros pares de vértices. La similitud de coseno tiene en cuenta estos aspectos y también permite los diferentes grados de vértices. Salton propuso que consideremos las filas / columnas i-ésima y j-ésima de la matriz de adyacencia como dos vectores y usemos el coseno del ángulo entre ellas como una medida de similitud . La similitud de coseno de i y j es el número de vecinos comunes dividido por la media geométrica de sus grados. ^[4]

Su valor se encuentra en el rango de 0 a 1. El valor de 1 indica que los dos vértices tienen exactamente los mismos vecinos, mientras que el valor de cero significa que no tienen ningún vecino común. La similitud del coseno es técnicamente indefinida si uno o ambos nodos tiene grado cero, pero de acuerdo con la convención decimos que la similitud del coseno es 0 en estos casos. ^[1]

Coeficiente de Pearson

El coeficiente de correlación producto-momento de Pearson es un método alternativo para normalizar el recuento de vecinos comunes. Este método compara el número de vecinos comunes con el valor esperado que tomaría el recuento en una red donde los vértices están conectados aleatoriamente. Esta cantidad se encuentra estrictamente en el rango de -1 a 1. ^[1]

distancia euclidiana

La distancia euclidiana es igual al número de vecinos que difieren entre dos vértices. Es más bien una medida de disimilitud, ya que es mayor para los vértices que difieren más. Podría normalizarse dividiendo por su valor máximo. El máximo significa que no hay vecinos comunes, en cuyo caso la distancia es igual a la suma de los grados de los vértices. ^[1]

Equivalencia automórfica

Formalmente "Dos vértices son automórficamente equivalentes si todos los vértices se pueden volver a etiquetar para formar un gráfico isomórfico con las etiquetas de uyv intercambiadas. Dos vértices automórficamente equivalentes comparten exactamente las mismas propiedades independientes de la etiqueta". ^[5]

De manera más intuitiva, los actores son automórficamente equivalentes si podemos permutar el gráfico de tal manera que el intercambio de dos actores no tenga ningún efecto sobre las distancias entre todos los actores del gráfico.

Equivalencia automórfica

Suponga que el gráfico describe la estructura organizativa de una empresa. El actor A es la sede central, los actores B, C y D son gerentes. Los actores E, F y H, I son trabajadores en tiendas más pequeñas; G es el trabajador solitario en otra tienda.

Aunque el actor B y el actor D no son estructuralmente equivalentes (tienen el mismo jefe, pero no los mismos trabajadores), parecen ser "equivalentes" en un sentido diferente. Tanto el gerente B como el D tienen un jefe (en este caso, el mismo jefe) y cada uno tiene dos trabajadores. Si los intercambiamos, y también intercambiamos a los cuatro trabajadores, todas las distancias entre todos los actores de la red serían exactamente idénticas.

En realidad, hay cinco clases de equivalencia automórfica: {A}, {B, D}, {C}, {E, F, H, I} y {G}. Tenga en cuenta que la definición menos estricta de "equivalencia" ha reducido el número de clases. ^[2]

Equivalencia regular

Formalmente, "dos actores son regularmente equivalentes si están igualmente relacionados con otros equivalentes". En otras palabras, los vértices regularmente equivalentes son vértices que, aunque no necesariamente comparten vecinos, tienen vecinos que son ellos mismos similares. ^[5]

Dos madres, por ejemplo, son equivalentes, porque cada una tiene un patrón similar de conexiones con un esposo, hijos, etc. Las dos madres no tienen vínculos con el mismo esposo o los mismos hijos, por lo que no son estructuralmente equivalentes. Debido a que diferentes madres pueden tener diferentes números de esposos e hijos, no serán automórficamente equivalentes. Pero son similares porque tienen las mismas relaciones con algún miembro o miembros de otro grupo de actores (que se consideran equivalentes debido a la similitud de sus vínculos con un miembro del grupo "madre"). ^[2]

Equivalencia regular

En el gráfico hay tres clases de equivalencia regulares. El primero es el actor A; el segundo está compuesto por los tres actores B, C y D; el tercero consta de los cinco actores restantes E, F, G, H e I.

La clase más fácil de ver son los cinco actores en la parte inferior del diagrama (E, F, G, H e I). Estos actores suelen ser equivalentes entre sí porque:

no tienen ningún vínculo con ningún actor de la primera clase (es decir, con el actor A) y
cada uno tiene un vínculo con un actor de la segunda clase (ya sea B o C o D).

Cada uno de los cinco actores, entonces, tiene un patrón idéntico de vínculos con actores de las otras clases.

Los actores B, C y D forman una clase de manera similar. B y D en realidad tienen vínculos con dos miembros de la tercera clase, mientras que el actor C tiene un vínculo con solo un miembro de la tercera clase, pero esto no importa, ya que hay un vínculo con algún miembro de la tercera clase.

El actor A está en una clase por sí mismo, definido por:

un vínculo con al menos un miembro de la clase dos y
ningún vínculo con ningún miembro de la clase tres. ^[2]

Ver también

Medida de similitud

Referencias

^ ^a ^b ^c ^d Newman, MEJ 2010. Redes: Introducción. Oxford, Reino Unido: Oxford University Press.
^ ^a ^b ^c ^d ^e ^f ^g ^h Hanneman, Robert A. y Mark Riddle. 2005. Introducción a los métodos de redes sociales. Riverside, CA: Universidad de California, Riverside (publicado en formato digital en http://faculty.ucr.edu/~hanneman/ )
↑ ^a ^b Marqués, Christopher; Tilcsik, András (1 de octubre de 2016). "Equivalencia institucional: cómo la industria y los pares de la comunidad influyen en la filantropía corporativa". Ciencias de la Organización . 27 (5): 1325-1341. doi : 10.1287 / orsc.2016.1083 . hdl : 1813/44734 . ISSN 1047-7039 .
^ Salton G., Procesamiento automático de texto: transformación, análisis y recuperación de información por computadora, Addison-Wesley, Reading, MA (1989)
↑ ^a ^b Borgatti, Steven, Martin Everett y Linton Freeman. 1992. UCINET IV Versión 1.0 Guía del usuario. Columbia, SC: Tecnologías analíticas.

[NewmanNetworks-1] Newman, MEJ 2010. Redes: Introducción. Oxford, Reino Unido: Oxford University Press.

[Hanneman_Riddle_2005-2] ^ ^a ^b ^c ^d ^e ^f ^g ^h Hanneman, Robert A. y Mark Riddle. 2005. Introducción a los métodos de redes sociales. Riverside, CA: Universidad de California, Riverside (publicado en formato digital en http://faculty.ucr.edu/~hanneman/ )

[:0-3] Marqués, Christopher; Tilcsik, András (1 de octubre de 2016). "Equivalencia institucional: cómo la industria y los pares de la comunidad influyen en la filantropía corporativa". Ciencias de la Organización . 27 (5): 1325-1341. doi : 10.1287 / orsc.2016.1083 . hdl : 1813/44734 . ISSN 1047-7039 .

[4] Salton G., Procesamiento automático de texto: transformación, análisis y recuperación de información por computadora, Addison-Wesley, Reading, MA (1989)

[Borgatti_Everett-5] Borgatti, Steven, Martin Everett y Linton Freeman. 1992. UCINET IV Versión 1.0 Guía del usuario. Columbia, SC: Tecnologías analíticas.

[1]