El webgraph describe los enlaces dirigidos entre páginas de la World Wide Web . Un gráfico , en general, consta de varios vértices, algunos pares conectados por aristas. En un gráfico dirigido , las aristas son líneas o arcos dirigidos. El webgraph es un gráfico dirigido, cuyos vértices corresponden a las páginas de la WWW, y un borde dirigido conecta la página X con la página Y si existe un hipervínculo en la página X, refiriéndose a la página Y.
Propiedades
- La distribución de grados del webgraph difiere mucho de la distribución de grados del modelo de gráfico aleatorio clásico, el modelo Erdős-Rényi : [1] en el modelo Erdős-Rényi, hay muy pocos nodos de grado grandes, en relación con la distribución de grados del webgraph. Sin embargo , la distribución precisa no está clara [2] : está relativamente bien descrita por una distribución logarítmica normal , así como por el modelo de Barabási-Albert para las leyes de potencia . [3] [4]
- El webgraph es un ejemplo de red sin escala .
Aplicaciones
- El webgraph se utiliza para:
- calcular el PageRank [5] de las páginas WWW;
- calcular el PageRank personalizado; [6]
- detectar páginas web de temas similares, solo a través de propiedades gráficas teóricas, como la co-cita; [7]
- e identificación de centros y autoridades en la web para el algoritmo HITS .
Referencias
- ↑ P. Erdős, A. Renyi, Publ. Matemáticas. Inst. Colgado. Acad. Sci. 5 (1960)
- ^ Meusel, R .; Vigna, S .; Lehmberg, O .; Bizer, C. (2015). "La estructura del gráfico en la Web: analizada en diferentes niveles de agregación" (PDF) . Revista de ciencia web . 1 (1): 33–47. doi : 10.1561 / 106.00000003 . hdl : 2434/372411 .
- ^ Clauset, A .; Shalizi, CR; Newman, MEJ (2007). "Distribuciones de ley de potencias en datos empíricos". SIAM Rev . 51 (4): 661–703. arXiv : 0706.1062 . Código bibliográfico : 2009SIAMR..51..661C . doi : 10.1137 / 070710111 .
- ^ Barabási, Albert-László; Albert, Réka (octubre de 1999). "Aparición del escalado en redes aleatorias" (PDF) . Ciencia . 286 (5439): 509–512. arXiv : cond-mat / 9910332 . Código Bibliográfico : 1999Sci ... 286..509B . doi : 10.1126 / science.286.5439.509 . PMID 10521342 ..
- ^ S. Brin , L. Page , Redes informáticas ysistemas ISDN 30, 107 (1998)
- ^ Glen Jeh y Jennifer Widom. 2003. Escalado de búsqueda web personalizada. En Actas de la 12ª conferencia internacional sobre World Wide Web (WWW '03). ACM, Nueva York, NY, EE. UU., 271–279. doi : 10.1145 / 775152.775191
- ^ Kumar, Ravi; Raghavan, Prabhakar; Rajagopalan, Sridhar; Tomkins, Andrew (1999). "Rastrear la Web en busca de comunidades cibernéticas emergentes". Redes informáticas . 31 (11-16): 1481-1493. CiteSeerX 10.1.1.89.4025 . doi : 10.1016 / S1389-1286 (99) 00040-7 .
enlaces externos
- Webgraphs en Yahoo Sandbox
- Webgraphs en la Universidad de Milán - Laboratorio de algoritmos web
- Webgraphs en Stanford - SNAP
- Webgraph en el servidor Erdős Webgraph
- Web Data Commons: gráfico de hipervínculo