La recuperación de información contradictoria ( IR contradictorio ) es un tema en la recuperación de información relacionado con las estrategias para trabajar con una fuente de datos en la que una parte de ella ha sido manipulada de forma maliciosa. Las tareas pueden incluir recopilar, indexar, filtrar, recuperar y clasificar información de dicha fuente de datos. La RI adversaria incluye el estudio de métodos para detectar, aislar y vencer dicha manipulación.
En la Web, la forma predominante de dicha manipulación es el spam de motores de búsqueda (también conocido como spamdexing), que implica el empleo de diversas técnicas para interrumpir la actividad de los motores de búsqueda web , generalmente para obtener beneficios económicos. Ejemplos de indexación de spam son bombardeo de enlaces , spam de comentarios o referencias , blogs de spam (splogs), etiquetado malicioso. La ingeniería inversa de algoritmos de clasificación , bloqueos de publicidad , el fraude de clics , [1] y filtrado de contenido web también pueden ser considerados formas de confrontación manipulación de datos .[2]
Temas
Temas relacionados con el spam web (spamdexing):
- Enlace spam
- Spam de palabras clave
- Encubierto
- Etiquetado malicioso
- Spam relacionado con blogs, incluido spam de comentarios , splogs y spam de ping
Otros temas:
- Detección de fraude por clic
- La ingeniería inversa del motor de búsqueda 's clasificación algoritmo
- Filtrado de contenido web
- Bloqueo de publicidad
- stealth rastreo
- Troll (Internet)
- Etiquetado malicioso o votación en redes sociales.
- Astroturfing
- Calcetín
Historia
El término "recuperación de información contradictoria" fue acuñado por primera vez en 2000 por Andrei Broder (entonces científico jefe de Alta Vista ) durante la sesión plenaria de la Web en la conferencia TREC -9. [3]
Ver también
Referencias
- ^ Jansen, BJ (2007) Haga clic en fraude . Computadora IEEE. 40 (7), 85-86.
- ^ B. Davison, M. Najork y T. Converse (2006), Informe de hoja de trabajo SIGIR: Recuperación de información de adversarios en la Web (AIRWeb 2006)
- ^ D. Hawking y N. Craswell (2004), Búsqueda web y recuperación a gran escala (versión preimpresa) Archivado el 29 de agosto de 2007en la Wayback Machine.
enlaces externos
- AIRWeb : serie de talleres sobre recuperación de información contradictoria en la web
- Web Spam Challenge : concurso para investigadores sobre detección de spam web
- Conjuntos de datos de spam web : conjuntos de datos para la investigación sobre la detección de spam web