Buscador


Un motor de búsqueda es un sistema de software que está diseñado para realizar búsquedas en la web . Buscan en la World Wide Web de forma sistemática información particular especificada en una consulta de búsqueda textual en la web . Los resultados de la búsqueda generalmente se presentan en una línea de resultados, a menudo denominados páginas de resultados del motor de búsqueda (SERP) La información puede ser una combinación de enlaces a páginas web , imágenes, videos, infografías , artículos, trabajos de investigación y otros tipos de archivos. Algunos motores de búsqueda también extraen datos disponibles en bases de datos o directorios abiertos. a diferencia deLos directorios web , que solo son mantenidos por editores humanos, los motores de búsqueda también mantienen información en tiempo real mediante la ejecución de un algoritmo en un rastreador web . El contenido de Internet que no puede ser buscado por un motor de búsqueda web se describe generalmente como la web profunda .

Vannevar Bush , quien escribió un artículo en The Atlantic Monthly titulado " As We May Think ", describió en 1945 un sistema de localización de información publicada destinado a superar la dificultad cada vez mayor de localizar información en índices centralizados de trabajo científico cada vez mayores [1 ] en el que imaginó bibliotecas de investigación con anotaciones conectadas no muy diferentes de los hipervínculos modernos . [2] El análisis de enlaces eventualmente se convertiría en un componente crucial de los motores de búsqueda a través de algoritmos como Hyper Search y PageRank . [3] [4]

Los primeros motores de búsqueda de Internet son anteriores al debut de la Web en diciembre de 1990: la búsqueda de usuarios de WHOIS se remonta a 1982, [5] y la búsqueda de usuarios de redes múltiples del Knowbot Information Service se implementó por primera vez en 1989. [6] La primera búsqueda bien documentada El motor que buscaba archivos de contenido, concretamente archivos FTP , era Archie , que debutó el 10 de septiembre de 1990. [7]

Antes de septiembre de 1993, la World Wide Web estaba completamente indexada a mano. Había una lista de servidores web editada por Tim Berners-Lee y alojados en el servidor web del CERN . Queda una instantánea de la lista en 1992, [8] pero a medida que más y más servidores web se pusieron en línea, la lista central ya no pudo mantenerse al día. En el sitio de NCSA , se anunciaron nuevos servidores bajo el título "¡Qué hay de nuevo!" [9]

La primera herramienta utilizada para buscar contenido (a diferencia de los usuarios) en Internet fue Archie . [10] El nombre significa "archivo" sin la "v"., [11] Fue creado por Alan Emtage [11] [12] [13] [14] estudiante de informática en la Universidad McGill en Montreal, Quebec , Canadá . El programa descargó las listas de directorios de todos los archivos ubicados en sitios FTP ( Protocolo de transferencia de archivos ) públicos y anónimos , creando una base de datos de búsqueda de nombres de archivos; sin embargo, Archie Search Engineno indexó el contenido de estos sitios, ya que la cantidad de datos era tan limitada que se podía buscar fácilmente de forma manual.

El surgimiento de Gopher (creado en 1991 por Mark McCahill en la Universidad de Minnesota ) llevó a dos nuevos programas de búsqueda, Veronica y Jughead . Al igual que Archie, buscaron los nombres de archivos y títulos almacenados en los sistemas de índice Gopher. Veronica ( V ery E asy R odent- O riented N -amplia et I ndex a C omputerized A rchivos) proporcionó una búsqueda por palabra clave de la mayoría de los títulos de menú Gopher en todo el listados Gopher. Jughead ( J de onzy U NIVERSAL G OpherH ierarchy E xcavation Un nd D isplay) era una herramienta para la obtención de información del menú de servidores Gopher específica. Si bien el nombre del motor de búsqueda " Archie Search Engine " no era una referencia a la serie de cómics de Archie , " Veronica " y " Jughead " son personajes de la serie, por lo que hacen referencia a su predecesor.


Los resultados de una búsqueda del término "eclipse lunar" en un motor de búsqueda de imágenes basado en la web
Arquitectura de alto nivel de un rastreador web estándar