YaCy (pronunciado "ya ves") es un motor de búsqueda distribuido gratis , construido sobre los principios de las redes peer-to-peer (P2P). [2] [3] Su núcleo es un programa de computadora escrito en Java distribuido en varios cientos de computadoras, a partir de septiembre de 2006, los llamados YaCy-peers. Cada uno de los pares de YaCy rastrea de forma independiente a través de Internet, analiza e indexa las páginas web encontradas y almacena los resultados de la indexación en una base de datos común (denominada índice) que se comparte con otros pares de YaCy utilizando los principios de las redes P2P. Es un motor de búsqueda que todos pueden utilizar para crear un portal de búsqueda para su intranet y ayudar a buscar claramente en la Internet pública.[actualizar]
Autor (es) original (es) | Michael Christen |
---|---|
Desarrollador (es) | Comunidad YaCy |
Versión inicial | 2003 [1] |
Lanzamiento estable | 1.922 / 14 de octubre de 2019 |
Repositorio | github |
Escrito en | Java |
Sistema operativo | Multiplataforma |
Tipo | Red superpuesta , motor de búsqueda |
Licencia | GPLv2 + |
Sitio web | yacy |
En comparación con los motores de búsqueda semidistribuidos, la red YaCy tiene una arquitectura descentralizada. Todos los pares de YaCy son iguales y no existe un servidor central . Se puede ejecutar en modo de rastreo o como un servidor proxy local , indexando las páginas web visitadas por la persona que ejecuta YaCy en su computadora. (Se proporcionan varios mecanismos para proteger la privacidad del usuario). El acceso a las funciones de búsqueda se realiza mediante un servidor web de ejecución local que proporciona un cuadro de búsqueda para ingresar términos de búsqueda y devuelve resultados de búsqueda en un formato similar a otros motores de búsqueda populares.
YaCy fue creado en 2003 por Michael Christen. [4]
Componentes del sistema
El motor de búsqueda YaCy se basa en cuatro elementos: [5]
- Tractor
- Un robot de búsqueda que pasa de una página web a otra y analiza su contenido. [6]
- Indexador
- Crea un índice de palabras inverso (RWI), es decir, cada palabra del RWI tiene su lista de URL relevantes e información de clasificación. Las palabras se guardan en forma de hash de palabras. [7]
- Interfaz de búsqueda y administración
- Hecho como una interfaz web proporcionada por un servlet HTTP local con motor de servlet. [8]
- Almacenamiento de datos
- Se utiliza para almacenar la base de datos de índice de palabras inversas utilizando una tabla hash distribuida .
Tecnología de motor de búsqueda
- YaCy es un dispositivo de búsqueda completo con interfaz de usuario, índice, administración y monitoreo.
- YaCy recolecta páginas web con un rastreador web. Luego, los documentos se analizan, indexan y el índice de búsqueda se almacena localmente. Si su par es parte de una red de pares, entonces su índice de búsqueda local también se fusiona con el índice compartido para esa red.
- Se inicia una búsqueda, luego el índice local contribuye junto con un índice de búsqueda global de pares en la red de búsqueda de YaCy.
- YaCy Grid es una implementación de segunda generación de la búsqueda peer-to-peer de YaCy. Una instalación de YaCy Grid consta de microservicios que se comunican mediante el MCP.
- YaCy Parser es un microservicio que se puede implementar mediante Docker . Cuando se inicia el componente analizador, busca un MCP y se conecta a él. De forma predeterminada, se busca un MCP en el host local, pero puede configurar uno usted mismo.
Arquitectura de la plataforma YaCy
YaCy utiliza una combinación de técnicas para la creación de redes, la administración y el mantenimiento de la indexación del motor de búsqueda, incluidas las listas negras, la moderación y la comunicación con la comunidad. Así es como YaCy realiza estas operaciones:
- Componentes de la comunidad
- Foro web [9]
- Estadísticas
- API XML
- Mantenimiento
- Servidor web
- Indexación
- Rastreador con equilibrador
- Comunicación de servidor de igual a igual
- Organización de contenido
- Lista negra y filtrado
- Interfaz de búsqueda
- Marcadores
- Supervisión de los resultados de la búsqueda
Distribución
YaCy está disponible en Windows , Mac , Linux y otras plataformas a través de Docker
El paquete Debian se puede instalar desde un repositorio disponible en el subdominio del sitio web del proyecto. [10] El paquete aún no se mantiene en el repositorio oficial de paquetes de Debian. [11] [12] [13] [14] [15]
Ver también
- Dooble : un navegador web de código abierto con un widget de herramienta de motor de búsqueda YaCy integrado
Referencias
- ^ "Ich entwickle eine P2P-basierende Suchmaschine. Wer macht mit?" . Heise Online (en alemán). 2003-12-15 . Consultado el 9 de mayo de 2018 .
- ^ "YaCy se enfrenta a Google con motor de búsqueda de código abierto" . El registro . 2011-11-29 . Consultado el 16 de abril de 2012 .
- ^ "YaCy: se trata de libertad, no de vencer a Google" . PC World . 2011-12-03 . Consultado el 16 de abril de 2012 .
- ^ "Ich entwickle eine P2P-basierende Suchmaschine. Wer macht mit?" . Heise Online (en alemán). 2003-12-15 . Consultado el 9 de mayo de 2018 .
- ^ "Arquitectura de Tecnología YaCy" . YaCy.net . Consultado el 14 de febrero de 2012 .
- ^ GitHub: YaCy Grid Crawler , YaCy Search Engine, 28 de febrero de 2021, págs. Yacy / yacy_grid_crawler , consultado el 11 de marzo de 2021
- ^ GitHub: YaCy Grid Parser , YaCy Search Engine, 2021-02-28, págs. YaCy Grid es la implementación de segunda generación de YaCy , recuperado 2021-03-11
- ^ GitHub: YaCY Search , YaCy Search Engine, 2021-02-28, págs. Yacy / yacy-search forked de cream / yacy-search , recuperado 2021-03-11
- ^ "forum.yacy.de" . Consultado el 6 de junio de 2017 .
- ^ "En: DebianInstall" . YaCyWiki . Consultado el 6 de octubre de 2019 .
- ^ "Dev: TaskSharing" . YaCyWiki . Consultado el 6 de octubre de 2019 .
- ^ "# 452422 - RFP: yacy - rastreador web distribuido y motor de búsqueda" . Registros de informes de errores de Debian . Consultado el 2 de mayo de 2020 .
- ^ Secuencia de comandos del motor de búsqueda Azizi
- ^ Bang Digital
- ^ PWD
Otras lecturas
YaCy en LinuxReviews
enlaces externos
- Página web oficial