De Wikipedia, la enciclopedia libre
  (Redirigido desde Solr )
Saltar a navegación Saltar a búsqueda

Solr (pronunciado "solar") es una plataforma de búsqueda empresarial de código abierto , escrita en Java . Sus características principales incluyen búsqueda de texto completo , resaltado de aciertos, búsqueda por facetas , indexación en tiempo real, agrupamiento dinámico, integración de bases de datos, características NoSQL [2] y manejo de documentos enriquecidos (por ejemplo, Word, PDF). Proporcionando búsqueda distribuida y replicación de índices, Solr está diseñado para escalabilidad y tolerancia a fallas . [3] Solr se usa ampliamente para casos de uso de análisis y búsqueda empresarial y tiene una comunidad de desarrollo activa y lanzamientos regulares.

Solr se ejecuta como un servidor de búsqueda de texto completo independiente. Utiliza la biblioteca de búsqueda Lucene Java en su núcleo para la indexación y la búsqueda de texto completo, y tiene API de HTTP / XML y JSON similares a REST que lo hacen utilizable desde la mayoría de los lenguajes de programación populares. La configuración externa de Solr permite que se adapte a muchos tipos de aplicaciones sin codificación Java, y tiene una arquitectura de complemento para admitir una personalización más avanzada.

Apache Solr es desarrollado de manera abierta y colaborativa por el proyecto Apache Solr en la Apache Software Foundation .

Historia [ editar ]

En 2004, Solr fue creado por Yonik Seeley en CNET Networks como un proyecto interno para agregar capacidad de búsqueda para el sitio web de la empresa.

En enero de 2006, CNET Networks decidió publicar abiertamente el código fuente donándolo a la Apache Software Foundation . [4] Como cualquier nuevo proyecto de Apache, entró en un período de incubación que ayudó a resolver problemas organizativos, legales y financieros.

En enero de 2007, Solr pasó del estado de incubación a un proyecto de nivel superior independiente (TLP) y creció de manera constante con las funciones acumuladas, atrayendo así a usuarios, contribuyentes y comprometidos. Aunque es bastante nuevo como proyecto público, impulsó varios sitios web de alto tráfico. [5]

En septiembre de 2008, se lanzó Solr 1.3 que incluye capacidades de búsqueda distribuida y mejoras de rendimiento, entre muchas otras. [6]

En enero de 2009, Yonik Seeley junto con Grant Ingersoll y Erik Hatcher se unieron a Lucidworks (anteriormente Lucid Imagination), la primera empresa que brinda soporte comercial y capacitación para las tecnologías de búsqueda Apache Solr. [ cita requerida ] Desde entonces, las ofertas de apoyo alrededor de Solr han sido abundantes. [7]

Noviembre de 2009 vio el lanzamiento de Solr 1.4. Esta versión introdujo mejoras en la indexación, búsqueda y creación de facetas junto con muchas otras mejoras, como el procesamiento de documentos enriquecidos ( PDF , Word , HTML ), la agrupación de resultados de búsqueda basada en Carrot2 y también una mejor integración de la base de datos. La versión también incluye muchos complementos adicionales. [8]

En marzo de 2010, los proyectos Lucene y Solr se fusionaron. [9] Continuaron las descargas separadas, pero los productos ahora fueron desarrollados conjuntamente por un solo grupo de confirmadores.

En 2011, el esquema del número de versión de Solr se cambió para que coincida con el de Lucene. Después de Solr 1.4, la siguiente versión de Solr fue etiquetada como 3.1, para mantener a Solr y Lucene en el mismo número de versión. [10]

En octubre de 2012 se lanzó la versión 4.0 de Solr, incluida la nueva función SolrCloud. [11] 2013 y 2014 vieron una serie de lanzamientos de Solr en la línea 4.x, aumentando constantemente el conjunto de funciones y mejorando la confiabilidad.

En febrero de 2015, se lanzó Solr 5.0, [12] la primera versión en la que Solr se empaqueta como una aplicación independiente, [13] terminando el soporte oficial para implementar Solr como una guerra . Solr 5.3 presentaba un marco de autenticación y autorización conectable incorporado. [14]

En abril de 2016, se lanzó Solr 6.0. [15] Se agregó soporte para ejecutar consultas SQL en paralelo en las colecciones de SolrCloud. Incluye compatibilidad con StreamExpression y un nuevo controlador JDBC para la interfaz SQL.

En septiembre de 2017, se lanzó Solr 7.0. [16] Esta versión, entre otras cosas, agregó soporte para múltiples tipos de réplicas, escalado automático y un motor matemático.

En marzo de 2019, se lanzó Solr 8.0, incluidas muchas correcciones de errores y actualizaciones de componentes. [17] Los nodos Solr ahora pueden escuchar y atender solicitudes HTTP / 2. Tenga en cuenta que, de forma predeterminada, las solicitudes internas también se envían mediante HTTP / 2. Además, se agregó un inicio de sesión de interfaz de usuario de administrador con soporte para BasicAuth y Kerberos. Y ahora es posible trazar expresiones matemáticas en Apache Zeppelin.

En noviembre de 2020, Bloomberg donó el operador Solr al proyecto Lucene / Solr. El operador de Solr ayuda a implementar y ejecutar Solr en Kubernetes .

En febrero de 2021, Solr se estableció como un proyecto Apache separado (TLP), independiente de Lucene.

Operaciones [ editar ]

Para buscar un documento, Apache Solr realiza las siguientes operaciones en secuencia:

  1. Indexación: en primer lugar, convierte los documentos a un formato legible por máquina que se llama Indexación.
  2. Consulta: comprensión de los términos de una consulta realizada por el usuario. Estos términos pueden ser imágenes o palabras clave, por ejemplo.
  3. Mapeo: Solr mapea la consulta del usuario a los documentos almacenados en la base de datos para encontrar el resultado apropiado.
  4. Clasificación del resultado: tan pronto como el motor busca los documentos indexados, clasifica los resultados según su relevancia.

Comunidad [ editar ]

Solr cuenta con personas y empresas que aportan nuevas funciones y corrección de errores. [18] [19] [20] [21] [22]

Integrando Solr [ editar ]

Solr se incluye como búsqueda integrada en muchas aplicaciones, como sistemas de gestión de contenido y sistemas de gestión de contenido empresarial . Las distribuciones de Hadoop de Cloudera , [23] Hortonworks [24] y MapR incluyen a Solr como motor de búsqueda para sus productos comercializados para big data . DataStax DSE integra Solr como motor de búsqueda con Cassandra . [25] Solr es compatible como punto final en varios marcos de procesamiento de datos y marcos de integración empresarial . [ cita requerida ]

Solr expone API similares a HTTP REST estándar de la industria con soporte tanto XML como JSON , y se integrará con cualquier sistema o lenguaje de programación que admita estos estándares. Para facilitar su uso, también hay bibliotecas cliente disponibles para Java , C # , PHP , Python , Ruby y la mayoría de los otros lenguajes de programación populares. [26]

Ver también [ editar ]

  • Marco semántico abierto
  • Arquitectura orientada a la búsqueda
  • Lista de bibliotecas de recuperación de información

Referencias [ editar ]

  1. ^ "Noticias" . Fundación Apache . Consultado el 12 de febrero de 2021 .
  2. ^ "Copia archivada" . Archivado desde el original el 6 de julio de 2014 . Consultado el 10 de julio de 2014 .CS1 maint: archived copy as title (link)
  3. ^ "Apache Solr -" . apache.org . Consultado el 16 de enero de 2017 .
  4. ^ "[SOLR-1] Contribución del código CNET - ASF JIRA" . apache.org . Consultado el 16 de enero de 2017 .
  5. ^ "PublicServers - Solr Wiki" . apache.org . Consultado el 16 de enero de 2017 .
  6. ^ "Apache Solr -" . apache.org . Consultado el 16 de enero de 2017 .
  7. ^ "Soporte - Solr Wiki" . apache.org . Consultado el 16 de enero de 2017 .
  8. ^ "Apache Solr -" . apache.org . Consultado el 16 de enero de 2017 .
  9. ^ "[VOTO] fusionar desarrollo lucene / solr (toma 3) - Yonik Seeley - org.apache.lucene.general - MarkMail" . markmail.org . Consultado el 16 de enero de 2017 .
  10. ^ Solr3.1 - Wiki de Solr . Wiki.apache.org (16 de mayo de 2013). Consultado el 21 de julio de 2013.
  11. ^ Apache Lucene . Lucene.apache.org. Consultado el 21 de julio de 2013.
  12. ^ "Apache Solr - Noticias" . apache.org . Consultado el 16 de enero de 2017 .
  13. ^ "[SOLR-6733] Problema de paraguas - Solr como aplicación independiente - ASF JIRA" . apache.org . Consultado el 16 de enero de 2017 .
  14. ^ "Anuncio de lanzamiento de Solr 5.3" . lucene.apache.org . Consultado el 24 de septiembre de 2015 .
  15. ^ "Apache Solr - Noticias" . apache.org . Consultado el 16 de enero de 2017 .
  16. ^ "Apache Solr - Noticias" .
  17. ^ "Notas de la versión de Apache Solr 8.0" .
  18. ^ "Preguntas de 'solr' más votadas" . stackoverflow.com . Consultado el 16 de enero de 2017 .
  19. ^ "Lucene / Solr Revolution 2016" . lucenerevolution.org . Consultado el 16 de enero de 2017 .
  20. ^ "SFBay Apache Lucene / Solr Meetup" . meetup.com . Consultado el 16 de enero de 2017 .
  21. ^ "Comunidad de Oslo Solr" . meetup.com . Consultado el 16 de enero de 2017 .
  22. ^ "Grupo Solr de LinkedIn" . linkedin.com . Consultado el 16 de enero de 2017 .
  23. ^ "Hadoop para todos: dentro de la búsqueda de Cloudera - Blog de ingeniería de Cloudera" . cloudera.com . 24 de junio de 2013 . Consultado el 16 de enero de 2017 .
  24. ^ "Llevando Enterprise Search a Enterprise Hadoop - Hortonworks" . hortonworks.com . 2 de abril de 2014 . Consultado el 16 de enero de 2017 .
  25. ^ "DataStax Enterprise: Cassandra con detalles de integración de Solr" . datastax.com . 12 de abril de 2012 . Consultado el 6 de febrero de 2017 .
  26. ^ "IntegratingSolr - Solr Wiki". apache.org. Retrieved 16 January 2017.

Bibliography[edit]

  • Grainger, Trey; Potter, Timothy (March 2014). Solr in Action (1st ed.). Manning Publications. p. 664. ISBN 9781617291029.
  • Smiley, David; Pugh, Eric; Parisa, Kranti; Mitchell, Matt (February 2014). Apache Solr 4 Enterprise Search Server (1st ed.). Packt Publishing. p. 451. ISBN 9781782161363.
  • Serafini, Alfredo (December 2013). Apache Solr Beginner’s Guide (1st ed.). Packt Publishing. p. 324. ISBN 9781782162520.
  • Rafalovitch, Alexandre (June 2013). Instant Apache Solr for Indexing Data How-to (1st ed.). Packt Publishing. p. 90. ISBN 9781782164845.
  • Kuć, Rafał (January 2013). Apache Solr 4 Cookbook (1st ed.). Packt Publishing. p. 328. ISBN 9781782161325.
  • Smiley, David; Pugh, Eric (November 20, 2011). Apache Solr 3 Enterprise Search Server (1st ed.). Packt Publishing. p. 418. ISBN 1-84951-606-5.
  • Kuć, Rafał (July 22, 2011). Apache Solr 3.1 Cookbook (1st ed.). Packt Publishing. p. 300. ISBN 1-84951-218-3.
  • Smiley, David; Pugh, Eric (August 19, 2009). Solr 1.4 Enterprise Search Server (1st ed.). Packt Publishing. p. 336. ISBN 1-84719-588-1.

External links[edit]

  • Official website
  • Ansible role to install SolrCloud in a Debian environment