Cirilo Cleverdon


Cyril Cleverdon (9 de septiembre de 1914 - 4 de diciembre de 1997) fue un bibliotecario e informático británico conocido por su trabajo en la evaluación de sistemas de recuperación de información .

Cyril Cleverdon nació en Bristol , Inglaterra . Trabajó en las Bibliotecas de Bristol de 1932 a 1938, y de 1938 a 1946 fue bibliotecario de la División de Motores de Bristol Airplane Co. Ltd. En 1946 fue nombrado bibliotecario de la Facultad de Aeronáutica de Cranfield (más tarde el Instituto Cranfield). de Tecnología y la Universidad de Cranfield ), donde se desempeñó hasta su jubilación en 1979, los últimos dos años como profesor de Estudios de Transferencia de Información.

Con la ayuda de la financiación de la Fundación Nacional de Ciencias , Cleverdon inició una serie de proyectos en 1957 que duró unos 10 años en los que él y sus colegas sentaron las bases para la investigación de recuperación de información. En el proyecto Cranfield , los experimentos de recuperación se realizaron en bases de datos de prueba en un entorno controlado similar al de un laboratorio. El objetivo de la investigación era mejorar la eficacia de recuperación de los sistemas de recuperación de información mediante el desarrollo de mejores lenguajes y métodos de indexación. Los componentes de los experimentos fueron:

Juntos, estos componentes forman una colección de prueba de recuperación de información. La colección de pruebas sirve como estándar para probar los enfoques de recuperación, y el éxito de cada enfoque se mide en términos de dos medidas: precisión y recuperación . Las colecciones de pruebas y las medidas de evaluación basadas en la precisión y el recuerdo son fuerzas impulsoras detrás de la investigación moderna sobre sistemas de búsqueda. El enfoque de Cleverdon formó un modelo para la exitosa serie de conferencias de recuperación de texto que comenzó en 1992.

Los estudios Cranfield de Cleverdon no solo introdujeron la investigación experimental en informática, sino que los resultados del proyecto también establecieron la base de la indexación automática como se hace en los motores de búsqueda actuales . Esencialmente, Cleverdon descubrió que el uso de términos individuales de los documentos lograba el mejor rendimiento de recuperación, a diferencia de los términos del tesauro asignados manualmente, sinónimos, etc. Estos resultados fueron muy controvertidos en ese momento. En el Informe Cranfield 2, Cleverdon dijo:

Esta conclusión es tan controvertida y tan inesperada que arroja dudas considerables sobre los métodos que se han utilizado (...) Una revisión completa no ha revelado ninguna discrepancia (...) no queda otro camino que intentar para explicar los resultados que parecen ofender todos los cánones en los que fuimos formados como bibliotecarios.