Experimentos de Cranfield


Los experimentos de Cranfield fueron una serie de estudios experimentales sobre recuperación de información realizados por Cyril W. Cleverdon en la Facultad de Aeronáutica de la Universidad de Cranfield en la década de 1960, para evaluar la eficiencia de los sistemas de indexación . [1] [2] [3] Los experimentos se dividieron en dos fases principales, ninguna de las cuales estaba computarizada. La colección completa de resúmenes, índices resultantes y resultados se distribuyeron posteriormente en formato electrónico y fueron ampliamente utilizados durante décadas.

En la primera serie de experimentos, se compararon varios métodos de indexación existentes para probar su eficiencia. Las consultas fueron generadas por los autores de los artículos de la colección y luego traducidas en búsquedas de índices por expertos en esos sistemas. En esta serie, un método pasó de menos eficiente a más eficiente después de realizar cambios menores en la disposición de la forma en que se registraron los datos en las fichas . La conclusión pareció ser que la metodología subyacente parecía menos importante que los detalles específicos de la implementación. Esto dio lugar a un debate considerable sobre la metodología de los experimentos.

Estas críticas también llevaron a la segunda serie de experimentos, ahora conocida como Cranfield 2. Cranfield 2 intentó obtener información adicional invirtiendo la metodología; Cranfield 1 probó la capacidad de los expertos para encontrar un recurso específico siguiendo el sistema de índices, Cranfield 2 en cambio estudió los resultados de hacer preguntas en lenguaje humano y ver si el sistema de indexación proporcionaba una respuesta relevante, independientemente de si era el documento de destino original. También fue tema de considerable debate.

Los experimentos de Cranfield fueron extremadamente influyentes en el campo de la recuperación de información, siendo en sí mismo un tema de considerable interés en la era posterior a la Segunda Guerra Mundial , cuando la cantidad de investigación científica estaba en auge. Fue tema de continuo debate durante años y dio lugar a varios proyectos informáticos para probar sus resultados. Su influencia fue considerable durante un período de cuarenta años antes de que los índices de lenguaje natural como los de los motores de búsqueda web modernos se convirtieran en algo común.

El ahora famoso artículo de julio de 1945 " As We May Think " de Vannevar Bush se señala a menudo como la primera descripción completa del campo que se convirtió en la recuperación de información . El artículo describe una máquina hipotética conocida como " memex " que mantendría todo el conocimiento de la humanidad en una forma indexada que permitiría que cualquiera pudiera recuperarlo. [4]

En 1948, la Royal Society celebró la Conferencia de Información Científica que exploró por primera vez algunos de estos conceptos de manera formal. Esto condujo a una pequeña cantidad de experimentos de campo en el Reino Unido, Estados Unidos y los Países Bajos. Una segunda conferencia sobre el tema, la Conferencia Internacional sobre Información Científica, se celebró en Washington, DC en 1958, momento en el que el desarrollo informático había llegado al punto en que era posible la recuperación automática de índices. Fue en esta reunión que Cyril W. Cleverdon "se metió la pata" y logró conseguir fondos de la Fundación Nacional de Ciencias de EE. UU. Para iniciar lo que más tarde se conocería como Cranfield 1. [5]