Experimentos de Cranfield

Los experimentos de Cranfield fueron una serie de estudios experimentales en recuperación de información realizados por Cyril W. Cleverdon en la Facultad de Aeronáutica, hoy conocida como Universidad de Cranfield , en la década de 1960 para evaluar la eficiencia de los sistemas de indexación . ^[1]^[2]^[3] Los experimentos se dividieron en dos fases principales, ninguna de las cuales estaba computarizada. La colección completa de resúmenes, índices resultantes y resultados se distribuyeron posteriormente en formato electrónico y fueron ampliamente utilizados durante décadas.

En la primera serie de experimentos, se compararon varios métodos de indexación existentes para probar su eficiencia. Las consultas fueron generadas por los autores de los artículos de la colección y luego traducidas en búsquedas de índices por expertos en esos sistemas. En esta serie, un método pasó de menos eficiente a más eficiente después de realizar cambios menores en la disposición de la forma en que se registraron los datos en las fichas . La conclusión pareció ser que la metodología subyacente parecía menos importante que los detalles específicos de la implementación. Esto dio lugar a un debate considerable sobre la metodología de los experimentos.

Estas críticas también llevaron a la segunda serie de experimentos, ahora conocida como Cranfield 2. Cranfield 2 intentó obtener información adicional invirtiendo la metodología; Cranfield 1 probó la capacidad de los expertos para encontrar un recurso específico siguiendo el sistema de índices, Cranfield 2 en cambio estudió los resultados de hacer preguntas en lenguaje humano y ver si el sistema de indexación proporcionaba una respuesta relevante, independientemente de si era el documento de destino original. También fue tema de considerable debate.

Los experimentos de Cranfield fueron extremadamente influyentes en el campo de la recuperación de información, siendo en sí mismo un tema de considerable interés en la era posterior a la Segunda Guerra Mundial , cuando la cantidad de investigación científica estaba en auge. Fue tema de continuo debate durante años y dio lugar a varios proyectos informáticos para probar sus resultados. Su influencia fue considerable durante un período de cuarenta años antes de que los índices de lenguaje natural como los de los motores de búsqueda web modernos se convirtieran en algo común.

El ahora famoso artículo de julio de 1945 " As We May Think " de Vannevar Bush se señala a menudo como la primera descripción completa del campo que se convirtió en la recuperación de información . El artículo describe una máquina hipotética conocida como " memex " que mantendría todo el conocimiento de la humanidad en una forma indexada que permitiría que cualquiera pudiera recuperarlo. ^[4]

En 1948, la Royal Society celebró la Conferencia de Información Científica que exploró por primera vez algunos de estos conceptos de manera formal. Esto condujo a una pequeña cantidad de experimentos de campo en el Reino Unido, Estados Unidos y los Países Bajos. El único esfuerzo importante para comparar diferentes sistemas fue dirigido por Gull utilizando la colección de trabajos de la Agencia de Información Técnica de las Fuerzas Armadas , que había comenzado como una colección de informes aeronáuticos capturados en Alemania al final de la Segunda Guerra Mundial . La evaluación de los resultados fue realizada por expertos en los dos sistemas, y nunca se pusieron de acuerdo sobre si varios documentos recuperados eran relevantes para la búsqueda, y cada grupo rechazó más del 30% de los resultados como incorrectos. Se cancelaron más pruebas porque no parecía haber consenso.^[5]