Gerard A. "Gerry" Salton (8 de marzo de 1927 en Nuremberg - 28 de agosto de 1995), fue profesor de informática en la Universidad de Cornell . Salton fue quizás el científico informático líder que trabajó en el campo de la recuperación de información durante su tiempo, y "el padre de la recuperación de información". [1] Su grupo en Cornell desarrolló el Sistema de Recuperación de Información SMART , que inició cuando estaba en Harvard. Fue el primer sistema en utilizar el ahora popular modelo de espacio vectorial para la recuperación de información.
Gerard Salton | |
---|---|
Nació | |
Fallecido | 28 de agosto de 1995 | (68 años)
alma mater | Universidad Harvard |
Conocido por | el padre de la recuperación de información [1] Premio Gerard Salton |
Carrera científica | |
Campos | recuperación de información |
Instituciones | Universidad de Cornell |
Tesis | Un sistema automático de procesamiento de datos para la contabilidad de ingresos de servicios públicos (1958) |
Asesor de doctorado | Howard Aiken |
Estudiantes de doctorado |
Salton nació como Gerhard Anton Sahlmann el 8 de marzo de 1927 en Nuremberg, Alemania . Recibió una licenciatura (1950) y una maestría (1952) en matemáticas de Brooklyn College , y un doctorado. de Harvard en Matemáticas Aplicadas en 1958, el último de los estudiantes de doctorado de Howard Aiken , y enseñó allí hasta 1965, cuando se unió a la Universidad de Cornell y cofundó su departamento de Ciencias de la Computación.
Salton fue quizás más conocido por desarrollar el modelo de espacio vectorial ahora ampliamente utilizado para la recuperación de información. [2] En este modelo, tanto los documentos como las consultas se representan como vectores de recuento de términos, y la similitud entre un documento y una consulta viene dada por el coseno entre el vector de término y el vector de documento. En este artículo, también presentó TF-IDF , o frecuencia de término-frecuencia-inversa-documento, un modelo en el que la puntuación de un término en un documento es la relación entre el número de términos en ese documento dividido por la frecuencia de la número de documentos en los que aparece ese término. (El concepto de frecuencia inversa de documentos, una medida de especificidad, fue introducido en 1972 por Karen Sparck-Jones . [3] ) Más adelante en su vida, se interesó en el análisis y resumen automático de texto, [4] así como en el hipertexto automático. Generacion. [5] Publicó más de 150 artículos de investigación y 5 libros durante su vida.
Salton fue editor en jefe de las Comunicaciones de la ACM y la Revista de la ACM , y presidió el Grupo de Interés Especial sobre Recuperación de Información (SIGIR). Fue editor asociado de ACM Transactions on Information Systems . Fue miembro de la ACM (elegido en 1995), [6] recibió un Premio al Mérito de la Sociedad Estadounidense para las Ciencias de la Información (1989) y fue el primer destinatario del Premio SIGIR por sus destacadas contribuciones al estudio de la Recuperación de Información (1983) - - ahora llamado Premio Gerard Salton .
Bibliografía
- Salton, Organización y recuperación automática de información , 1968.
- Gerard Salton (1975). Una teoría de la indexación . Sociedad de Matemáticas Industriales y Aplicadas. pag. 56 .
- --- y Michael J. McGill, Introducción a la recuperación de información moderna , 1983. ISBN 0-07-054484-0
- Gerard Salton (1989). Procesamiento automático de texto . Compañía editorial de Addison-Wesley. pag. 530 . ISBN 978-0-201-12227-5.
- Gerard Salton en el servidor de bibliografía DBLP
- G. Salton, A. Wong y CS Yang (1975), " Un modelo de espacio vectorial para indexación automática ", Communications of the ACM , vol. 18, nr. 11, páginas 613–620. (Artículo en el que se presentó un modelo de espacio vectorial)
Ver también
Referencias
- ^ a b "El padre de la recuperación de información" (PDF) . cs.cornell.edu . Consultado el 10 de marzo de 2015 .
miembro fundador del departamento y padre de Information Retrieval.
- ^ Salton, G .; Wong, A .; Yang, CS (1975). "Un modelo de espacio vectorial para indexación automática". Comunicaciones de la ACM . 18 (11): 613. doi : 10.1145 / 361219.361220 . hdl : 1813/6057 . S2CID 6473756 .
- ^ Spärck Jones, K. (1972). "Una interpretación estadística de la especificidad del término y su aplicación en la recuperación". Revista de documentación . 28 : 11-21. CiteSeerX 10.1.1.115.8343 . doi : 10.1108 / eb026526 .
- ^ Salton, G .; Allan, J .; Buckley, C .; Singhal, A. (1994). "Análisis automático, generación de temas y resumen de textos legibles por máquina". Ciencia . 264 (5164): 1421–1426. Bibcode : 1994Sci ... 264.1421S . doi : 10.1126 / science.264.5164.1421 . PMID 17838425 . S2CID 32296317 .
- ^ "Gerard Salton" . Cs.cornell.edu . Consultado el 14 de septiembre de 2013 .
- ^ "Becarios Gerard Salton ACM 1995" . acm.org . Consultado el 10 de marzo de 2015 .
contribuciones durante 30 años a la organización y recuperación de información
enlaces externos
- En memoria
- Fractales de cambio: busca en el carril de la memoria
- El artículo más influyente que Gerard Salton nunca escribió : este artículo de Tendencias de la biblioteca de 2004 de David Dubin sirve como una revisión histórica de la metamorfosis del término modelo de valor de discriminación (TDV) en el modelo de espacio vectorial como modelo de recuperación de información (VSM como modelo IR ). Este artículo cuestiona lo que la comunidad de investigación de Recuperación de Información creía que originalmente se pretendía modelar el modelo espacial vectorial de Salton. Lo que mucho más tarde se convirtió en un modelo de recuperación de información fue originalmente un modelo matemático-computacional centrado en datos utilizado como un dispositivo explicativo. Además, el artículo de Dubin señala que un artículo de Salton de 1975 citado con frecuencia no existe, pero probablemente sea una combinación de otros dos artículos, ninguno de los cuales se refiere en realidad al VSM como un modelo de RI.