La co-cita , como el acoplamiento bibliográfico , es una medida de similitud semántica para documentos que hace uso de relaciones de cita . La co-cita se define como la frecuencia con la que dos documentos son citados juntos por otros documentos. [1] Si al menos otro documento cita dos documentos en común, se dice que estos documentos se citan conjuntamente. Cuantas más co-citas reciben dos documentos, mayor es su fuerza de co-citas y es más probable que estén relacionados semánticamente. [1]
La figura de la derecha ilustra el concepto de co-cita y una variación más reciente de co-cita que explica la ubicación de las citas en el texto completo de los documentos. La imagen de la izquierda de la figura muestra los Documentos A y B, ambos citados por los Documentos C, D y E; por tanto, los Documentos A y B tienen una fuerza de co-citación , o índice de co-citación [2] de tres. Esta puntuación generalmente se establece mediante índices de citas . Los documentos que presentan un elevado número de citas conjuntas se consideran más similares. [1]
La imagen de la derecha muestra un documento que cita los Documentos 1, 2 y 3. Tanto los Documentos 1 y 2 como los Documentos 2 y 3 tienen una fuerza de co-cita de uno, dado que son citados juntos exactamente por otro documento. . Sin embargo, los Documentos 2 y 3 se citan mucho más cerca uno del otro en el documento que cita en comparación con el Documento 1. Para que la co-cita sea una medida más significativa en este caso, se puede introducir un Índice de Proximidad de Co-Citación (IPC) para tener en cuenta la ubicación de las citas entre sí. Los documentos co-citados a mayores distancias relativas en el texto completo reciben valores de IPC más bajos. [3] Gipp y Beel fueron los primeros en proponer el uso de pesos de co-cita modificados basados en la proximidad. [4]
A Henry Small [1] e Irina Marshakova [5] se les atribuye la introducción del análisis de co-citas en 1973. [2] Ambos investigadores propusieron la medida de forma independiente, aunque Marshakova obtuvo menos crédito, probablemente porque su trabajo fue publicado en ruso. [6]
El análisis de citas conjuntas proporciona una evaluación prospectiva sobre la similitud del documento en contraste con el acoplamiento bibliográfico, que es retrospectivo. [7] Las citas que recibe un artículo en el futuro dependen de la evolución de un campo académico, por lo que las frecuencias de co-citas aún pueden cambiar. En el diagrama adyacente, por ejemplo, Doc A y Doc B todavía pueden ser citados conjuntamente por documentos futuros, digamos Doc F y Doc G. Esta característica de la co-cita permite un sistema de clasificación de documentos dinámico en comparación con el acoplamiento bibliográfico.
A lo largo de las décadas, los investigadores propusieron variantes o mejoras al concepto de co-cita original. Howard White introdujo el análisis de co-citas de autor en 1981. [8] Gipp y Beel propusieron el análisis de proximidad de co-citas (CPA) e introdujeron el CPI como una mejora al concepto de co-citas original en 2009. [3] Co-citación de proximidad El análisis considera la proximidad de las citas dentro de los textos completos para el cálculo de la similitud y, por lo tanto, permite una evaluación más detallada de la similitud del documento semántico que la co-cita pura. [9]
Consideraciones
Las motivaciones de los autores para citar literatura pueden variar mucho y ocurrir por una variedad de razones además de simplemente referirse a documentos académicamente relevantes. Cole y Cole expresaron esta preocupación basándose en la observación de que los científicos tienden a citar a amigos y universidades de investigación con más frecuencia, una parcialidad conocida como amiguismo . [10] Además, se ha observado que los trabajos académicos que ya han ganado mucho crédito y reputación en un campo tienden a recibir aún más crédito y por lo tanto citas en la literatura futura, una observación denominada efecto Mateo en la ciencia.
Ver también
- Acoplamiento bibliográfico
- Análisis de proximidad de co-cita
- CITREC , un marco de evaluación para medidas de similitud basadas en citas que incluyen acoplamiento bibliográfico , co-cita, análisis de proximidad de co-cita y otros. [11]
Referencias
- ↑ a b c d Henry Small (julio de 1973). "Co-cita en la literatura científica: una nueva medida de la relación entre dos documentos". Revista de la Asociación de Ciencia y Tecnología de la Información . 24 (4): 265–269. doi : 10.1002 / ASI.4630240406 . ISSN 1532-2882 . Wikidata Q56679837 ..
- ^ a b Jeppe Nicolaisen, 2005 Co-cita Archivado el 15 de marzo de 2013 en la Wayback Machine , en Birger Hjørland, ed., Conceptos básicos en bibliotecas y ciencias de la información Archivado el 25 de mayo de 2010 en la Wayback Machine de The Royal School of Bibliotecología y Ciencias de la Información (RSLIS), Copenhague, Dinamarca.
- ^ a b Bela Gipp y Joeran Beel, 2009 "Análisis de proximidad de citas (CPA): un nuevo enfoque para identificar el trabajo relacionado basado en el análisis de citas conjuntas" en Birger Larsen y Jacqueline Leta, editores, Actas de la 12ª Conferencia Internacional de Cienciometría y Informetrics (ISSI'09), volumen 2, páginas 571–575, Río de Janeiro (Brasil), julio de 2009.
- ^ Kevin W. Boyack, Henry Small y Richard Klavans, 2013 "Mejora de la precisión de la agrupación de citas conjuntas mediante texto completo" Archivado el 4 de marzo de 2016 en el Wayback Machine Journal de la Sociedad Estadounidense de Ciencia y Tecnología de la Información, Volumen 64, Número 9, páginas 1759–1767, septiembre de 2013
- ^ Irena Marshakova Shaikevich, 1973. "Sistema de conexiones de documentos basado en referencias" . Serie de información científica y técnica de VINITI, 6 (2): 3–8
- ^ Frank Havemann, 2009. "Einführung in die Bibliometrie". Universidad Humboldt de Berlín.
- ^ Garfield, E., 27 de noviembre de 2001. "Del acoplamiento bibliográfico al análisis de la co-cita a través de historio-bibliografía algorítmica: tributo de un citador a Belver C. Griffith. Un artículo presentado en la Universidad de Drexel, Filadelfia, PA.
- ^ Howard D. White y Belver C. Griffith, 1981. "Cocitación de autor: una medida de la literatura de la estructura intelectual". Revista de la Sociedad Estadounidense de Ciencias de la Información (JASIS), mayo de 1981, volumen 32 (3), págs. 163-171. - el primer artículo de la ACA. DOI = 10.1002 / asi.4630320302.
- ^ M. Schwarzer, M. Schubotz, N. Meuschke, C. Breitinger, V. Markl y B. Gipp, "Evaluación de recomendaciones basadas en enlaces para Wikipedia" en Actas de la 16a Conferencia conjunta ACM / IEEE-CS sobre bibliotecas digitales (JCDL), Nueva York, NY, EE. UU., 2016, págs. 191-200.
- ^ Cole, JR y Cole, S., 1973. "Estratificación social en la ciencia". Chicago, IL: University of Chicago Press.
- ^ Bela Gipp, Norman Meuschke y Mario Lipinski, 2015. "CITREC: Un marco de evaluación para medidas de similitud basadas en citas basadas en TREC Genomics y PubMed Central" en Actas de la iConference 2015, Newport Beach, California, 2015.