Palabra clave en contexto ( KWIC ) es el formato más común para las líneas de concordancia . El término KWIC fue acuñado por primera vez por Hans Peter Luhn . [1] El sistema se basó en un concepto llamado palabra clave en títulos que fue propuesto por primera vez para las bibliotecas de Manchester en 1864 por Andrea Crestadoro . [2]
Un índice KWIC se forma ordenando y alineando las palabras dentro del título de un artículo para permitir que cada palabra (excepto las palabras vacías ) en los títulos se pueda buscar alfabéticamente en el índice. [3] Era un método de indexación útil para manuales técnicos antes de que la búsqueda de texto completo computarizada se volviera común. [4]
Por ejemplo, una consulta de búsqueda que incluya todas las palabras en una definición de ejemplo ("KWIC es un acrónimo de Key Word In Context, el formato más común para las líneas de concordancia") y el eslogan de Wikipedia en inglés ("la enciclopedia libre"), buscado en una página de Wikipedia, puede producir un índice KWIC de la siguiente manera. Un índice KWIC generalmente usa un diseño amplio para permitir la visualización de la información máxima 'en contexto' (no se muestra en el siguiente ejemplo).
KWIC es un | acrónimo de Key Word In Context, ... | Página 1 |
... Palabra clave en contexto, la más | formato común para líneas de concordancia. | Página 1 |
... el formato más común para | líneas de concordancia . | Página 1 |
... es un acrónimo de Key Word In | Contexto , el formato más común ... | Página 1 |
Wikipedia, The Free | Enciclopedia | página 0 |
... En contexto, el más común | formato para líneas de concordancia. | Página 1 |
Wikipedia, la | Enciclopedia libre | página 0 |
KWIC es un acrónimo de | Palabra clave en contexto, la más ... | Página 1 |
KWIC es un acrónimo de Key Word ... | Página 1 | |
... formato común para la concordancia | líneas . | Página 1 |
... para Palabra clave en contexto, el | formato más común para la concordancia ... | Página 1 |
Wikipedia , la enciclopedia libre | página 0 | |
KWIC es un acrónimo de Key | Word In Context, el más común ... | Página 1 |
Un índice KWIC es un caso especial de índice permutado . [5] Este término se refiere al hecho de que indexa todas las permutaciones cíclicas de los títulos. Los libros compuestos por muchas secciones cortas con sus propios títulos descriptivos, sobre todo colecciones de páginas de manual , a menudo terminan con una sección de índice permutada , lo que permite al lector encontrar fácilmente una sección por cualquier palabra de su título. Esta práctica, también conocida como palabra clave fuera de contexto ( KWOC ), ya no es común.
Palabra clave junto con el contexto (KWAC)
Palabra clave en contexto (KWIC)
Palabra clave fuera de contexto (KWOC)
Referencias en la literatura
Nota: La primera referencia no muestra el índice KWIC a menos que pague para ver el documento. La segunda referencia ni siquiera enumera el documento en absoluto.
- David L.Parnas utiliza un índice KWIC como ejemplo sobre cómo realizar un diseño modular en su artículo Sobre los criterios que se utilizarán en la descomposición de sistemas en módulos , disponible como artículo clásico de ACM.
- Christopher D. Manning y Hinrich Schütze describen un índice KWIC y una concordancia por computadora en la sección 1.4.5 de su libro Fundamentos del procesamiento estadístico del lenguaje natural . Cambridge, Mass: MIT Press, 1999. ISBN 9780262133609 . Citan un artículo de HP Luhn de 1960, "Índice de palabras clave en contexto para la literatura técnica (índice kwic)".
- Según Concordantia et Indices Missalium Romanorum del Rev. Gerard O'Connor , "La mayoría de las concordancias producidas en los últimos tiempos y con la ayuda de software de computadora utilizan los formatos KWIC (palabra clave en contexto) y KWICn (palabra clave en el centro), que enumera la palabra clave, generalmente resaltada en negrita en una posición consistente, dentro de una cantidad limitada de texto de contexto, es decir, tres [o] cuatro palabras del texto antes de la palabra clave y la misma cantidad de texto a continuación. Este formato es extremadamente útil porque la palabra clave se identifica fácilmente junto con su contexto ... La Concordancia del Misal Romano se produce en los formatos KWIC y KWICn y es digno de mención porque cada forma de palabra se enumera como aparece en el texto, es decir, es no lematizado ".
Ver también
- ptx , una utilidad de línea de comandos de Unix que produce un índice permutado
- Concordancer
- Concordancia (publicación)
- Transformada de Burrows-Wheeler
- Hans Peter Luhn
- Árbol de sufijo
Referencias
- ^ Manning, CD, Schütze, H .: "Fundamentos del procesamiento estadístico del lenguaje natural", p. 35. The MIT Press, 1999
- ^ "Prácticas avanzadas de indexación y abstracción" . Atlantic Publishers & Distri . Consultado el 26 de marzo de 2019 , a través de Google Books.
- ^ "Copia archivada" . Archivado desde el original el 6 de junio de 2016 . Consultado el 17 de junio de 2016 .Mantenimiento de CS1: copia archivada como título ( enlace )
- ^ "Guía de divulgación" . Viernes, 8 de mayo de 2020
- ^ "3. Teoría de la indexación KWIC" . Infohost.nmt.edu . Consultado el 26 de marzo de 2019 .