La detección de palabras clave (o más simplemente, la detección de palabras ) es un problema que históricamente se definió por primera vez en el contexto del procesamiento del habla . [1] [2] En el procesamiento del habla, la detección de palabras clave se ocupa de la identificación de palabras clave en expresiones.
La detección de palabras clave también se define como un problema separado, pero relacionado, en el contexto del procesamiento de imágenes de documentos. [1] En el procesamiento de imágenes de documentos, la detección de palabras clave es el problema de encontrar todas las instancias de una palabra de consulta que existen en una imagen de documento escaneada, sin reconocerla por completo.
En procesamiento de voz
Los primeros trabajos sobre detección de palabras clave aparecieron a finales de la década de 1980. [2]
Un caso especial de detección de palabras clave es la detección de palabras de activación (también llamada palabra activa) que utilizan los asistentes digitales personales como Alexa o Siri para "despertar" cuando se pronuncia su nombre.
En los Estados Unidos, la Agencia de Seguridad Nacional ha hecho uso de la detección de palabras clave desde al menos 2006. [3] Esta tecnología permite a los analistas buscar en grandes volúmenes de conversaciones grabadas y aislar menciones de palabras clave sospechosas. Las grabaciones se pueden indexar y los analistas pueden ejecutar consultas en la base de datos para encontrar conversaciones de interés. La IARPA financió una investigación sobre la detección de palabras clave en el programa Babel .
Algunos algoritmos utilizados para esta tarea son:
- Ventana corredera y modelo de basura.
- Hipótesis K-best
- Decodificación iterativa de Viterbi
- Red neuronal convolucional en coeficientes de cepstrum de frecuencia Mel [4]
En el procesamiento de imágenes de documentos
La detección de palabras clave en el procesamiento de imágenes de documentos puede verse como un ejemplo del problema más genérico de la recuperación de imágenes basada en contenido (CBIR). Dada una consulta, el objetivo es recuperar las instancias más relevantes de palabras en una colección de documentos escaneados. [1] La consulta puede ser una cadena de texto (búsqueda por cadena de palabras clave) o una imagen de palabra (búsqueda por ejemplo de palabras clave).
Referencias
- ^ a b c Giotis, AP; Sfikas, G .; Gatos, B .; Nikou, C. (2017). "Un estudio de las técnicas de detección de palabras de imágenes de documentos". Reconocimiento de patrones . 68 : 310–332. doi : 10.1016 / j.patcog.2017.02.023 .
- ^ a b Rohlicek, J .; Russell, W .; Roukos, S .; Gish, H. (1989). "Modelado continuo de Markov oculto para la detección de palabras independiente del hablante". Actas de la 14ª Conferencia Internacional IEEE sobre Acústica, Habla y Procesamiento de Señales (ICASSP) . 1 : 627–630.
- ^ Froomkin, Dan. "LAS COMPUTADORAS ESTÁN ESCUCHANDO" . La intercepción . Consultado el 20 de junio de 2015 .
- ^ Sainath, Tara N y Parada, Carolina (2015). "Redes neuronales convolucionales para la detección de palabras clave de huella pequeña". Decimosexta Conferencia Anual de la Asociación Internacional de Comunicación de Discursos . arXiv : 1711.00333 .CS1 maint: varios nombres: lista de autores ( enlace )