Trigrama


Los trigramas son un caso especial del n -grama , donde n es 3. A menudo se utilizan en el procesamiento del lenguaje natural para realizar análisis estadísticos de textos y en criptografía para el control y uso de cifrados y códigos .

El contexto es muy importante, las distintas clasificaciones y porcentajes de análisis se derivan fácilmente extrayendo muestras de diferentes tamaños, diferentes autores; o diferentes tipos de documentos: poesía, ciencia ficción, documentación tecnológica; y niveles de escritura: cuentos para niños versus adultos, órdenes militares y recetas.

El análisis de frecuencia criptoanalítico típico encuentra que los 16 trigramas a nivel de carácter más comunes en inglés son: [1] [2]

Debido a que los mensajes encriptados enviados por telégrafo a menudo omiten la puntuación y los espacios, el análisis de frecuencia criptográfica de dichos mensajes incluye trigramas que abarcan los límites de las palabras. Esto hace que trigramas como "edt" ocurran con frecuencia, aunque es posible que nunca aparezcan en una sola palabra de esos mensajes. [4]

La oración "el rápido zorro rojo salta sobre el perezoso perro marrón" tiene los siguientes trigramas a nivel de palabra:

Y el trigrama a nivel de palabra "el rojo rápido" tiene los siguientes trigramas a nivel de carácter (donde un guión bajo "_" marca un espacio):