Los trigramas son un caso especial del n -grama , donde n es 3. A menudo se utilizan en el procesamiento del lenguaje natural para realizar análisis estadísticos de textos y en criptografía para el control y uso de cifrados y códigos .
Frecuencia
El contexto es muy importante, las diferentes clasificaciones y porcentajes de análisis se derivan fácilmente extrayendo muestras de diferentes tamaños, diferentes autores; o diferentes tipos de documentos: poesía, ciencia ficción, documentación tecnológica; y niveles de escritura: cuentos para niños versus adultos, órdenes militares y recetas.
El análisis de frecuencia criptoanalítico típico encuentra que los 16 trigramas a nivel de carácter más comunes en inglés son: [1] [2]
Rango [1] | Trigrama | Frecuencia [3] (fuente diferente) |
---|---|---|
1 | la | 1,81% |
2 | y | 0,73% |
3 | eso | 0,33% |
4 | ent | 0,42% |
5 | En g | 0,72% |
6 | ion | 0,42% |
7 | tio | 0,31% |
8 | por | 0,34% |
9 | nde | |
10 | posee | |
11 | nce | |
12 | EDT | |
13 | es | |
14 | a menudo | 0,22% |
15 | algo | 0,21% |
dieciséis | hombres |
Debido a que los mensajes cifrados enviados por telégrafo a menudo omiten la puntuación y los espacios, el análisis de frecuencia criptográfica de dichos mensajes incluye trigramas que abarcan los límites de las palabras. Esto hace que trigramas como "edt" se produzcan con frecuencia, aunque es posible que nunca aparezcan en una sola palabra de esos mensajes. [4]
Ejemplos de
La oración "el rápido zorro rojo salta sobre el perezoso perro marrón" tiene los siguientes trigramas a nivel de palabra:
el rojo rápidozorro rojo rápidosaltos de zorro rojozorro saltasalta sobre elsobre los perezososel perezoso marrónperro marrón perezoso
Y el trigrama a nivel de palabra "el rojo rápido" tiene los siguientes trigramas a nivel de carácter (donde un guión bajo "_" marca un espacio):
laél_e_q_ququiuicickck_k_r_rerojo
Referencias
- ↑ a b Lewand, Robert (2000). Matemáticas criptológicas . La Asociación Matemática de América . pag. 37. ISBN 978-0-88385-719-9.
- ^ Linton, Tom (2001). "Frecuencias relativas de letras en texto sin formato en inglés general" . Colegio Central . Criptografía (Spring ed.). Archivado desde el original el 22 de enero de 2007.
- ^ "Frecuencias de letras inglesas" . Criptografía práctica .
- ^ "Búsqueda por voz SEO" . Fuelonline .