En criptoanálisis , el análisis de contacto es el estudio de la frecuencia con la que ciertos símbolos preceden o siguen a otros símbolos. El método se utiliza como ayuda para descifrar cifrados clásicos .
El análisis de contacto se basa en el hecho de que, en cualquier muestra de cualquier lenguaje escrito, ciertos símbolos aparecen junto a otros símbolos con frecuencias variables. Además, estas frecuencias son aproximadamente las mismas para casi todas las muestras de ese idioma, incluso cuando la distribución de los símbolos en sí difiere significativamente de la normal. Esto es cierto independientemente de si los símbolos que se utilizan son palabras o letras.
En algunos cifrados, estas propiedades del texto sin formato del lenguaje natural se conservan en el texto cifrado y tienen el potencial de ser explotadas en un ataque de solo texto cifrado .
Aunque en cierto sentido el análisis de contacto puede considerarse un tipo de análisis de frecuencia , la mayoría de las discusiones sobre el análisis de frecuencia se refieren a las probabilidades simples de los símbolos en el texto: o
El análisis de contacto se basa en la probabilidad condicional de que ciertas letras precedan o sucedan a otras letras:, o , o incluso , dónde y son subconjuntos del alfabeto que se está utilizando.
Cuando el análisis de frecuencia se basa en estadísticas de primer orden, el análisis de contactos se basa en estadísticas de segundo o tercer orden.