Ataque de cumpleaños

Un ataque de cumpleaños es un tipo de ataque criptográfico que explota las matemáticas detrás del problema de cumpleaños en la teoría de la probabilidad . Este ataque se puede utilizar para abusar de la comunicación entre dos o más partes. El ataque depende de la mayor probabilidad de colisiones encontradas entre los intentos de ataque aleatorios y un grado fijo de permutaciones ( casilleros ). Con un ataque de cumpleaños, es posible encontrar una colisión de una función hash en ${\ textstyle {\ sqrt {2 ^ {n}}} = 2 ^ {n / 2}}$ , con ${\ textstyle 2 ^ {n}}$ siendo la seguridad de resistencia clásica de preimagen . Hay un resultado general (aunque discutido ^[1] ) de que las computadoras cuánticas pueden realizar ataques de cumpleaños, rompiendo así la resistencia a las colisiones, en ${\ textstyle {\ sqrt [{3}] {2 ^ {n}}} = 2 ^ {n / 3}}$ . ^[2]

Entendiendo el problema

Comparación del problema del cumpleaños (1) y el ataque del cumpleaños (2):
En (1), las colisiones se encuentran dentro de un conjunto, en este caso, 3 de 276 emparejamientos de los 24 astronautas lunares.
En (2), las colisiones se encuentran entre dos conjuntos, en este caso, 1 de 256 emparejamientos de solo los primeros bytes de hash SHA-256 de 16 variantes de cada uno de los contratos benignos y maliciosos.

Como ejemplo, considere el escenario en el que un maestro con una clase de 30 estudiantes (n = 30) pide el cumpleaños de todos (para simplificar, ignore los años bisiestos ) para determinar si dos estudiantes tienen el mismo cumpleaños (correspondiente a una colisión hash como se describe más adelante). Intuitivamente, esta posibilidad puede parecer pequeña. Contrariamente a la intuición, la probabilidad de que al menos un estudiante tenga el mismo cumpleaños que cualquier otro estudiante en cualquier día es de alrededor del 70% (para n = 30), de la fórmula ${\ Displaystyle 1 - {\ frac {365!} {(365-n)! \ cdot 365 ^ {n}}}}$ . ^[3]

Si el maestro había elegido un día específico (digamos, 16 de septiembre), entonces la probabilidad de que al menos un estudiante haya nacido en ese día específico es ${\ Displaystyle 1- (364/365) ^ {30}}$ , alrededor del 7,9%.

En un ataque de cumpleaños, el atacante prepara muchas variantes diferentes de contratos benignos y maliciosos, cada uno con una firma digital . Se busca un par de contratos benignos y maliciosos con la misma firma. En este ejemplo ficticio, suponga que la firma digital de una cadena es el primer byte de su hash SHA-256 . El par encontrado se indica en verde; tenga en cuenta que encontrar un par de contratos benignos (azul) o un par de contratos maliciosos (rojo) es inútil. Una vez que la víctima acepta el contrato benigno, el atacante lo sustituye por el malicioso y afirma que la víctima lo firmó, como lo demuestra la firma digital.

Matemáticas

Dada una función ${\ Displaystyle f}$ , el objetivo del ataque es encontrar dos entradas diferentes ${\ Displaystyle x_ {1}, x_ {2}}$ tal que ${\ Displaystyle f (x_ {1}) = f (x_ {2})}$ . Tal par ${\ Displaystyle x_ {1}, x_ {2}}$ se llama colisión. El método utilizado para encontrar una colisión es simplemente evaluar la función ${\ Displaystyle f}$ para diferentes valores de entrada que pueden elegirse aleatoriamente o pseudoaleatoriamente hasta que se encuentre el mismo resultado más de una vez. Debido al problema del cumpleaños, este método puede resultar bastante eficaz. Específicamente, si una función ${\ Displaystyle f (x)}$ produce cualquiera de ${\ Displaystyle H}$ diferentes salidas con igual probabilidad y ${\ Displaystyle H}$ es suficientemente grande, entonces esperamos obtener un par de argumentos diferentes ${\ Displaystyle x_ {1}}$ y ${\ Displaystyle x_ {2}}$ con ${\ Displaystyle f (x_ {1}) = f (x_ {2})}$ después de evaluar la función durante aproximadamente ${\ Displaystyle 1,25 {\ sqrt {H}}}$ diferentes argumentos en promedio.

Consideramos el siguiente experimento. De un conjunto de valores H , elegimos n valores uniformemente al azar, lo que permite repeticiones. Sea p ( n ; H ) la probabilidad de que durante este experimento se elija al menos un valor más de una vez. Esta probabilidad se puede aproximar como

{\ Displaystyle p (n; H) \ approx 1-e ^ {- n (n-1) / (2H)} \ approx 1-e ^ {- n ^ {2} / (2H)}}

^[4]

Sea n ( p ; H ) el menor número de valores que tenemos que elegir, de modo que la probabilidad de encontrar una colisión sea al menos p . Al invertir esta expresión anterior, encontramos la siguiente aproximación

{\ Displaystyle n (p; H) \ approx {\ sqrt {2H \ ln {\ frac {1} {1-p}}}}}

y asignando una probabilidad de colisión de 0.5 llegamos a

{\ Displaystyle n (0.5; H) \ aproximadamente 1.1774 {\ sqrt {H}}}

Sea Q ( H ) el número esperado de valores que tenemos que elegir antes de encontrar la primera colisión. Este número se puede aproximar mediante

{\ Displaystyle Q (H) \ approx {\ sqrt {{\ frac {\ pi} {2}} H}}}

Por ejemplo, si se utiliza un hash de 64 bits, hay aproximadamente 1,8 × 10 ¹⁹ salidas diferentes. Si todos estos son igualmente probables (el mejor de los casos), entonces se necesitarían 'solo' aproximadamente 5 mil millones de intentos (5.38 × 10 ⁹ ) para generar una colisión usando la fuerza bruta. ^[5] Este valor se denomina límite de cumpleaños ^[6] y para códigos de n bits podría calcularse como 2 ^{n / 2} . ^[7] Otros ejemplos son los siguientes:

Bits	Posibles salidas (H)	Probabilidad deseada de colisión aleatoria (2 sf) (p)
Bits	Posibles salidas (H)	10 ⁻¹⁸	10 ^-15	10 ^-12	10 ⁻⁹	10 ⁻⁶	0,1%	1%	25%	50%	75%
dieciséis	2 ¹⁶ (~ 6,5 x 10 ⁴ )	<2	<2	<2	<2	<2	11	36	190	300	430
32	2 ³² (~ 4,3 × 10 ⁹ )	<2	<2	<2	3	93	2900	9300	50.000	77.000	110 000
64	2 ⁶⁴ (~ 1,8 × 10 ¹⁹ )	6	190	6100	190.000	6.100.000	1,9 × 10 ⁸	6,1 × 10 ⁸	3,3 × 10 ⁹	5,1 × 10 ⁹	7,2 × 10 ⁹
128	2 ¹²⁸ (~ 3,4 × 10 ³⁸ )	2,6 × 10 ¹⁰	8.2 × 10 ¹¹	2,6 × 10 ¹³	8,2 × 10 ¹⁴	2,6 × 10 ¹⁶	8,3 × 10 ¹⁷	2,6 × 10 ¹⁸	1,4 × 10 ¹⁹	2,2 × 10 ¹⁹	3,1 × 10 ¹⁹
256	2 ²⁵⁶ (~ 1,2 × 10 ⁷⁷ )	4,8 × 10 ²⁹	1,5 × 10 ³¹	4,8 × 10 ³²	1,5 × 10 ³⁴	4,8 × 10 ³⁵	1,5 × 10 ³⁷	4,8 × 10 ³⁷	2,6 × 10 ³⁸	4.0 × 10 ³⁸	5,7 × 10 ³⁸
384	2 ³⁸⁴ (~ 3,9 × 10 ¹¹⁵ )	8,9 × 10 ⁴⁸	2,8 × 10 ⁵⁰	8,9 × 10 ⁵¹	2,8 × 10 ⁵³	8,9 × 10 ⁵⁴	2,8 × 10 ⁵⁶	8,9 × 10 ⁵⁶	4,8 × 10 ⁵⁷	7,4 × 10 ⁵⁷	1,0 × 10 ⁵⁸
512	2 ⁵¹² (~ 1,3 × 10 ¹⁵⁴ )	1,6 × 10 ⁶⁸	5,2 × 10 ⁶⁹	1,6 × 10 ⁷¹	5,2 × 10 ⁷²	1,6 × 10 ⁷⁴	5,2 × 10 ⁷⁵	1,6 × 10 ⁷⁶	8,8 × 10 ⁷⁶	1,4 × 10 ⁷⁷	1,9 × 10 ⁷⁷

La tabla muestra el número de hashes n ( p ) necesarios para lograr la probabilidad de éxito dada, asumiendo que todos los hashes son igualmente probables. A modo de comparación, 10 ⁻¹⁸a 10 ⁻¹⁵es la tasa de error de bits incorregible de un disco duro típico. ^[8] En teoría, los hash MD5 o UUID , que son de 128 bits, deberían permanecer dentro de ese rango hasta aproximadamente 820 mil millones de documentos, incluso si sus posibles resultados son muchos más.

Es fácil ver que si las salidas de la función se distribuyen de manera desigual, entonces se podría encontrar una colisión aún más rápido. La noción de 'equilibrio' de una función hash cuantifica la resistencia de la función a los ataques de cumpleaños (aprovechando la distribución desigual de claves). Sin embargo, determinar el equilibrio de una función hash normalmente requerirá que se calculen todas las entradas posibles y por lo tanto no es factible funciones hash como las familias MD y SHA. ^[9] La subexpresión ${\ Displaystyle \ ln {\ frac {1} {1-p}}}$ en la ecuación para ${\ Displaystyle n (p; H)}$ no se calcula con precisión para pequeños ${\ Displaystyle p}$ cuando se traduce directamente a lenguajes de programación comunes log(1/(1-p))debido a la pérdida de importancia . Cuando log1pesté disponible (como en C99 ), por ejemplo, se -log1p(-p)debe usar la expresión equivalente en su lugar. ^[10] Si esto no se hace, la primera columna de la tabla anterior se calcula como cero y varios elementos de la segunda columna no tienen ni siquiera un dígito significativo correcto.

Aproximación simple

Una buena regla empírica que se puede utilizar para el cálculo mental es la relación

{\ Displaystyle p (n) \ approx {n ^ {2} \ over 2H}}

que también se puede escribir como

{\ Displaystyle H \ approx {n ^ {2} \ over 2p (n)}}

.

o

{\ Displaystyle n \ approx {\ sqrt {2H \ times p (n)}}}

.

Esto funciona bien para probabilidades menores o iguales a 0.5.

Este esquema de aproximación es especialmente fácil de usar cuando se trabaja con exponentes. Por ejemplo, suponga que está creando hashes de 32 bits ( ${\ Displaystyle H = 2 ^ {32}}$ ) y desea que la probabilidad de una colisión sea como máximo de una en un millón ( ${\ Displaystyle p \ approx 2 ^ {- 20}}$ ), ¿cuántos documentos podríamos tener como máximo?

{\ Displaystyle n \ approx {\ sqrt {2 \ times 2 ^ {32} \ times 2 ^ {- 20}}} = {\ sqrt {2 ^ {1 + 32-20}}} = {\ sqrt {2 ^ {13}}} = 2 ^ {6.5} \ aproximadamente 90.5}

que está cerca de la respuesta correcta de 93.

Susceptibilidad de firma digital

Las firmas digitales pueden ser susceptibles a un ataque de cumpleaños. Un mensaje ${\ Displaystyle m}$ típicamente está firmado por primera computación ${\ Displaystyle f (m)}$ , dónde ${\ Displaystyle f}$ es una función hash criptográfica , y luego usa alguna clave secreta para firmar ${\ Displaystyle f (m)}$ . Supongamos que Mallory quiere engañar a Bob para que firme un contrato fraudulento . Mallory prepara un contrato justo ${\ Displaystyle m}$ y una fraudulenta ${\ Displaystyle m '}$ . Luego encuentra una serie de posiciones donde ${\ Displaystyle m}$ se puede cambiar sin cambiar el significado, como insertar comas, líneas vacías, uno o dos espacios después de una oración, reemplazar sinónimos, etc. Al combinar estos cambios, puede crear una gran cantidad de variaciones en ${\ Displaystyle m}$ que son todos contratos justos.

De manera similar, Mallory también crea una gran cantidad de variaciones en el contrato fraudulento. ${\ Displaystyle m '}$ . Luego aplica la función hash a todas estas variaciones hasta que encuentra una versión del contrato justo y una versión del contrato fraudulento que tienen el mismo valor hash. ${\ Displaystyle f (m) = f (m ')}$ . Ella le presenta la versión justa a Bob para que la firme. Una vez que Bob ha firmado, Mallory toma la firma y la adjunta al contrato fraudulento. Esta firma luego "prueba" que Bob firmó el contrato fraudulento.

Las probabilidades difieren ligeramente del problema de cumpleaños original, ya que Mallory no gana nada al encontrar dos contratos justos o dos fraudulentos con el mismo hash. La estrategia de Mallory es generar pares de un contrato justo y uno fraudulento. Las ecuaciones del problema de cumpleaños se aplican donde ${\ Displaystyle n}$ es el número de pares. El número de hashes que Mallory genera realmente es ${\ Displaystyle 2n}$ .

Para evitar este ataque, la longitud de salida de la función hash utilizada para un esquema de firma se puede elegir lo suficientemente grande como para que el ataque de cumpleaños sea computacionalmente inviable, es decir, aproximadamente el doble de bits de los necesarios para prevenir un ataque ordinario de fuerza bruta .

Además de utilizar una longitud de bits más grande, el firmante (Bob) puede protegerse haciendo algunos cambios aleatorios e inofensivos en el documento antes de firmarlo, y manteniendo una copia del contrato que firmó en su poder, para que al menos pueda demostrar en la corte que su firma coincide con ese contrato, no solo con el fraudulento.

El algoritmo rho de Pollard para logaritmos es un ejemplo de un algoritmo que utiliza un ataque de cumpleaños para el cálculo de logaritmos discretos .

Ver también

Notas

^ Daniel J. Bernstein. "Análisis de costes de las colisiones hash: ¿las computadoras cuánticas harán que SHARCS sea obsoleto?" (PDF) . Cr.yp.to . Consultado el 29 de octubre de 2017 .
^ Brassard, Gilles; HØyer, Peter; Tapp, Alain (20 de abril de 1998). LATIN'98: Informática Teórica . Apuntes de conferencias en Ciencias de la Computación. 1380 . Springer, Berlín, Heidelberg. págs. 163-169. arXiv : quant-ph / 9705002 . doi : 10.1007 / BFb0054319 . ISBN 978-3-540-64275-6. S2CID 118940551 .
^ "Foro de matemáticas: Pregunte al Dr. Math FAQ: El problema del cumpleaños" . Mathforum.org . Consultado el 29 de octubre de 2017 .
^ Gupta, Ganesh (2015). "¿Qué es el ataque de cumpleaños?" . doi : 10.13140 / 2.1.4915.7443 . Cite journal requiere |journal=( ayuda )
^ Flajolet, Philippe; Odlyzko, Andrew M. (1990). Quisquater, Jean-Jacques; Vandewalle, Joos (eds.). "Estadísticas de mapeo aleatorio" . Avances en Criptología - EUROCRYPT '89 . Apuntes de conferencias en Ciencias de la Computación. Berlín, Heidelberg: Springer. 434 : 329–354. doi : 10.1007 / 3-540-46885-4_34 . ISBN 978-3-540-46885-1.
^ Consulte los límites superior e inferior .
^ Jacques Patarin, Audrey Montreuil (2005). "Esquemas de Benes y Butterfly revisitados" ( PostScript , PDF ) . Université de Versailles . Consultado el 15 de marzo de 2007 . Cite journal requiere |journal=( ayuda )
^ Gray, Jim; van Ingen, Catharine (25 de enero de 2007). "Medidas empíricas de las tasas de falla y error de disco". arXiv : cs / 0701166 .
^ "CiteSeerX" . Archivado desde el original el 23 de febrero de 2008 . Consultado el 2 de mayo de 2006 .
^ "Calcule log (1 + x) con precisión para valores pequeños de x" . Mathworks.com . Consultado el 29 de octubre de 2017 .

Referencias

Mihir Bellare , Tadayoshi Kohno: Equilibrio de la función hash y su impacto en los ataques de cumpleaños. EUROCRYPT 2004: págs. 401–418
Criptografía aplicada, 2ª ed. por Bruce Schneier

enlaces externos

"¿Qué es una firma digital y qué es autenticación?" de las preguntas frecuentes sobre criptografía de RSA Security .
Preguntas frecuentes sobre criptografía de "Birthday Attack" X5 Networks

[1] Daniel J. Bernstein. "Análisis de costes de las colisiones hash: ¿las computadoras cuánticas harán que SHARCS sea obsoleto?" (PDF) . Cr.yp.to . Consultado el 29 de octubre de 2017 .

[2] Brassard, Gilles; HØyer, Peter; Tapp, Alain (20 de abril de 1998). LATIN'98: Informática Teórica . Apuntes de conferencias en Ciencias de la Computación. 1380 . Springer, Berlín, Heidelberg. págs. 163-169. arXiv : quant-ph / 9705002 . doi : 10.1007 / BFb0054319 . ISBN 978-3-540-64275-6. S2CID 118940551 .

[3] "Foro de matemáticas: Pregunte al Dr. Math FAQ: El problema del cumpleaños" . Mathforum.org . Consultado el 29 de octubre de 2017 .

[4] Gupta, Ganesh (2015). "¿Qué es el ataque de cumpleaños?" . doi : 10.13140 / 2.1.4915.7443 . Cite journal requiere |journal=( ayuda )

[5] Flajolet, Philippe; Odlyzko, Andrew M. (1990). Quisquater, Jean-Jacques; Vandewalle, Joos (eds.). "Estadísticas de mapeo aleatorio" . Avances en Criptología - EUROCRYPT '89 . Apuntes de conferencias en Ciencias de la Computación. Berlín, Heidelberg: Springer. 434 : 329–354. doi : 10.1007 / 3-540-46885-4_34 . ISBN 978-3-540-46885-1.

[6] Consulte los límites superior e inferior .

[7] Jacques Patarin, Audrey Montreuil (2005). "Esquemas de Benes y Butterfly revisitados" ( PostScript , PDF ) . Université de Versailles . Consultado el 15 de marzo de 2007 . Cite journal requiere |journal=( ayuda )

[8] Gray, Jim; van Ingen, Catharine (25 de enero de 2007). "Medidas empíricas de las tasas de falla y error de disco". arXiv : cs / 0701166 .

[9] "CiteSeerX" . Archivado desde el original el 23 de febrero de 2008 . Consultado el 2 de mayo de 2006 .

[10] "Calcule log (1 + x) con precisión para valores pequeños de x" . Mathworks.com . Consultado el 29 de octubre de 2017 .

[1]