El problema de Simon

En la teoría de la complejidad computacional y la computación cuántica , el problema de Simon es un problema computacional que se ha demostrado que se resuelve exponencialmente más rápido en una computadora cuántica que en una computadora clásica (es decir, tradicional). El algoritmo cuántico que resuelve el problema de Simon, generalmente llamado algoritmo de Simon , sirvió de inspiración para el algoritmo de Shor . ^[1] Ambos problemas son casos especiales del problema del subgrupo oculto abeliano , que ahora se sabe que tiene algoritmos cuánticos eficientes.

El problema se establece en el modelo de complejidad del árbol de decisión o complejidad de la consulta y fue concebido por Daniel Simon en 1994. ^[2] Simon exhibió un algoritmo cuántico que resuelve el problema de Simon exponencialmente más rápido y con exponencialmente menos consultas que el mejor probabilístico (o determinista) algoritmo clásico. En particular, el algoritmo de Simon utiliza un número lineal de consultas y cualquier algoritmo probabilístico clásico debe utilizar un número exponencial de consultas.

Este problema produce una separación de oráculo entre las clases de complejidad BPP (complejidad de consulta clásica de error acotado) y BQP (complejidad de consulta cuántica de error acotado). ^[3] Esta es la misma separación que logra el algoritmo de Bernstein-Vazirani , y diferente de la separación proporcionada por el algoritmo Deutsch-Jozsa , que separa P y EQP . A diferencia del algoritmo de Bernstein-Vazirani , la separación del algoritmo de Simon es exponencial .

Debido a que este problema asume la existencia de un oráculo de "caja negra" altamente estructurado para lograr su aceleración, este problema tiene poco valor práctico. ^[4] Sin embargo, sin tal oráculo, las aceleraciones exponenciales no se pueden probar fácilmente, ya que esto probaría que P es diferente a PSPACE .

Descripción del problema

Dada una función (implementada por una caja negra u oráculo) ${\ Displaystyle f: \ {0,1 \} ^ {n} \ rightarrow \ {0,1 \} ^ {n}}$ con la promesa de que, por algún desconocido ${\ Displaystyle s \ in \ {0,1 \} ^ {n}}$ , para todos ${\ Displaystyle x, y \ in \ {0,1 \} ^ {n}}$ ,

{\ Displaystyle f (x) = f (y)}

si y solo si

{\ Displaystyle x \ oplus y \ in \ {0 ^ {n}, s \}}

,

El objetivo es identificar s haciendo la menor cantidad posible de consultas af (x) .

Otro enunciado común de este problema es el de distinguir ${\ Displaystyle s = 0 ^ {n}}$ caso, donde la función es uno a uno, desde el ${\ Displaystyle s \ neq 0 ^ {n}}$ caso, donde la función es dos a uno y satisface ${\ Displaystyle f (x) = f (x \ oplus s)}$ .

Ejemplo

Por ejemplo, si ${\ Displaystyle n = 3}$ , entonces la siguiente función es un ejemplo de una función que satisface la propiedad requerida y recién mencionada:

${\ Displaystyle x}$	${\ Displaystyle f (x)}$
000	101
001	010
010	000
011	110
100	000
101	110
110	101
111	010

En este caso, ${\ Displaystyle s = 110}$ (es decir, la solución). Se puede verificar fácilmente que cada salida de ${\ Displaystyle f}$ ocurre dos veces, y las dos cadenas de entrada correspondientes a cualquier salida dada tienen XOR bit a bit igual a ${\ Displaystyle s = 110}$ .

Por ejemplo, las cadenas de entrada ${\ displaystyle 010}$ y ${\ displaystyle 100}$ ambos están mapeados (por ${\ Displaystyle f}$ ) a la misma cadena de salida ${\ displaystyle 000}$ . ${\ displaystyle {\ displaystyle f (010) = 000}}$ y ${\ displaystyle {\ displaystyle f (100) = 000}}$ . Si aplicamos XOR a 010 y 100 obtenemos 110, es decir ${\ displaystyle {\ displaystyle 010 \ oplus 100 = 110 = s}.}$ ${\ Displaystyle s = 110}$ también se puede verificar usando cadenas de entrada 001 y 111 que están mapeadas (por f) a la misma cadena de salida 010. Si aplicamos XOR a 001 y 111, obtenemos 110, es decir ${\ Displaystyle 001 \ oplus 111 = 110 = s}$ . Esto da la misma solución ${\ Displaystyle s = 110}$ resolvimos antes.

En este ejemplo, la función f es de hecho una función de dos a uno donde ${\ Displaystyle {\ Displaystyle s \ neq 0 ^ {n}}}$ .

Para una función uno a uno, ${\ Displaystyle f (x) = f (y)}$ tal que ${\ displaystyle f (1) = 1, f (2) = 2, f (3) = 3, {\ text {y así sucesivamente}}.}$

Dureza del problema

Intuitivamente, este es un problema muy difícil de resolver de una manera "clásica", incluso si se usa la aleatoriedad y se acepta una pequeña probabilidad de error. La intuición detrás de la dureza es razonablemente simple: si desea resolver el problema de manera clásica, necesita encontrar dos entradas diferentes ${\ Displaystyle x}$ y ${\ Displaystyle y}$ para cual ${\ Displaystyle f (x) = f (y)}$ . No hay necesariamente ninguna estructura en la función ${\ Displaystyle f}$ que nos ayudaría a encontrar dos de estas entradas: más específicamente, podemos descubrir algo sobre ${\ Displaystyle f}$ (o lo que hace) solo cuando, para dos entradas diferentes, obtenemos la misma salida. En cualquier caso, tendríamos que adivinar ${\ Displaystyle {\ Displaystyle \ Omega ({\ sqrt {2 ^ {n}}})}}$ diferentes entradas antes de que sea probable encontrar un par en el que ${\ Displaystyle f}$ toma la misma salida, según el problema de cumpleaños . Dado que, clásicamente, para encontrar s con un 100% de certeza, sería necesario verificar hasta ${\ Displaystyle 2 ^ {n-1} +1}$ entradas, el problema de Simon busca encontrar s usando menos consultas que este método clásico.

Descripción general del algoritmo de Simon

Ocurrencia

La idea de alto nivel detrás del algoritmo de Simon es "sondear" (o "muestrear") un circuito cuántico (ver la imagen a continuación) "suficientes veces" para encontrar ${\ Displaystyle n-1}$ ( linealmente independientes ) cadenas de n bits, es decir

{\ Displaystyle y_ {1}, y_ {2}, \ dots, y_ {n-1} \ in \ {0,1 \} ^ {n},}

tal que se satisfagan las siguientes ecuaciones

{\ Displaystyle \ left \ {{\ begin {alineado} y_ {1} \ cdot s & = 0 \\ y_ {2} \ cdot s & = 0 \\ & \, \, \, \ vdots \\ y_ {n- 1} \ cdot s & = 0 \ end {alineado}} \ right.}

dónde ${\ Displaystyle y_ {i} \ cdot s}$ es el módulo-2 producto de punto ; es decir, ${\ Displaystyle y_ {i} \ cdot s = y_ {i1} s_ {1} \ oplus y_ {i2} s_ {2} \ oplus \ dots \ oplus y_ {in} s_ {n}}$ , y ${\ Displaystyle y_ {ij}, s_ {j} \ in \ {0,1 \}}$ , por ${\ Displaystyle i = 1, \ dots, n-1}$ y para ${\ Displaystyle j = 1, \ dots, n}$ .

Entonces, este sistema lineal contiene ${\ Displaystyle n-1}$ ecuaciones lineales en ${\ Displaystyle n}$ incógnitas (es decir, las partes de ${\ Displaystyle s \ in \ {0,1 \} ^ {n}}$ ), y el objetivo es resolverlo para obtener ${\ Displaystyle s}$ , y ${\ Displaystyle s}$ es fijo para una función dada ${\ Displaystyle f}$ . No siempre existe una solución (única).

Circuito cuántico de Simon

Circuito cuántico que representa / implementa el algoritmo de Simon

El circuito cuántico (vea la imagen) es la implementación (y visualización) de la parte cuántica del algoritmo de Simon.

Primero se prepara un estado cuántico de todos ceros (esto se puede hacer fácilmente). El estado ${\ Displaystyle | 0 \ rangle}$ representa ${\ Displaystyle | 0 ^ {n} \ rangle}$ dónde ${\ Displaystyle n}$ es el número de qubits. Luego, la mitad de este estado se transforma mediante una transformación de Hadamard. A continuación, el resultado se introduce en un oráculo (o "caja negra"), que sabe cómo calcular ${\ Displaystyle f}$ . Dónde ${\ Displaystyle U_ {f}}$ actúa sobre los dos registros como ${\ Displaystyle | x \ rangle | 0 ^ {n} \ rangle \ rightarrow | x \ rangle | f (x) \ rangle}$ . Después de eso, parte de la salida producida por el oráculo se transforma utilizando otra transformación de Hadamard. Finalmente, se realiza una medición del estado cuántico global resultante. Es durante esta medición que recuperamos las cadenas de n bits, ${\ Displaystyle y_ {1}, y_ {2}, \ dots, y_ {n-1} \ in \ {0,1 \} ^ {n}}$ , mencionado en la subsección anterior.

El algoritmo de Simon se puede considerar como un algoritmo iterativo (que hace uso de un circuito cuántico) seguido de un algoritmo (posiblemente) clásico para encontrar la solución a un sistema lineal de ecuaciones.

Algoritmo de Simon

En esta sección, se explica cada parte del algoritmo de Simon (en detalle). Puede ser útil mirar la imagen del circuito cuántico de Simon anterior mientras lee cada una de las siguientes subsecciones.

Aporte

El algoritmo de Simon comienza con la entrada ${\ Displaystyle | 0 ^ {n} \ rangle \ otimes | 0 ^ {n} \ rangle = | 0 ^ {n} \ rangle | 0 ^ {n} \ rangle}$ , dónde ${\ Displaystyle | 0 ^ {n} \ rangle}$ es el estado cuántico con ${\ Displaystyle n}$ ceros.

(El símbolo ${\ Displaystyle \ otimes}$ es el símbolo típico utilizado para representar el producto tensorial . Para no saturar la notación, el símbolo ${\ Displaystyle \ otimes}$ a veces se omite: por ejemplo, en la oración anterior, ${\ Displaystyle | 0 ^ {n} \ rangle \ otimes | 0 ^ {n} \ rangle}$ es equivalente a ${\ Displaystyle | 0 ^ {n} \ rangle | 0 ^ {n} \ rangle}$ . En este artículo, se utiliza (a menudo) para eliminar la ambigüedad o para evitar confusiones).

Ejemplo

Entonces, por ejemplo, si ${\ Displaystyle n = 2}$ , entonces la entrada inicial es

{\ Displaystyle | 0 ^ {2} \ rangle \ otimes | 0 ^ {2} \ rangle = | 00 \ rangle \ otimes | 00 \ rangle = (| 0 \ rangle \ otimes | 0 \ rangle) \ otimes (| 0 \ rangle \ otimes | 0 \ rangle) = | 0 \ rangle \ otimes | 0 \ rangle \ otimes | 0 \ rangle \ otimes | 0 \ rangle = | 0000 \ rangle = | 0 ^ {4} \ rangle = | 0 ^ {2n} \ rangle}

.

Primera transformación de Hadamard

Después de eso, la entrada (como se describe en la subsección anterior) se transforma utilizando una transformación de Hadamard . Específicamente, la transformación de Hadamard ${\ Displaystyle H ^ {\ otimes n}}$ (el producto tensorial también se puede aplicar a matrices) se aplica a la primera ${\ Displaystyle n}$ qubits, es decir, al estado "parcial" ${\ Displaystyle | 0 ^ {n} \ rangle}$ , de modo que el estado compuesto después de esta operación es

{\ Displaystyle | \ Psi \ rangle = \ left (H ^ {\ otimes n} | 0 ^ {n} \ rangle \ right) \ otimes | 0 ^ {n} \ rangle = \ left (\ sum _ {x \ en \ {0,1 \} ^ {n}} {\ frac {1} {\ sqrt {2 ^ {n}}}} \ left | x \ right \ rangle \ right) \ otimes \ left | 0 ^ { n} \ right \ rangle = \ left ({\ frac {1} {\ sqrt {2 ^ {n}}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left | x \ right \ rangle \ right) \ otimes \ left | 0 ^ {n} \ right \ rangle = {\ frac {1} {2 ^ {\ frac {n} {2}}}} \ sum _ {x \ en \ {0,1 \} ^ {n}} \ left (\ left | x \ right \ rangle \ otimes \ left | 0 ^ {n} \ right \ rangle \ right)}

dónde ${\ Displaystyle x \ in \ {0,1 \} ^ {n}}$ denota cualquier cadena de n bits (es decir, la suma es sobre cualquier cadena de n bits). El termino ${\ Displaystyle {\ frac {1} {\ sqrt {2 ^ {n}}}}}$ se puede factorizar fuera de la suma porque no depende de ${\ Displaystyle x}$ (es decir, es una constante con respecto a ${\ Displaystyle x}$ ), y ${\ Displaystyle {\ frac {1} {\ sqrt {2 ^ {n}}}} = {\ frac {1} {2 ^ {\ frac {n} {2}}}}}$ .

Ejemplo

Supongamos (de nuevo) ${\ Displaystyle n = 2}$ , entonces la entrada es ${\ Displaystyle | 0000 \ rangle}$ y la transformación de Hadamard ${\ Displaystyle H ^ {\ otimes 2}}$ es

{\ displaystyle H ^ {\ otimes 2} = {\ frac {1} {\ sqrt {2}}} {\ begin {bmatrix} 1 & 1 \\ 1 & -1 \ end {bmatrix}} \ otimes {\ frac {1 } {\ sqrt {2}}} {\ begin {bmatrix} 1 & 1 \\ 1 & -1 \ end {bmatrix}} = {\ frac {1} {\ sqrt {2}}} {\ begin {bmatrix} {\ frac {1} {\ sqrt {2}}} {\ begin {bmatrix} 1 & 1 \\ 1 & -1 \ end {bmatrix}} & {\ frac {1} {\ sqrt {2}}} {\ begin {bmatrix } 1 & 1 \\ 1 & -1 \ end {bmatrix}} \\ {\ frac {1} {\ sqrt {2}}} {\ begin {bmatrix} 1 & 1 \\ 1 & -1 \ end {bmatrix}} & - \ izquierda ({\ frac {1} {\ sqrt {2}}} {\ begin {bmatrix} 1 & 1 \\ 1 & -1 \ end {bmatrix}} \ right) \ end {bmatrix}} = {\ frac {1} {2}} {\ begin {bmatrix} 1 & 1 & 1 & 1 \\ 1 & -1 & 1 & -1 \\ 1 & 1 & -1 & -1 \\ 1 & -1 & -1 & 1 \ end {bmatrix}}}

Si ahora aplicamos ${\ Displaystyle H ^ {\ otimes 2}}$ al primero ${\ Displaystyle | 00 \ rangle}$ , es decir, al estado

{\ displaystyle | 00 \ rangle = {\ begin {bmatrix} 1 \\ 0 \\ 0 \\ 0 \ end {bmatrix}}}

obtenemos

{\ displaystyle {\ begin {align} H ^ {\ otimes 2} | 00 \ rangle & = {\ frac {1} {2}} {\ begin {bmatrix} 1 & 1 & 1 & 1 \\ 1 & -1 & 1 & -1 \\ 1 & 1 & - 1 & -1 \\ 1 & -1 & -1 & 1 \ end {bmatrix}} {\ begin {bmatrix} 1 \\ 0 \\ 0 \\ 0 \ end {bmatrix}} = {\ frac {1} {2}} { \ begin {bmatrix} 1 \\ 1 \\ 1 \\ 1 \ end {bmatrix}} \\ [6pt] & = {\ frac {1} {2}} \ left ({\ begin {bmatrix} 1 \\ 0 \\ 0 \\ 0 \ end {bmatrix}} + {\ begin {bmatrix} 0 \\ 1 \\ 0 \\ 0 \ end {bmatrix}} + {\ begin {bmatrix} 0 \\ 0 \\ 1 \\ 0 \ end {bmatrix}} + {\ begin {bmatrix} 0 \\ 0 \\ 0 \\ 1 \ end {bmatrix}} \ right) = {\ frac {1} {2}} \ left (| 00 \ rangle + | 01 \ rangle + | 10 \ rangle + | 11 \ rangle \ right) = {\ frac {1} {2 ^ {2/2}}} \ sum _ {x \ in \ {0,1 \} ^ {2}} \ left | x \ right \ rangle \ end {alineado}}}

Para obtener el estado cuántico compuesto final, ahora podemos tensor del producto ${\ Displaystyle H ^ {\ otimes 2} | 00 \ rangle}$ con ${\ Displaystyle | 00 \ rangle}$ , es decir

{\ displaystyle {\ begin {alineado} \ left (H ^ {\ otimes 2} | 00 \ rangle \ right) \ otimes | 00 \ rangle & = \ left ({\ frac {1} {2}} \ sum _ {x \ in \ {0,1 \} ^ {2}} \ left | x \ right \ rangle \ right) \ otimes | 00 \ rangle = {\ frac {1} {2}} \ left (| 00 \ rangle + | 01 \ rangle + | 10 \ rangle + | 11 \ rangle \ right) \ otimes | 00 \ rangle \\ [6pt] & = {\ frac {1} {2}} \ left (| 00 \ rangle \ veces | 00 \ rangle + | 01 \ rangle \ otimes | 00 \ rangle + | 10 \ rangle \ otimes | 00 \ rangle + | 11 \ rangle \ otimes | 00 \ rangle \ right) = {\ frac {1} {2 }} \ sum _ {x \ in \ {0,1 \} ^ {2}} \ left (\ left | x \ right \ rangle \ otimes | 00 \ rangle \ right). \ end {alineado}}}

Oráculo

Luego llamamos al oráculo o caja negra ( ${\ Displaystyle U_ {f}}$ en la imagen de arriba) para calcular la función ${\ Displaystyle f}$ en la entrada transformada ${\ Displaystyle | \ Psi \ rangle = {\ frac {1} {2 ^ {n / 2}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left (\ left | x \ right \ rangle \ otimes \ left | 0 ^ {n} \ right \ rangle \ right)}$ , para obtener el estado

{\ Displaystyle | \ Psi \ rangle '= {\ frac {1} {2 ^ {n / 2}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left (\ left | x \ right \ rangle \ otimes \ left | f (x) \ right \ rangle \ right)}

Segunda transformación de Hadamard

Luego aplicamos la transformada de Hadamard ${\ Displaystyle H ^ {\ otimes n}}$ a los estados de la primera ${\ Displaystyle n}$ qubits del estado ${\ Displaystyle | \ Psi \ rangle '}$ , para obtener

{\ Displaystyle {\ begin {alineado} | \ Psi \ rangle '' & = {\ frac {1} {2 ^ {n / 2}}} \ sum _ {x \ in \ {0,1 \} ^ { n}} \ left (\ left (H ^ {\ otimes n} \ left | x \ right \ rangle \ right) \ otimes \ left | f (x) \ right \ rangle \ right) \\ [4pt] & = {\ frac {1} {2 ^ {n / 2}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left (\ left ({\ frac {1} {2 ^ {n / 2}}} \ sum _ {y \ in \ {0,1 \} ^ {n}} (- 1) ^ {x \ cdot y} \ left | y \ right \ rangle \ right) \ otimes \ left | f (x) \ right \ rangle \ right) = {\ frac {1} {2 ^ {n}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left (\ sum _ {y \ in \ {0,1 \} ^ {n}} \ left ((- 1) ^ {x \ cdot y} \ left | y \ right \ rangle \ otimes \ left | f (x ) \ right \ rangle \ right) \ right) \ end {alineado}}}

dónde ${\ Displaystyle (-1) ^ {x \ cdot y}}$ puede ser ${\ Displaystyle -1}$ o ${\ Displaystyle 1}$ , Dependiendo de ${\ Displaystyle x \ cdot y = x_ {1} y_ {1} + \ dots + x_ {n} y_ {n}}$ , dónde ${\ Displaystyle x_ {i}, y_ {i} \ in \ {0,1 \}}$ , por ${\ Displaystyle i = 1, \ dots, n}$ . Entonces, por ejemplo, si ${\ Displaystyle x = 101}$ y ${\ Displaystyle y = 111}$ , luego ${\ Displaystyle x \ cdot y = 1 * 1 + 0 * 1 + 1 * 1 = 2}$ , que es un número par. Así, en este caso, ${\ displaystyle (-1) ^ {x \ cdot y} = (- 1) ^ {1 * 1 + 0 * 1 + 1 * 1} = (- 1) ^ {2} = 1}$ , y ${\ Displaystyle {x \ cdot y}}$ es siempre un número no negativo.

La intuición detrás de esta transformación inversa de Hadamard que se aplica aquí se puede encontrar en las notas de clase de CMU

Reescribamos ahora

{\ Displaystyle | \ Psi \ rangle '' = {\ frac {1} {2 ^ {n}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left (\ sum _ {y \ in \ {0,1 \} ^ {n}} \ left ((- 1) ^ {x \ cdot y} \ left | y \ right \ rangle \ otimes \ left | f (x) \ right \ rangle \ right) \ right)}

como sigue

{\ Displaystyle | \ Psi \ rangle '' = \ sum _ {y \ in \ {0,1 \} ^ {n}} \ left (\ left | y \ right \ rangle \ otimes \ left ({\ frac { 1} {2 ^ {n}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left ((- 1) ^ {x \ cdot y} \ left | f (x) \ right \ rangle \ right) \ right) \ right)}

Esta manipulación será conveniente para comprender las explicaciones en los siguientes apartados. El orden de las sumas se ha invertido.

Medición

Después de haber realizado todas las operaciones descritas anteriormente, al final del circuito se realiza una medición .

Ahora hay dos casos posibles que debemos considerar por separado

${\ Displaystyle x \ oplus y = 0 ^ {n}}$ o
${\ Displaystyle x \ oplus y = s}$ , dónde ${\ Displaystyle s \ neq 0 ^ {n}}$ .

Primer caso

Primero analicemos el caso (especial) ${\ Displaystyle x \ oplus y = 0 ^ {n}}$ , Lo que significa que ${\ Displaystyle f}$ es (por requisito) una función uno a uno (como se explicó anteriormente en la "descripción del problema").

Tengamos en cuenta que el estado cuántico antes de la medición es

{\ Displaystyle \ sum _ {y \ in \ {0,1 \} ^ {n}} \ left | y \ right \ rangle \ otimes \ left ({\ frac {1} {2 ^ {n}}} \ suma _ {x \ in \ {0,1 \} ^ {n}} \ left ((- 1) ^ {x \ cdot y} \ left | f (x) \ right \ rangle \ right) \ right)}

Ahora, la probabilidad de que la medición dé como resultado cada cadena ${\ Displaystyle y \ in \ {0,1 \} ^ {n}}$ es

{\ Displaystyle p_ {y} = {{\ Bigg \ |} {\ frac {1} {2 ^ {n}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left ((-1) ^ {x \ cdot y} \ left | f (x) \ right \ rangle \ right) {\ Bigg \ |}} ^ {2} = {\ frac {1} {2 ^ {n} }}}

Esto se sigue de

{\ Displaystyle {{\ Bigg \ |} {\ frac {1} {2 ^ {n}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left ((- 1) ^ {x \ cdot y} \ left | f (x) \ right \ rangle \ right) {\ Bigg \ |}} ^ {2} = {{\ Bigg \ |} {\ frac {1} {2 ^ { n}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left ((- 1) ^ {x \ cdot y} \ left | x \ right \ rangle \ right) {\ Bigg \ |}} ^ {2}}

porque los dos vectores solo difieren en el orden de sus entradas, dado que ${\ Displaystyle f}$ es uno a uno .

El valor del lado derecho, es decir

{\ Displaystyle {{\ Bigg \ |} {\ frac {1} {2 ^ {n}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left ((- 1) ^ {x \ cdot y} \ left | x \ right \ rangle \ right) {\ Bigg \ |}} ^ {2}}

se ve más fácilmente como ${\ Displaystyle {\ frac {1} {2 ^ {n}}}}$ .

Por lo tanto, cuando ${\ Displaystyle x \ oplus y = 0 ^ {n}}$ , el resultado es simplemente una distribución uniforme ${\ Displaystyle n}$ -cadena de bits.

Segundo caso

Analicemos ahora el caso ${\ Displaystyle x \ oplus y = s}$ , dónde ${\ Displaystyle s \ neq 0 ^ {n}}$ . En este caso, ${\ Displaystyle f}$ es una función de dos a uno, es decir, hay dos entradas que se asignan a la misma salida de ${\ Displaystyle f}$ .

El análisis realizado en el primer caso sigue siendo válido para este segundo caso, es decir, la probabilidad de medir cualquier cadena dada. ${\ Displaystyle y \ in \ {0,1 \} ^ {n}}$ todavía se puede representar como

{\ Displaystyle p_ {y} = {{\ Bigg \ |} {\ frac {1} {2 ^ {n}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left ((-1) ^ {x \ cdot y} \ left | f (x) \ right \ rangle \ right) {\ Bigg \ |}} ^ {2}}

Sin embargo, en este segundo caso, todavía tenemos que averiguar cuál es este valor de ${\ Displaystyle p_ {y}}$ es. Veamos por qué en las siguientes explicaciones.

Dejar ${\ Displaystyle A = f (\ {0,1 \} ^ {n})}$ , la imagen de ${\ Displaystyle f}$ . Dejar ${\ Displaystyle z \ in A}$ (es decir ${\ Displaystyle z}$ es una salida de la función ${\ Displaystyle f}$ ), luego para cada ${\ Displaystyle x_ {1} \ in \ {0,1 \} ^ {n}}$ , hay uno (y solo uno) ${\ Displaystyle x_ {2} \ in \ {0,1 \} ^ {n}}$ , tal que ${\ Displaystyle f (x_ {1}) = f (x_ {2}) = z}$ ; además, también tenemos ${\ Displaystyle x_ {1} \ oplus x_ {2} = s}$ , que es equivalente a ${\ Displaystyle x_ {2} = s \ oplus x_ {1}}$ (consulte la sección "descripción del problema" anterior para una revisión de este concepto).

Por lo tanto, tenemos

{\ Displaystyle p_ {y} = {{\ Bigg \ |} {\ frac {1} {2 ^ {n}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left ((-1) ^ {x \ cdot y} \ left | f (x) \ right \ rangle \ right) {\ Bigg \ |}} ^ {2} = {{\ Bigg \ |} {\ frac {1 } {2 ^ {n}}} \ sum _ {z \ in A} \ left (((- 1) ^ {x_ {1} \ cdot y} + (- 1) ^ {x_ {2} \ cdot y }) \ izquierda | z \ derecha \ rangle \ derecha) {\ Bigg \ |}} ^ {2}}

Dado que ${\ Displaystyle x_ {2} = s \ oplus x_ {1}}$ , entonces podemos reescribir el coeficiente ${\ Displaystyle (-1) ^ {x_ {1} \ cdot y} + (- 1) ^ {x_ {2} \ cdot y}}$ como sigue

{\ Displaystyle (-1) ^ {x_ {1} \ cdot y} + (- 1) ^ {x_ {2} \ cdot y} = (- 1) ^ {x_ {1} \ cdot y} + (- 1) ^ {(x_ {1} \ oplus s) \ cdot y}}

Dado que ${\ Displaystyle (x_ {1} \ oplus s) \ cdot y = (x_ {1} \ cdot y) \ oplus (s \ cdot y)}$ , luego podemos escribir la expresión anterior como

{\ Displaystyle (-1) ^ {x_ {1} \ cdot y} (1 + (- 1) ^ {y \ cdot s})}

Entonces, ${\ Displaystyle p_ {y}}$ además se puede escribir como

{\ Displaystyle p_ {y} = {{\ Bigg \ |} {\ frac {1} {2 ^ {n}}} \ sum _ {z \ in A} \ left ((- 1) ^ {x_ {1 } \ cdot y} (1 + (- 1) ^ {y \ cdot s}) \ izquierda | z \ derecha \ rangle \ derecha) {\ Bigg \ |}} ^ {2}}

Número impar

Ahora si ${\ Displaystyle y \ cdot s = y_ {1} s_ {1} + \ dots + y_ {n} s_ {n}}$ es un número impar, entonces ${\ Displaystyle (-1) ^ {y \ cdot s} = - 1}$ . En ese caso,

{\ Displaystyle (-1) ^ {x_ {1} \ cdot y} (1 + (- 1) ^ {y \ cdot s}) = (- 1) ^ {x_ {1} \ cdot y} (1- 1) = 0}

En consecuencia, tenemos

{\ Displaystyle p_ {y} = {{\ Bigg \ |} {\ frac {1} {2 ^ {n}}} \ sum _ {z \ in A} \ left ((- 1) ^ {x_ {1 } \ cdot y} (1 + (- 1) ^ {y \ cdot s}) \ izquierda | z \ derecha \ rangle \ derecha) {\ Bigg \ |}} ^ {2} = 0}

Dado que ${\ Displaystyle p_ {y} = 0}$ , entonces nunca tendremos este caso, es decir, sin cadena ${\ Displaystyle y \ in \ {0,1 \} ^ {n}}$ se ve (después de la medición) en este caso.

(Este es el caso en el que tenemos una interferencia destructiva ).

Número par

Si, en cambio, ${\ Displaystyle y \ cdot s}$ es un número par (por ejemplo, cero), entonces ${\ Displaystyle (-1) ^ {y \ cdot s} = 1}$ . En ese caso,

{\ Displaystyle (-1) ^ {x_ {1} \ cdot y} (1 + (- 1) ^ {y \ cdot s}) = (- 1) ^ {x_ {1} \ cdot y} 2}

Entonces tenemos

{\ Displaystyle p_ {y} = {{\ Bigg \ |} {\ frac {1} {2 ^ {n}}} \ sum _ {z \ in A} \ left ((- 1) ^ {x_ {1 } \ cdot y} (2) \ left | z \ right \ rangle \ right) {\ Bigg \ |}} ^ {2} = {{\ Bigg \ |} {\ frac {2} {2 ^ {n} }} \ sum _ {z \ in A} \ left ((- 1) ^ {x_ {1} \ cdot y} \ left | z \ right \ rangle \ right) {\ Bigg \ |}} ^ {2} = {{\ Bigg \ |} {\ frac {1} {2 ^ {n-1}}} \ sum _ {z \ in A} \ left ((- 1) ^ {x_ {1} \ cdot y} \ left | z \ right \ rangle \ right) {\ Bigg \ |}} ^ {2}}

Es el caso de la interferencia constructiva ,

${\ displaystyle {\ frac {2} {2 ^ {n}}} = 2 * 2 ^ {- n} = 2 ^ {1} * 2 ^ {- n} = 2 ^ {- n + 1} = 2 ^ {- (n-1)} = {\ frac {1} {2 ^ {n-1}}}}$ . Entonces, en resumen, para este segundo caso, tenemos las siguientes probabilidades

${\ Displaystyle p_ {y} = {{\ Bigg \ |} {\ frac {1} {2 ^ {n}}} \ sum _ {x \ in \ {0,1 \} ^ {n}} \ left ((-1) ^ {x \ cdot y} \ left | f (x) \ right \ rangle \ right) {\ Bigg \ |}} ^ {2} = {\ begin {cases} {\ frac {1} {2 ^ {n-1}}} & \ quad {\ text {if}} y \ cdot s {\ text {es par}} \\ 0 & \ quad {\ text {if}} y \ cdot s {\ texto {es extraño}} \\\ end {casos}}}$

Postprocesamiento clásico

Cuando ejecutamos el circuito (operaciones) anterior, hay dos casos:

en el caso (especial) donde ${\ Displaystyle x \ oplus y = 0 ^ {n}}$ (es decir ${\ Displaystyle s = 0 ^ {n}}$ ), los resultados de la medición en cada cadena ${\ Displaystyle y \ in \ {0,1 \} ^ {n}}$ con probabilidad ${\ Displaystyle p_ {y} = {\ frac {1} {2 ^ {n}}}}$

en el caso ${\ Displaystyle x \ oplus y = s}$ (dónde ${\ Displaystyle s \ neq 0 ^ {n}}$ ), la probabilidad de obtener cada cadena ${\ Displaystyle y \ in \ {0,1 \} ^ {n}}$ es dado por

{\ displaystyle p_ {y} = {\ begin {cases} {\ frac {1} {2 ^ {n-1}}} & \ quad {\ text {if}} y \ cdot s {\ text {es par }} \\ 0 & \ quad {\ text {if}} y \ cdot s {\ text {es impar}} \\\ end {cases}}}

Por tanto, en ambos casos, el resultado de la medición es una cadena ${\ Displaystyle y \ in \ {0,1 \} ^ {n}}$ que satisface ${\ Displaystyle s \ cdot y = 0}$ , y la distribución es uniforme en todas las cadenas que satisfacen esta restricción.

¿Es esta información suficiente para determinar ${\ Displaystyle s}$ ? La respuesta es "sí", siempre que el proceso (arriba) se repita varias veces (y se acepte una pequeña probabilidad de falla). Específicamente, si se ejecuta el proceso anterior ${\ Displaystyle n-1}$ veces, obtenemos ${\ Displaystyle n-1}$ instrumentos de cuerda ${\ Displaystyle y_ {1}, y_ {2}, \ dots, y_ {n-1} \ in \ {0,1 \} ^ {n}}$ , tal que

${\ Displaystyle {\ begin {cases} y_ {1} \ cdot s & = 0 \\ y_ {2} \ cdot s & = 0 \\ & \ vdots \\ y_ {n-1} \ cdot s & = 0 \ end { casos}}}$

Este es un sistema de ${\ Displaystyle n-1}$ ecuaciones lineales en ${\ Displaystyle n}$ incógnitas (es decir, las partes de ${\ Displaystyle s}$ ), y el objetivo es resolverlo para obtener ${\ Displaystyle s}$ . Tenga en cuenta que cada uno de los ${\ Displaystyle y_ {1}, y_ {2}, \ dots, y_ {n-1} \ in \ {0,1 \} ^ {n}}$ que obtenemos después de cada medición (para cada "ronda" del proceso) es, por supuesto, el resultado de una medición, por lo que se conoce (al final de cada "ronda").

Solo obtenemos una solución única distinta de cero ${\ Displaystyle s}$ si tenemos "suerte" y ${\ Displaystyle y_ {1}, y_ {2}, \ dots, y_ {n-1} \ in \ {0,1 \} ^ {n}}$ son linealmente independientes. La probabilidad de que ${\ Displaystyle y_ {1}, y_ {2}, \ dots, y_ {n-1}}$ son linealmente independientes es al menos

${\ Displaystyle \ prod _ {k = 1} ^ {\ infty} \ left (1 - {\ frac {1} {2 ^ {k}}} \ right) = 0,288788 \ dots> {\ frac {1} { 4}}}$

Si tenemos independencia lineal, podemos resolver el sistema para obtener una solución candidata ${\ Displaystyle s '\ neq 0 ^ {n}}$ y prueba eso ${\ Displaystyle f (0 ^ {n}) = f (s ')}$ . Si ${\ Displaystyle f (0 ^ {n}) = f (s ')}$ , lo sabemos ${\ Displaystyle s = s '}$ , y el problema ha sido resuelto. Si ${\ Displaystyle f (0 ^ {n}) \ neq f (s ')}$ , debe ser eso ${\ Displaystyle s = 0 ^ {n}}$ (porque, si esto no fuera así, la única solución distinta de cero a las ecuaciones lineales habría sido ${\ Displaystyle s}$ ). De cualquier manera, una vez que tengamos independencia lineal, podremos resolver el problema.

Complejidad

El algoritmo de Simon requiere ${\ Displaystyle O (n)}$ consultas a la caja negra, mientras que un algoritmo clásico necesitaría al menos ${\ Displaystyle \ Omega (2 ^ {n / 2})}$ consultas. También se sabe que el algoritmo de Simon es óptimo en el sentido de que cualquier algoritmo cuántico para resolver este problema requiere ${\ Displaystyle \ Omega (n)}$ consultas. ^[5]^[6]

Ver también

Algoritmo de Deutsch – Jozsa

Referencias

↑ Shor, Peter W. (1 de enero de 1999). "Algoritmos de polinomio-tiempo para factorización prima y logaritmos discretos en una computadora cuántica" . Revisión SIAM . 41 (2): 303–332. arXiv : quant-ph / 9508027 . doi : 10.1137 / S0036144598347011 . ISSN 0036-1445 .
^ Simon, Daniel R. (1 de octubre de 1997). "Sobre el poder de la computación cuántica" . Revista SIAM de Computación . 26 (5): 1474–1483. doi : 10.1137 / S0097539796298637 . ISSN 0097-5397 .
^ Preskill, John (1998). Notas de la conferencia de Física 229: Computación e información cuántica . págs. 273-275.
^ Aaronson, Scott (2018). Introducción a las notas de clase de la ciencia de la información cuántica (PDF) . págs. 144-151.
^ Koiran, P .; Nesme, V .; Portier, N. (2007), "La complejidad de la consulta cuántica del problema del subgrupo oculto abeliano" , Theoretical Computer Science , 380 (1–2): 115-126, doi : 10.1016 / j.tcs.2007.02.057 , recuperado en 2011 -06-06
^ Koiran, P .; Nesme, V .; Portier, N. (2005), "Un límite inferior cuántico para la complejidad de la consulta del problema de Simon" , Proc. ICALP , 3580 : 1287-1298, arXiv : quant-ph / 0501060 , bibcode : 2005quant.ph..1060K , recuperado 2011-06-06

[1] Shor, Peter W. (1 de enero de 1999). "Algoritmos de polinomio-tiempo para factorización prima y logaritmos discretos en una computadora cuántica" . Revisión SIAM . 41 (2): 303–332. arXiv : quant-ph / 9508027 . doi : 10.1137 / S0036144598347011 . ISSN 0036-1445 .

[2] Simon, Daniel R. (1 de octubre de 1997). "Sobre el poder de la computación cuántica" . Revista SIAM de Computación . 26 (5): 1474–1483. doi : 10.1137 / S0097539796298637 . ISSN 0097-5397 .

[3] Preskill, John (1998). Notas de la conferencia de Física 229: Computación e información cuántica . págs. 273-275.

[4] Aaronson, Scott (2018). Introducción a las notas de clase de la ciencia de la información cuántica (PDF) . págs. 144-151.

[5] Koiran, P .; Nesme, V .; Portier, N. (2007), "La complejidad de la consulta cuántica del problema del subgrupo oculto abeliano" , Theoretical Computer Science , 380 (1–2): 115-126, doi : 10.1016 / j.tcs.2007.02.057 , recuperado en 2011 -06-06

[6] Koiran, P .; Nesme, V .; Portier, N. (2005), "Un límite inferior cuántico para la complejidad de la consulta del problema de Simon" , Proc. ICALP , 3580 : 1287-1298, arXiv : quant-ph / 0501060 , bibcode : 2005quant.ph..1060K , recuperado 2011-06-06

[1]