Código decodificable localmente

Un código decodificable localmente (LDC) es un código de corrección de errores que permite decodificar un solo bit del mensaje original con alta probabilidad examinando (o preguntando) solo una pequeña cantidad de bits de una palabra de código posiblemente dañada . ^[1]^[2]^[3] Esta propiedad podría ser útil, digamos, en un contexto donde la información se transmite a través de un canal ruidoso, y solo se requiere un pequeño subconjunto de los datos en un momento particular y no es necesario decodificar el mensaje completo a la vez. Tenga en cuenta que los códigos decodificables localmente no son un subconjunto de códigos comprobables localmente , aunque existe cierta superposición entre los dos. ^[4]

Las palabras de código se generan a partir del mensaje original utilizando un algoritmo que introduce una cierta cantidad de redundancia en la palabra de código; por lo tanto, la palabra clave siempre es más larga que el mensaje original. Esta redundancia se distribuye a través de la palabra de código y permite recuperar el mensaje original con buena probabilidad incluso en presencia de errores. Cuanto más redundante sea la palabra de código, más resistente será contra los errores y menos consultas necesarias para recuperar un poco del mensaje original.

Descripción general

Más formalmente, un ${\ Displaystyle (q, \ delta, \ epsilon)}$ -código decodificable localmente codifica un ${\ Displaystyle n}$ -mensaje de bits ${\ Displaystyle x}$ a una ${\ Displaystyle N}$ -palabra de código de bits ${\ Displaystyle C (x)}$ tal que cualquier pedacito ${\ Displaystyle x_ {i}}$ del mensaje se puede recuperar con probabilidad ${\ Displaystyle 1- \ epsilon}$ mediante el uso de un algoritmo de decodificación aleatorio que solo consulta ${\ Displaystyle q}$ bits de la palabra en clave ${\ Displaystyle C (x)}$ , incluso si hasta ${\ Displaystyle \ delta N}$ las ubicaciones de la palabra de código se han corrompido.

Además, un decodificador local perfectamente fluido es un decodificador tal que, además de generar siempre la salida correcta, se da acceso a una palabra de código no corrupta, para cada ${\ Displaystyle j \ en [q]}$ y ${\ Displaystyle i \ in [n]}$ la ${\ Displaystyle j ^ {th}}$ consulta para recuperar el ${\ Displaystyle i ^ {th}}$ poco es uniforme sobre ${\ Displaystyle [N]}$ . ^[5] (La notación ${\ Displaystyle [y]}$ denota el conjunto ${\ Displaystyle \ {1, \ ldots, y \}}$ ). De manera informal, esto significa que el conjunto de consultas necesarias para decodificar cualquier bit dado se distribuye uniformemente sobre la palabra de código.

Los decodificadores de listas locales son otro subconjunto interesante de decodificadores locales. La decodificación de listas es útil cuando una palabra de código está dañada en más de ${\ Displaystyle \ delta / 2}$ lugares donde ${\ Displaystyle \ delta}$ es la distancia mínima de Hamming entre dos palabras de código. En este caso, ya no es posible identificar exactamente qué mensaje original se ha codificado, ya que podría haber varias palabras de código dentro ${\ Displaystyle \ delta}$ distancia de la palabra de código dañada. Sin embargo, dado un radio ${\ Displaystyle \ epsilon}$ , es posible identificar el conjunto de mensajes que se codifican en palabras de código que se encuentran dentro ${\ Displaystyle \ epsilon}$ de la palabra de código dañada. Un límite superior en el tamaño del conjunto de mensajes se puede determinar mediante ${\ Displaystyle \ delta}$ y ${\ Displaystyle \ epsilon}$ . ^[6]

Los códigos decodificables localmente también se pueden concatenar, donde un mensaje se codifica primero usando un esquema, y la palabra de código resultante se codifica nuevamente usando un esquema diferente. (Tenga en cuenta que, en este contexto, la concatenación es el término utilizado por los eruditos para referirse a lo que generalmente se llama composición ; ver ^[5] ). Esto puede ser útil si, por ejemplo, el primer código tiene algunas propiedades deseables con respecto a la tasa, pero tiene alguna propiedad indeseable, como producir una palabra de código sobre un alfabeto no binario. El segundo código puede transformar el resultado de la primera codificación sobre un alfabeto no binario en un alfabeto binario. La codificación final todavía se puede decodificar localmente y requiere pasos adicionales para decodificar ambas capas de codificación. ^[7]

Longitud de la palabra clave y complejidad de la consulta

La tasa de un código se refiere a la relación entre la longitud de su mensaje y la longitud de la palabra de código: ${\ Displaystyle {\ frac {| x |} {| C (x) |}}}$ y el número de consultas necesarias para recuperar 1 bit del mensaje se denomina complejidad de consulta de un código.

La tasa de un código está inversamente relacionada con la complejidad de la consulta, pero la forma exacta de esta compensación es un gran problema abierto. ^[8]^[9] Se sabe que no hay LDC que consulten la palabra de código en una sola posición, y que el tamaño óptimo de la palabra de código para la complejidad de la consulta 2 es exponencial en el tamaño del mensaje original. ^[8] Sin embargo, no se conocen límites inferiores estrictos para los códigos con una complejidad de consulta superior a 2. Al acercarse a la compensación desde el lado de la longitud de la palabra de código, los únicos códigos conocidos con una longitud de palabra de código proporcional a la longitud del mensaje tienen complejidad de consulta ${\ Displaystyle k ^ {\ epsilon}}$ por ${\ Displaystyle \ epsilon> 0}$ ^[8]^{[ necesita actualización ]} También hay códigos intermedios, que tienen palabras en clave polinomiales en el tamaño del mensaje original y complejidad de consulta polilogarítmica. ^[8]

Aplicaciones

Los códigos decodificables localmente tienen aplicaciones para la transmisión y el almacenamiento de datos, la teoría de la complejidad, las estructuras de datos, la desaleatorización, la teoría del cálculo tolerante a fallas y los esquemas de recuperación de información privada. ^[9]

Transmisión y almacenamiento de datos

Los códigos decodificables localmente son especialmente útiles para la transmisión de datos a través de canales ruidosos. El código Hadamard (un caso especial de los códigos Reed Muller) fue utilizado en 1971 por Mariner 9 para transmitir imágenes de Marte a la Tierra. Se eligió en lugar de un código de 5 repeticiones (donde cada bit se repite 5 veces) porque, para aproximadamente el mismo número de bits transmitidos por píxel, tenía una mayor capacidad de corrección de errores. (El código Hadamard cae bajo el paraguas general de la corrección de errores hacia adelante , y resulta que es decodificable localmente; el algoritmo real utilizado para decodificar la transmisión desde Marte era un esquema genérico de corrección de errores). ^[10]

Los LDC también son útiles para el almacenamiento de datos, donde el medio puede dañarse parcialmente con el tiempo o el dispositivo de lectura está sujeto a errores. En ambos casos, un LDC permitirá la recuperación de información a pesar de los errores, siempre que haya relativamente pocos. Además, los PMA no exigen que se decodifique todo el mensaje original; un usuario puede decodificar una parte específica del mensaje original sin necesidad de decodificar todo. ^[11]

Teoría de la complejidad

Una de las aplicaciones de los códigos decodificables localmente en la teoría de la complejidad es la amplificación de la dureza. Utilizando LDC con longitud de palabra de código polinomial y complejidad de consulta polilogarítmica, se puede tomar una función ${\ displaystyle L: \ {0,1 \} ^ {n} \ rightarrow \ {0,1 \}}$ que es difícil de resolver en las entradas del peor de los casos y diseñar una función ${\ Displaystyle L ': \ {0,1 \} ^ {N} \ rightarrow \ {0,1 \}}$ eso es difícil de calcular en entradas de casos promedio.

Considerar ${\ Displaystyle L}$ limitado solo a la longitud ${\ Displaystyle t}$ entradas. Entonces podemos ver ${\ Displaystyle L}$ como una cadena binaria de longitud ${\ Displaystyle 2 ^ {t}}$ , donde cada bit es ${\ Displaystyle L (x)}$ para cada ${\ Displaystyle x \ in \ {0,1 \} ^ {t}}$ . Podemos usar un código decodificable localmente de longitud polinomial ${\ Displaystyle C}$ con complejidad de consulta polilogarítmica que tolera una fracción constante de errores para codificar la cadena que representa ${\ Displaystyle L}$ para crear una nueva cadena de longitud ${\ Displaystyle 2 ^ {O (t)} = 2 ^ {t '}}$ . Creemos que esta nueva cadena define un nuevo problema ${\ Displaystyle L '}$ en longitud ${\ Displaystyle t '}$ entradas. Si ${\ Displaystyle L '}$ es fácil de resolver en promedio, es decir, podemos resolver ${\ Displaystyle L '}$ correctamente en una gran fracción ${\ Displaystyle 1- \ epsilon}$ de entradas, luego por las propiedades de la LDC usada para codificarla, podemos usar ${\ Displaystyle L '}$ calcular probabilísticamente ${\ Displaystyle L}$ en todas las entradas. Por lo tanto, una solución a ${\ Displaystyle L '}$ para la mayoría de las entradas nos permitiría resolver ${\ Displaystyle L}$ en todas las entradas, contradiciendo nuestra suposición de que ${\ Displaystyle L}$ es difícil para las entradas del peor de los casos. ^[5]^[8]^[12]

Esquemas de recuperación de información privada

Un esquema de recuperación de información privada permite a un usuario recuperar un elemento de un servidor en posesión de una base de datos sin revelar qué elemento se recupera. Una forma común de garantizar la privacidad es tener ${\ Displaystyle k}$ servidores separados que no se comunican, cada uno con una copia de la base de datos. Dado un esquema apropiado, el usuario puede realizar consultas a cada servidor que individualmente no revelan qué bit está buscando el usuario, pero que en conjunto brindan suficiente información para que el usuario pueda determinar el bit particular de interés en la base de datos. ^[3]^[11]

Se puede ver fácilmente que los códigos decodificables localmente tienen aplicaciones en este entorno. Un procedimiento general para producir un ${\ Displaystyle k}$ -esquema de información privada del servidor de una manera perfectamente fluida ${\ Displaystyle k}$ -La consulta de código decodificable localmente es la siguiente:

Dejar ${\ Displaystyle C}$ ser un LDC perfectamente fluido que codifique ${\ Displaystyle n}$ -bit mensajes a ${\ Displaystyle N}$ -palabras en clave de bits. Como paso de preprocesamiento, cada uno de los ${\ Displaystyle k}$ servidores ${\ Displaystyle S_ {1}, \ ldots, S_ {k}}$ codifica el ${\ Displaystyle n}$ base de datos de bits ${\ Displaystyle x}$ con el codigo ${\ Displaystyle C}$ , por lo que ahora cada servidor almacena el ${\ Displaystyle N}$ -palabra de código de bits ${\ Displaystyle C (x)}$ . Un usuario interesado en obtener el ${\ Displaystyle i ^ {th}}$ un poco de ${\ Displaystyle x}$ genera aleatoriamente un conjunto de ${\ Displaystyle k}$ consultas ${\ Displaystyle q_ {1}, \ ldots q_ {k}}$ tal que ${\ Displaystyle x_ {i}}$ se puede calcular a partir de ${\ Displaystyle C (x) _ {q_ {1}}, \ ldots C (x) _ {q_ {k}}}$ usando el algoritmo de decodificación local ${\ Displaystyle A}$ por ${\ Displaystyle C}$ . El usuario envía cada consulta a un servidor diferente y cada servidor responde con el bit solicitado. El usuario luego usa ${\ Displaystyle A}$ computar ${\ Displaystyle x_ {i}}$ de las respuestas. ^[8]^[11] Dado que el algoritmo de decodificación es perfectamente fluido, cada consulta ${\ Displaystyle q_ {j}}$ se distribuye uniformemente sobre la palabra clave; por lo tanto, ningún servidor individual puede obtener información sobre las intenciones del usuario, por lo que el protocolo es privado siempre que los servidores no se comuniquen. ^[11]

Ejemplos de

El código Hadamard

El código Hadamard (o Walsh-Hadamard) es un ejemplo de un código simple decodificable localmente que mapea una cadena de longitud ${\ Displaystyle k}$ a una palabra en clave de longitud ${\ Displaystyle 2 ^ {k}}$ . La palabra en clave de una cadena ${\ Displaystyle x \ in \ {0,1 \} ^ {k}}$ se construye de la siguiente manera: para cada ${\ Displaystyle a_ {j} \ in \ {0,1 \} ^ {k}}$ , la ${\ Displaystyle j ^ {th}}$ bit de la palabra de código es igual a ${\ Displaystyle x \ odot a_ {j}}$ , dónde ${\ Displaystyle x \ odot y = \ sum \ limits _ {i = 1} ^ {k} x_ {i} y_ {i}}$ (mod 2). Es fácil ver que cada palabra en clave tiene una distancia de Hamming de ${\ Displaystyle {\ frac {n} {2}}}$ de cualquier otra palabra en clave.

El algoritmo de decodificación local tiene una complejidad de consulta 2, y todo el mensaje original se puede decodificar con buena probabilidad si la palabra de código se corrompe en menos de ${\ Displaystyle {\ frac {1} {4}}}$ de sus bits. Para ${\ Displaystyle \ rho <{\ frac {1} {4}}}$ , si la palabra de código está dañada en un ${\ Displaystyle \ rho}$ fracción de lugares, un algoritmo de decodificación local puede recuperar la ${\ Displaystyle i ^ {th}}$ poco del mensaje original con probabilidad ${\ Displaystyle 1-2 \ rho}$ .

Prueba: dada una palabra en clave ${\ Displaystyle H}$ y un índice ${\ Displaystyle i}$ , el algoritmo para recuperar el ${\ Displaystyle i ^ {th}}$ un poco del mensaje original ${\ Displaystyle x}$ funciona de la siguiente manera:

Dejar ${\ Displaystyle e ^ {j}}$ consulte el vector en ${\ Displaystyle \ {0,1 \} ^ {k}}$ que tiene 1 en el ${\ Displaystyle j ^ {th}}$ posición y ceros en otros lugares. Para ${\ Displaystyle y \ in \ {0,1 \} ^ {k}}$ , ${\ Displaystyle f (y)}$ denota el bit único en ${\ Displaystyle H}$ que corresponde a ${\ Displaystyle x \ odot y}$ . El algoritmo elige un vector aleatorio ${\ Displaystyle y \ in \ {0,1 \} ^ {k}}$ y el vector ${\ Displaystyle y '= y \ oplus e ^ {i}}$ (dónde ${\ Displaystyle \ oplus}$ denota XOR bit a bit ). Las salidas del algoritmo ${\ Displaystyle f (y) \ oplus f (y ')}$ (mod 2).

Corrección: por linealidad,

${\ Displaystyle (x \ odot y) \ oplus (x \ odot y ') = (x \ odot y) \ oplus (x \ odot (y \ oplus e ^ {i})) = (x \ odot y) \ oplus (x \ odot y) \ oplus (x \ odot e ^ {i}) = x \ odot e ^ {i}}$

Pero ${\ Displaystyle (x \ odot e ^ {i}) = x_ {i}}$ , así que solo tenemos que mostrar que ${\ Displaystyle f (y) = x \ odot y}$ y ${\ Displaystyle f (y ') = x \ odot y'}$ con buena probabilidad.

Desde ${\ Displaystyle y}$ y ${\ Displaystyle y '}$ están distribuidos uniformemente (aunque sean dependientes), el límite de unión implica que ${\ Displaystyle f (y) = x \ odot y}$ y ${\ Displaystyle f (y ') = x \ odot y'}$ con probabilidad al menos ${\ Displaystyle 1-2 \ rho}$ . Nota: para ampliar la probabilidad de éxito, se puede repetir el procedimiento con diferentes vectores aleatorios y obtener la respuesta mayoritaria. ^[13]

El código Reed-Muller

La idea principal detrás de la decodificación local de los códigos Reed-Muller es la interpolación polinómica . El concepto clave detrás de un código Reed-Muller es un polinomio multivariante de grados ${\ Displaystyle d}$ en ${\ Displaystyle l}$ variables. El mensaje se trata como la evaluación de un polinomio en un conjunto de puntos predefinidos. Para codificar estos valores, se extrapola un polinomio de ellos, y la palabra clave es la evaluación de ese polinomio en todos los puntos posibles. En un nivel alto, para decodificar un punto de este polinomio, el algoritmo de decodificación elige un conjunto ${\ Displaystyle S}$ de puntos en una línea que pasa por el punto de interés ${\ Displaystyle x}$ . Luego consulta la palabra clave para la evaluación del polinomio en puntos en ${\ Displaystyle S}$ e interpola ese polinomio. Entonces es simple evaluar el polinomio en el punto que producirá ${\ Displaystyle x}$ . Esta forma indirecta de evaluar ${\ Displaystyle x}$ es útil porque (a) el algoritmo se puede repetir usando diferentes líneas a través del mismo punto para mejorar la probabilidad de corrección, y (b) las consultas se distribuyen uniformemente sobre la palabra de código.

Más formalmente, dejemos ${\ Displaystyle \ mathbb {F}}$ ser un campo finito, y dejar ${\ Displaystyle l, d}$ ser números con ${\ Displaystyle d <| \ mathbb {F} |}$ . El código Reed-Muller con parámetros ${\ Displaystyle \ mathbb {F}, l, d}$ es la función RM: ${\ Displaystyle \ mathbb {F} ^ {\ binom {l + d} {d}} \ rightarrow \ mathbb {F} ^ {| \ mathbb {F} | ^ {l}}}$ que mapea cada ${\ Displaystyle l}$ -polinomio variable ${\ Displaystyle P}$ encima ${\ Displaystyle \ mathbb {F}}$ de grado total ${\ Displaystyle d}$ a los valores de ${\ Displaystyle P}$ en todas las entradas en ${\ Displaystyle \ mathbb {F} ^ {l}}$ . Es decir, la entrada es un polinomio de la forma ${\ Displaystyle P (x_ {1}, \ ldots, x_ {l}) = \ sum \ limits _ {i_ {1} + \ ldots + i_ {l} \ leq d} c_ {i_ {1}, \ ldots , i_ {l}} x_ {1} ^ {i_ {1}} x_ {2} ^ {i_ {2}} \ cdots x_ {l} ^ {i_ {l}}}$ especificado por la interpolación de la ${\ Displaystyle {\ binom {l + d} {d}}}$ valores de los puntos predefinidos y la salida es la secuencia ${\ Displaystyle \ {P (x_ {1}, \ ldots, x_ {l}) \}}$ para cada ${\ Displaystyle x_ {1}, \ ldots, x_ {l} \ in \ mathbb {F}}$ . ^[14]

Para recuperar el valor de una titulación ${\ Displaystyle d}$ polinomio en un punto ${\ Displaystyle w \ in \ mathbb {F} ^ {n}}$ , el decodificador local dispara una línea afín aleatoria a través de ${\ Displaystyle w}$ . Entonces escoge ${\ Displaystyle d + 1}$ puntos en esa línea, que utiliza para interpolar el polinomio y luego evaluarlo en el punto donde el resultado es ${\ Displaystyle w}$ . Para hacerlo, el algoritmo elige un vector ${\ Displaystyle v \ in \ mathbb {F} ^ {n}}$ uniformemente al azar y considera la línea ${\ Displaystyle L = \ {w + \ lambda v \ mid \ lambda \ in \ mathbb {F} \}}$ mediante ${\ Displaystyle w}$ . El algoritmo elige un subconjunto arbitrario ${\ Displaystyle S}$ de ${\ Displaystyle \ mathbb {F}}$ , dónde ${\ Displaystyle | S | = d + 1}$ y consulta las coordenadas de la palabra de código que corresponden a puntos ${\ Displaystyle w + \ lambda v}$ para todos ${\ Displaystyle \ lambda \ en S}$ y obtiene valores ${\ Displaystyle \ {e _ {\ lambda} \}}$ . Luego usa la interpolación polinomial para recuperar el polinomio univariante único ${\ Displaystyle h}$ con grado menor o igual a ${\ Displaystyle d}$ tal que ${\ Displaystyle h (\ lambda) = e _ {\ lambda}}$ para todos ${\ Displaystyle \ lambda \ en S}$ . Luego, para obtener el valor de ${\ Displaystyle w}$ , solo evalúa ${\ Displaystyle h (0)}$ . Para recuperar un solo valor del mensaje original, se elige ${\ Displaystyle w}$ ser uno de los puntos que define el polinomio. ^[8]^[14]

Cada consulta individual se distribuye uniformemente al azar sobre la palabra de código. Por lo tanto, si la palabra en clave se corrompe en un ${\ Displaystyle \ delta}$ fracción de ubicaciones, por el límite de unión, la probabilidad de que el algoritmo muestree solo coordenadas no corrompidas (y por lo tanto recupere correctamente el bit) es al menos ${\ Displaystyle 1- (d + 1) \ delta}$ . ^[8] Para otros algoritmos de decodificación, consulte. ^[8]

Ver también

Referencias

^ Sergey Yekhanin. "Códigos decodificables localmente: una breve encuesta" (PDF) .
^ Rafail Ostrovsky; Omkant Pandey; Amit Sahai. "Códigos privados decodificables localmente" (PDF) .
^ a b Sergey Yekhanin. Nuevos códigos decodificables localmente y esquemas de recuperación de información privada, Informe técnico ECCC TR06-127 , 2006.
^ Tali Kaufman; Michael Viderman. "Códigos localmente comprobables frente a códigos decodificables localmente" .
^ a b c Luca Trevisan. "Algunas aplicaciones de la teoría de la codificación en la complejidad computacional" (PDF) .
^ Arora, Sanjeev ; Barak, Boaz (2009). "Sección 19.5". Complejidad computacional: un enfoque moderno . Cambridge . ISBN 978-0-521-42426-4.
^ Arora y Barak 2009 , sección 19.4.3
^ a b c d e f g h yo Sergey Yekhanin. "Códigos decodificables localmente" (PDF) .
^ a b Sergey Yekhanin. "Códigos decodificables localmente" (PDF) .
^ "Combinatoria en el espacio El sistema de telemetría Mariner 9" (PDF) .
^ a b c d Sergey Yekhanin. "Recuperación de información privada" (PDF) .
^ Arora y Barak 2009 , sección 19.4
^ Arora y Barak 2009 , sección 11.5.2
^ a b Arora y Barak 2009 , sección 19.4.2

[LDCSurvey-1] Sergey Yekhanin. "Códigos decodificables localmente: una breve encuesta" (PDF) .

[PrivateLDC-2] Rafail Ostrovsky; Omkant Pandey; Amit Sahai. "Códigos privados decodificables localmente" (PDF) .

[newLDCPIR-3] Sergey Yekhanin. Nuevos códigos decodificables localmente y esquemas de recuperación de información privada, Informe técnico ECCC TR06-127 , 2006.

[LTCvsLDC-4] Tali Kaufman; Michael Viderman. "Códigos localmente comprobables frente a códigos decodificables localmente" .

[AppCodingTheory-5] Luca Trevisan. "Algunas aplicaciones de la teoría de la codificación en la complejidad computacional" (PDF) .

[6] Arora, Sanjeev ; Barak, Boaz (2009). "Sección 19.5". Complejidad computacional: un enfoque moderno . Cambridge . ISBN 978-0-521-42426-4.

[7] Arora y Barak 2009 , sección 19.4.3

[LDC1-8] yo Sergey Yekhanin. "Códigos decodificables localmente" (PDF) .

[LDC2-9] Sergey Yekhanin. "Códigos decodificables localmente" (PDF) .

[10] "Combinatoria en el espacio El sistema de telemetría Mariner 9" (PDF) .

[PIR-11] Sergey Yekhanin. "Recuperación de información privada" (PDF) .

[12] Arora y Barak 2009 , sección 19.4

[13] Arora y Barak 2009 , sección 11.5.2

[AB1942-14] Arora y Barak 2009 , sección 19.4.2

[1]