Decodificación de listas

En la teoría de la codificación , la decodificación de listas es una alternativa a la decodificación única de códigos de corrección de errores para grandes tasas de error. La noción fue propuesta por Elias en la década de 1950. La idea principal detrás de la decodificación de listas es que el algoritmo de decodificación, en lugar de generar un único mensaje posible, genera una lista de posibilidades, una de las cuales es correcta. Esto permite manejar un mayor número de errores que el permitido por la decodificación única.

El modelo de decodificación único en la teoría de la codificación , que está limitado a generar una única palabra de código válida de la palabra recibida, no podría tolerar una fracción mayor de errores. Esto resultó en una brecha entre el rendimiento de corrección de errores para los modelos de ruido estocástico (propuesto por Shannon ) y el modelo de ruido adversario (considerado por Richard Hamming ). Desde mediados de los noventa, el progreso algorítmico significativo de la comunidad de la teoría de la codificación ha superado esta brecha. Gran parte de este progreso se basa en un modelo relajado de corrección de errores denominado decodificación de lista, en el que el decodificador genera una lista de palabras de código para los patrones de error patológicos del peor de los casos en los que la palabra de código transmitida real se incluye en la lista de salida. Sin embargo, en el caso de patrones de error típicos, el descodificador genera una única palabra de código única, dada una palabra recibida, que es casi siempre el caso (sin embargo, no se sabe que esto sea cierto para todos los códigos). La mejora aquí es significativa porque el rendimiento de corrección de errores se duplica. Esto se debe a que ahora el decodificador no está limitado por la barrera de la mitad de la distancia mínima. Este modelo es muy atractivo porque tener una lista de palabras en clave es ciertamente mejor que simplemente darse por vencido. La noción de decodificación de listas tiene muchas aplicaciones interesantes en la teoría de la complejidad .

La forma en que se modela el ruido del canal juega un papel crucial, ya que gobierna la velocidad a la que es posible una comunicación confiable. Hay dos escuelas de pensamiento principales para modelar el comportamiento del canal:

Modelo probabilístico de ruido estudiado por Shannon en el que el ruido del canal se modela con precisión en el sentido de que el comportamiento probabilístico del canal es bien conocido y la probabilidad de ocurrencia de demasiados o muy pocos errores es baja
Modelo de ruido de peor caso o adversario considerado por Hamming en el que el canal actúa como un adversario que corrompe arbitrariamente la palabra de código sujeta a un límite en el número total de errores.

Lo más destacado de la decodificación de listas es que incluso en condiciones de ruido adversas, es posible lograr el equilibrio óptimo teórico de la información entre la tasa y la fracción de errores que se pueden corregir. Por lo tanto, en cierto sentido, esto es como mejorar el rendimiento de la corrección de errores al nivel posible en el caso de un modelo de ruido estocástico más débil.

Formulación matemática

Dejar ${\ Displaystyle {\ mathcal {C}}}$ ser un ${\ Displaystyle (n, k, d) _ {q}}$ código de corrección de errores; en otras palabras, ${\ Displaystyle {\ mathcal {C}}}$ es un código de longitud ${\ Displaystyle n}$ , dimensión ${\ Displaystyle k}$ y distancia mínima ${\ Displaystyle d}$ sobre un alfabeto ${\ Displaystyle \ Sigma}$ de tamaño ${\ Displaystyle q}$ . El problema de decodificación de listas ahora se puede formular de la siguiente manera:

Entrada: palabra recibida ${\ Displaystyle x \ in \ Sigma ^ {n}}$ , límite de error ${\ Displaystyle e}$

Salida: una lista de todas las palabras de código ${\ Displaystyle x_ {1}, x_ {2}, \ ldots, x_ {m} \ in {\ mathcal {C}}}$ cuya distancia de martilleo de ${\ Displaystyle x}$ es como máximo ${\ Displaystyle e}$ .

Motivación para la decodificación de listas

Dada una palabra recibida ${\ Displaystyle y}$ , que es una versión ruidosa de alguna palabra de código transmitida ${\ Displaystyle c}$ , el decodificador intenta sacar la palabra de código transmitida colocando su apuesta en una palabra de código que es "más cercana" a la palabra recibida. La distancia de Hamming entre dos palabras de código se utiliza como métrica para encontrar la palabra de código más cercana, dada la palabra recibida por el decodificador. Si ${\ Displaystyle d}$ es la distancia mínima de Hamming de un código ${\ Displaystyle {\ mathcal {C}}}$ , entonces existen dos palabras de código ${\ Displaystyle c_ {1}}$ y ${\ Displaystyle c_ {2}}$ que difieren exactamente en ${\ Displaystyle d}$ posiciones. Ahora, en el caso donde la palabra recibida ${\ Displaystyle y}$ es equidistante de las palabras en clave ${\ Displaystyle c_ {1}}$ y ${\ Displaystyle c_ {2}}$ , la decodificación inequívoca se vuelve imposible ya que el decodificador no puede decidir cuál de ${\ Displaystyle c_ {1}}$ y ${\ Displaystyle c_ {2}}$ para emitir como la palabra de código transmitida original. Como resultado, la mitad de la distancia mínima actúa como una barrera combinatoria más allá de la cual la corrección de errores inequívoca es imposible, si solo insistimos en una decodificación única. Sin embargo, recibió palabras como ${\ Displaystyle y}$ considerados anteriormente ocurren solo en el peor de los casos y si uno mira la forma en que las bolas de Hamming se empaquetan en un espacio de alta dimensión, incluso para patrones de error ${\ Displaystyle e}$ más allá de la mitad de la distancia mínima, solo hay una palabra de código ${\ Displaystyle c}$ dentro de la distancia de Hamming ${\ Displaystyle e}$ de la palabra recibida. Se ha demostrado que esta afirmación es válida para un código aleatorio seleccionado de un conjunto natural y más aún para el caso de los códigos Reed-Solomon, que está bien estudiado y es bastante ubicuo en las aplicaciones del mundo real. De hecho, la prueba de Shannon del teorema de la capacidad para canales simétricos q -ary puede verse a la luz de la afirmación anterior para códigos aleatorios.

Bajo el mandato de decodificación de listas, para los errores del peor de los casos, el decodificador puede generar una pequeña lista de palabras de código. Con alguna información complementaria o específica del contexto, es posible podar la lista y recuperar la palabra de código transmitida original. Por lo tanto, en general, este parece ser un modelo de recuperación de errores más sólido que la decodificación única.

Potencial de decodificación de listas

Para que exista un algoritmo de decodificación de listas de tiempo polinomial, necesitamos la garantía combinatoria de que cualquier bola de Hamming de radio ${\ displaystyle pn}$ alrededor de una palabra recibida ${\ Displaystyle r}$ (dónde ${\ Displaystyle p}$ es la fracción de errores en términos de la longitud del bloque ${\ Displaystyle n}$ ) tiene una pequeña cantidad de palabras en clave. Esto se debe a que el tamaño de la lista en sí es claramente un límite inferior en el tiempo de ejecución del algoritmo. Por lo tanto, requerimos que el tamaño de la lista sea un polinomio en la longitud del bloque ${\ Displaystyle n}$ del código. Una consecuencia combinatoria de este requisito es que impone un límite superior a la tasa de un código. La decodificación de listas promete cumplir con este límite superior. Se ha demostrado de forma no constructiva que los códigos de tarifa ${\ Displaystyle R}$ existen que se pueden decodificar en lista hasta una fracción de los errores que se acercan ${\ Displaystyle 1-R}$ . La cantidad ${\ Displaystyle 1-R}$ En la bibliografía se hace referencia a la capacidad de decodificación de listas. Esta es una ganancia sustancial en comparación con el modelo de decodificación único, ya que ahora tenemos el potencial de corregir el doble de errores. Naturalmente, necesitamos tener al menos una fracción ${\ Displaystyle R}$ de los símbolos transmitidos para que sea correcta para recuperar el mensaje. Este es un límite inferior de la teoría de la información sobre el número de símbolos correctos necesarios para realizar la decodificación y, con la decodificación de listas, podemos alcanzar potencialmente este límite de la teoría de la información. Sin embargo, para realizar este potencial, necesitamos códigos explícitos (códigos que se pueden construir en tiempo polinomial) y algoritmos eficientes para realizar la codificación y decodificación.

( p , L ) -lista-decodificabilidad

Para cualquier fracción de error ${\ Displaystyle 0 \ leqslant p \ leqslant 1}$ y un entero ${\ Displaystyle L \ geqslant 1}$ , un codigo ${\ Displaystyle {\ mathcal {C}} \ subseteq \ Sigma ^ {n}}$ se dice que es una lista decodificable hasta una fracción ${\ Displaystyle p}$ de errores con un tamaño de lista como máximo ${\ Displaystyle L}$ o ${\ Displaystyle (p, L)}$ -lista-decodificable si para cada ${\ Displaystyle y \ in \ Sigma ^ {n}}$ , el número de palabras en clave ${\ Displaystyle c \ in C}$ dentro de la distancia de Hamming ${\ displaystyle pn}$ de ${\ Displaystyle y}$ es como máximo ${\ Displaystyle L.}$

Combinatoria de decodificación de listas

La relación entre la decodificación de listas de un código y otros parámetros fundamentales como la distancia mínima y la velocidad se ha estudiado bastante bien. Se ha demostrado que cada código se puede decodificar mediante listas utilizando listas pequeñas más allá de la mitad de la distancia mínima hasta un límite llamado radio de Johnson. Esto es bastante significativo porque prueba la existencia de ${\ Displaystyle (p, L)}$ -Lista de códigos decodificables de buena velocidad con un radio de decodificación de lista mucho mayor que ${\ Displaystyle {\ tfrac {d} {2}}.}$ En otras palabras, el límite de Johnson descarta la posibilidad de tener una gran cantidad de palabras de código en una bola de Hamming de radio ligeramente mayor que ${\ Displaystyle {\ tfrac {d} {2}}}$ lo que significa que es posible corregir muchos más errores con la decodificación de listas.

Capacidad de decodificación de listas

Teorema (capacidad de decodificación de listas). Dejar

{\ Displaystyle q \ geqslant 2,0 \ leqslant p \ leqslant 1 - {\ tfrac {1} {q}}}

y

{\ Displaystyle \ epsilon \ geqslant 0.}

Las siguientes dos declaraciones son válidas para una longitud de bloque suficientemente grande

{\ Displaystyle n}

.

i) Si

{\ Displaystyle R \ leqslant 1-H_ {q} (p) - \ epsilon}

, entonces existe un

{\ Displaystyle (p, O (1 / \ epsilon))}

-lista de código decodificable.

ii) Si

{\ Displaystyle R \ geqslant 1-H_ {q} (p) + \ epsilon}

, luego cada

{\ Displaystyle (p, L)}

-La lista de código decodificable tiene

{\ Displaystyle L = q ^ {\ Omega (n)}}

.

Dónde

{\ Displaystyle H_ {q} (p) = p \ log _ {q} (q-1) -p \ log _ {q} p- (1-p) \ log _ {q} (1-p)}

es el

{\ Displaystyle q}

función de entropía -ary definida para

{\ Displaystyle p \ in (0,1)}

y extendido por continuidad a

{\ Displaystyle [0,1].}

Lo que esto significa es que para tasas que se acercan a la capacidad del canal, existen códigos decodificables de lista con listas de tamaño polinómico que permiten algoritmos de decodificación eficientes, mientras que para velocidades que exceden la capacidad del canal, el tamaño de la lista se vuelve exponencial, lo que descarta la existencia de algoritmos de decodificación eficientes.

La prueba de la capacidad de decodificación de listas es significativa porque coincide exactamente con la capacidad de un ${\ Displaystyle q}$ -canal simétrico ${\ displaystyle qSC_ {p}}$ . De hecho, el término "capacidad de decodificación de listas" debería leerse en realidad como la capacidad de un canal adversario en la decodificación de listas. Además, la prueba de la capacidad de decodificación de listas es un resultado importante que señala el equilibrio óptimo entre la velocidad de un código y la fracción de errores que se pueden corregir con la decodificación de listas.

Boceto de prueba

La idea detrás de la prueba es similar a la de la prueba de Shannon para la capacidad del canal simétrico binario ${\ Displaystyle BSC_ {p}}$ donde se elige un código aleatorio y muestra que es ${\ Displaystyle (p, L)}$ -lista-decodificable con alta probabilidad siempre que la tasa ${\ Displaystyle R \ leqslant 1-H_ {q} (p) - {\ tfrac {1} {L}}.}$ Para tarifas que excedan la cantidad anterior, se puede mostrar que el tamaño de la lista ${\ Displaystyle L}$ se vuelve superpolinomialmente grande.

Un evento "malo" se define como aquel en el que, dada una palabra recibida ${\ Displaystyle y \ en [q] ^ {n}}$ y ${\ Displaystyle L + 1}$ mensajes ${\ Displaystyle m_ {0}, \ ldots, m_ {L} \ in [q] ^ {k},}$ sucede que ${\ Displaystyle {\ mathcal {C}} (m_ {i}) \ in B (y, pn)}$ , para cada ${\ Displaystyle 0 \ leqslant i \ leqslant L}$ dónde ${\ Displaystyle p}$ es la fracción de errores que deseamos corregir y ${\ Displaystyle B (y, pn)}$ es la bola de Hamming de radio ${\ displaystyle pn}$ con la palabra recibida ${\ Displaystyle y}$ como el centro.

Ahora, la probabilidad de que una palabra en clave ${\ Displaystyle {\ mathcal {C}} (m_ {i})}$ asociado a un mensaje fijo ${\ Displaystyle m_ {i} \ in [q] ^ {k}}$ yace en una bola de Hamming ${\ Displaystyle B (y, pn)}$ es dado por

{\ Displaystyle \ Pr \ left [C (m_ {i}) \ in B (y, pn) \ right] = {\ frac {\ mathrm {Vol} _ {q} (y, pn)} {q ^ { n}}} \ leqslant q ^ {- n (1-H_ {q} (p))},}

donde la cantidad ${\ Displaystyle Vol_ {q} (y, pn)}$ es el volumen de una bola de Hamming de radio ${\ displaystyle pn}$ con la palabra recibida ${\ Displaystyle y}$ como el centro. La desigualdad en la relación anterior se deriva del límite superior del volumen de una bola de Hamming. La cantidad ${\ Displaystyle q ^ {H_ {q} (p)}}$ da una muy buena estimación del volumen de una bola de Hamming de radio ${\ Displaystyle p}$ centrado en cualquier palabra en ${\ Displaystyle [q] ^ {n}.}$ Dicho de otra manera, el volumen de una bola de Hamming es invariante a la traducción. Para continuar con el bosquejo de prueba, conjuramos el límite de unión en la teoría de la probabilidad que nos dice que la probabilidad de que ocurra un evento malo para un determinado ${\ Displaystyle (y, m_ {0}, \ dots, m_ {L})}$ es superior delimitado por la cantidad ${\ Displaystyle q ^ {- n (L + 1) (1-H_ {q} (p))}}$ .

Teniendo en cuenta lo anterior, se puede demostrar que la probabilidad de que ocurra "cualquier" evento negativo es menor que ${\ Displaystyle 1}$ . Para mostrar esto, trabajamos nuestro camino sobre todas las posibles palabras recibidas. ${\ Displaystyle y \ en [q] ^ {n}}$ y cada posible subconjunto de ${\ Displaystyle L}$ mensajes en ${\ Displaystyle [q] ^ {k}.}$

Ahora volviendo a la demostración de la parte (ii), necesitamos mostrar que hay superpolinomialmente muchas palabras en código alrededor de cada ${\ Displaystyle y \ en [q] ^ {n}}$ cuando la velocidad excede la capacidad de decodificación de listas. Tenemos que demostrar que ${\ Displaystyle | {\ mathcal {C}} \ cap B (y, pn) |}$ es superpolinomialmente grande si la tasa ${\ Displaystyle R \ geqslant 1-H_ {q} (p) + \ epsilon}$ . Arreglar una palabra en clave ${\ Displaystyle c \ in {\ mathcal {C}}}$ . Ahora, para cada ${\ Displaystyle y \ en [q] ^ {n}}$ elegido al azar, tenemos

{\ Displaystyle \ Pr [c \ in B (y, pn)] = \ Pr [y \ in B (c, pn)]}

ya que las bolas de Hamming son invariantes a la traducción. De la definición del volumen de una bola de Hamming y del hecho de que ${\ Displaystyle y}$ se elige uniformemente al azar de ${\ Displaystyle [q] ^ {n}}$ también tenemos

{\ Displaystyle \ Pr [c \ in B (y, pn)] = \ Pr [y \ in B (c, pn)] = {\ frac {\ mathrm {Vol} (y, pn)} {q ^ { n}}} \ geqslant q ^ {- n (1-H_ {q} (p)) - o (n)}}

Definamos ahora una variable indicadora ${\ Displaystyle X_ {c}}$ tal que

{\ displaystyle X_ {c} = {\ begin {cases} 1 & c \ in B (y, pn) \\ 0 & {\ text {de otro modo}} \ end {cases}}}

Tomando la expectativa del volumen de una bola de Hamming tenemos

{\ Displaystyle {\ begin {alineado} E [| B (y, pn) |] & = \ sum _ {c \ in {\ mathcal {C}}} E [X_ {c}] \\ [4pt] & = \ sum _ {c \ in {\ mathcal {C}}} \ Pr [X_ {c} = 1] \\ [4pt] & \ geqslant \ sum q ^ {- n (1-H_ {q} (p ) + o (n))} \\ [4pt] & = \ sum q ^ {n (R-1 + H_ {q} (p) + o (1))} \\ [4pt] & \ geqslant q ^ {\ Omega (n)} \ end {alineado}}}

Por lo tanto, mediante el método probabilístico, hemos demostrado que si la tasa excede la capacidad de decodificación de la lista, entonces el tamaño de la lista se vuelve superpolinomialmente grande. Esto completa el bosquejo de prueba para la capacidad de decodificación de listas.

Algoritmos de decodificación de listas

En el período de 1995 a 2007, la comunidad de la teoría de la codificación desarrolló algoritmos de decodificación de listas progresivamente más eficientes. Algoritmos para códigos Reed-Solomon que pueden decodificar hasta el radio de Johnson, que es ${\ Displaystyle 1 - {\ sqrt {1- \ delta}}}$ existir donde ${\ Displaystyle \ delta}$ es la distancia normalizada o distancia relativa. Sin embargo, para los códigos Reed-Solomon, ${\ Displaystyle \ delta = 1-R}$ lo que significa una fracción ${\ Displaystyle 1 - {\ sqrt {R}}}$ de errores se pueden corregir. Algunos de los algoritmos de decodificación de listas más destacados son los siguientes:

Sudán '95: el primer algoritmo de decodificación de listas no trivial conocido para códigos Reed-Solomon que logró una decodificación de listas eficiente hasta ${\ Displaystyle 1 - {\ sqrt {2R}}}$ errores desarrollados por Madhu Sudan .
Guruswami – Sudan '98 : una mejora en el algoritmo anterior para decodificar listas de códigos Reed – Solomon hasta ${\ Displaystyle 1 - {\ sqrt {R}}}$ errores de Madhu Sudan y su entonces estudiante de doctorado Venkatesan Guruswami .
Parvaresh – Vardy '05: en un artículo innovador, Farzad Parvaresh y Alexander Vardy presentaron códigos que se pueden decodificar en lista más allá del ${\ Displaystyle 1 - {\ sqrt {R}}}$ radio para tarifas bajas ${\ Displaystyle R}$ . Sus códigos son variantes de los códigos Reed-Solomon que se obtienen evaluando ${\ Displaystyle m \ geqslant 1}$ polinomios correlacionados en lugar de solo ${\ Displaystyle 1}$ como en el caso de los códigos Reed-Solomon habituales.
Guruswami – Rudra '06 - En otro gran avance, Venkatesan Guruswami y Atri Rudra dan códigos explícitos que logran la capacidad de decodificación de listas, es decir, pueden decodificarse por listas hasta el radio ${\ Displaystyle 1-R- \ epsilon}$ para cualquier ${\ Displaystyle \ epsilon> 0}$ . En otras palabras, se trata de una corrección de errores con una redundancia óptima. Esto respondió a una pregunta que había estado abierta durante unos 50 años. Este trabajo ha sido invitado a la sección Research Highlights de la Comunicación de la ACM (que está “dedicada a los resultados de investigación más importantes publicados en Ciencias de la Computación en los últimos años”) y fue mencionado en un artículo titulado “Coding and Computing Join Forces”. en la edición del 21 de septiembre de 2007 de la revista Science. Los códigos que se les dan se denominan códigos Reed-Solomon plegados que no son más que códigos Reed-Solomon simples, pero que se ven como un código sobre un alfabeto más grande mediante la combinación cuidadosa de símbolos de palabras en clave.

Debido a su ubicuidad y las agradables propiedades algebraicas que poseen, los algoritmos de decodificación de listas para códigos Reed-Solomon fueron un foco principal de los investigadores. El problema de decodificación de listas para códigos Reed-Solomon se puede formular de la siguiente manera:

Entrada : para un ${\ Displaystyle [n, k + 1] _ {q}}$ Código Reed-Solomon, se nos da el par ${\ Displaystyle (\ alpha _ {i}, y_ {i})}$ por ${\ Displaystyle 1 \ leq i \ leq n}$ , dónde ${\ Displaystyle y_ {i}}$ es el ${\ Displaystyle i}$ el bit de la palabra recibida y el ${\ Displaystyle \ alpha _ {i}}$ son puntos distintos en el campo finito ${\ Displaystyle F_ {q}}$ y un parámetro de error ${\ Displaystyle e = nt}$ .

Salida : el objetivo es encontrar todos los polinomios ${\ Displaystyle P (X) \ en F_ {q} [X]}$ de grado como máximo ${\ Displaystyle k}$ que es la longitud del mensaje tal que ${\ Displaystyle p (\ alpha _ {i}) = y_ {i}}$ por al menos ${\ Displaystyle t}$ valores de ${\ Displaystyle i}$ . Aquí, nos gustaría tener ${\ Displaystyle t}$ lo más pequeño posible para poder tolerar un mayor número de errores.

Con la formulación anterior, la estructura general de los algoritmos de decodificación de listas para códigos Reed-Solomon es la siguiente:

Paso 1 : (Interpolación) Encuentra un polinomio bivariado distinto de cero ${\ Displaystyle Q (X, Y)}$ tal que ${\ Displaystyle Q (\ alpha _ {i}, y_ {i}) = 0}$ por ${\ Displaystyle 1 \ leq i \ leq n}$ .

Paso 2 : (Hallazgo de raíz / Factorización) Salida de todos los grados ${\ Displaystyle k}$ polinomios ${\ Displaystyle p (X)}$ tal que ${\ Displaystyle Yp (X)}$ es un factor de ${\ Displaystyle Q (X, Y)}$ es decir ${\ Displaystyle Q (X, p (X)) = 0}$ . Para cada uno de estos polinomios, verifique si ${\ Displaystyle p (\ alpha _ {i}) = y_ {i}}$ por al menos ${\ Displaystyle t}$ valores de ${\ Displaystyle i \ in [n]}$ . Si es así, incluya dicho polinomio ${\ Displaystyle p (X)}$ en la lista de salida.

Dado el hecho de que los polinomios bivariados se pueden factorizar de manera eficiente, el algoritmo anterior se ejecuta en tiempo polinomial.

Aplicaciones en teoría de la complejidad y criptografía

Los algoritmos desarrollados para la decodificación de listas de varias familias de códigos interesantes han encontrado aplicaciones interesantes en la complejidad computacional y el campo de la criptografía . A continuación se muestra una lista de muestra de aplicaciones fuera de la teoría de la codificación:

Construcción de predicados de núcleo duro a partir de permutaciones unidireccionales .
Predicción de testigos para problemas de búsqueda NP.
Amplificando la dureza de las funciones booleanas.
Dureza media de la caja de matrices permanentes o aleatorias.
Extractores y generadores pseudoaleatorios .
Rastreo eficiente de traidores.

enlaces externos

Una encuesta sobre decodificación de listas de Madhu Sudan
Notas de un curso impartido por Madhu Sudan
Notas de un curso impartido por Luca Trevisan
Notas de un curso impartido por Venkatesan Guruswami
Notas de un curso impartido por Atri Rudra
P. Elias, "Decodificación de listas para canales ruidosos", Informe técnico 335, Laboratorio de investigación de electrónica, MIT, 1957.
P. Elias, "Códigos de corrección de errores para la decodificación de listas", IEEE Transactions on Information Theory, vol. 37, págs. 5-12, 1991.
JM Wozencraft, "Decodificación de listas", Informe de progreso trimestral, Laboratorio de investigación de electrónica, MIT, vol. 48, págs. 90–95, 1958.
Venkatesan Guruswami 's tesis doctoral
Resultados algorítmicos en la decodificación de listas
Código plegado Reed-Solomon