Ley distributiva generalizada

La ley distributiva generalizada (GDL) es una generalización de la propiedad distributiva que da lugar a un algoritmo general de paso de mensajes . ^[1] Es una síntesis del trabajo de muchos autores en las comunidades de teoría de la información , comunicaciones digitales , procesamiento de señales , estadísticas e inteligencia artificial . La ley y el algoritmo fueron introducidos en un semi-tutorial por Srinivas M. Aji y Robert J. McEliece con el mismo título. ^[1]

Introducción

"La ley distributiva en matemáticas es la ley que relaciona las operaciones de multiplicación y suma, expresada simbólicamente, ${\ Displaystyle a * (b + c) = a * b + a * c}$ ; es decir, el factor monomio ${\ Displaystyle a}$ se distribuye, o se aplica por separado, a cada término del factor binomial ${\ Displaystyle b + c}$ , resultando en el producto ${\ Displaystyle a * b + a * c}$ " - Britannica ^[2]

Como se puede observar en la definición, la aplicación de la ley distributiva a una expresión aritmética reduce el número de operaciones en ella. En el ejemplo anterior, el número total de operaciones se redujo de tres (dos multiplicaciones y una suma en ${\ Displaystyle a * b + a * c}$ ) a dos (una multiplicación y una suma en ${\ Displaystyle a * (b + c)}$ ). La generalización de la ley distributiva conduce a una gran familia de algoritmos rápidos . Esto incluye el algoritmo FFT y Viterbi .

Esto se explica de una manera más formal en el siguiente ejemplo:

${\ Displaystyle \ alpha (a, \, b) {\ stackrel {\ mathrm {def}} {=}} \ Displaystyle \ sum \ limits _ {c, d, e \ in A} f (a, \, c , \, b) \, g (a, \, d, \, e)}$ dónde ${\ Displaystyle f (\ cdot)}$ y ${\ Displaystyle g (\ cdot)}$ son funciones de valor real, ${\ Displaystyle a, b, c, d, e \ in A}$ y ${\ Displaystyle | A | = q}$ (decir)

Aquí estamos "marginando" las variables independientes ( ${\ Displaystyle c}$ , ${\ Displaystyle d}$ , y ${\ Displaystyle e}$ ) para obtener el resultado. Cuando calculamos la complejidad computacional, podemos ver que para cada ${\ Displaystyle q ^ {2}}$ pares de ${\ Displaystyle (a, b)}$ , existen ${\ Displaystyle q ^ {3}}$ términos debidos al triplete ${\ Displaystyle (c, d, e)}$ que necesita participar en la evaluación de ${\ Displaystyle \ alpha (a, \, b)}$ cada paso tiene una suma y una multiplicación. Por lo tanto, el número total de cálculos necesarios es ${\ Displaystyle 2 \ cdot q ^ {2} \ cdot q ^ {3} = 2q ^ {5}}$ . Por tanto, la complejidad asintótica de la función anterior es ${\ Displaystyle O (n ^ {5})}$ .

Si aplicamos la ley distributiva al RHS de la ecuación, obtenemos lo siguiente:

{\ Displaystyle \ alpha (a, \, b) {\ stackrel {\ mathrm {def}} {=}} \ Displaystyle \ sum \ limits _ {c \ in A} f (a, \, c, \, b ) \ cdot \ sum _ {d, \, e \ en A} g (a, \, d, \, e)}

Esto implica que ${\ Displaystyle \ alpha (a, \, b)}$ se puede describir como un producto ${\ Displaystyle \ alpha _ {1} (a, \, b) \ cdot \ alpha _ {2} (a)}$ dónde ${\ Displaystyle \ alpha _ {1} (a, b) {\ stackrel {\ mathrm {def}} {=}} \ Displaystyle \ sum \ limits _ {c \ in A} f (a, \, c, \ ,B)}$ y ${\ Displaystyle \ alpha _ {2} (a) {\ stackrel {\ mathrm {def}} {=}} \ Displaystyle \ sum \ limits _ {d, \, e \ in A} g (a, \, d ,\,mi)}$

Ahora, cuando estamos calculando la complejidad computacional, podemos ver que hay ${\ Displaystyle q ^ {3}}$ adiciones en ${\ Displaystyle \ alpha _ {1} (a, \, b)}$ y ${\ Displaystyle \ alpha _ {2} (a)}$ cada uno y hay ${\ Displaystyle q ^ {2}}$ multiplicaciones cuando estamos usando el producto ${\ Displaystyle \ alpha _ {1} (a, \, b) \ cdot \ alpha _ {2} (a)}$ para evaluar ${\ Displaystyle \ alpha (a, \, b)}$ . Por lo tanto, el número total de cálculos necesarios es ${\ Displaystyle q ^ {3} + q ^ {3} + q ^ {2} = 2q ^ {3} + q ^ {2}}$ . De ahí la complejidad asintótica de calcular ${\ Displaystyle \ alpha (a, b)}$ reduce a ${\ Displaystyle O (n ^ {3})}$ de ${\ Displaystyle O (n ^ {5})}$ . Esto muestra con un ejemplo que la aplicación de la ley distributiva reduce la complejidad computacional, que es una de las buenas características de un "algoritmo rápido".

Historia

Algunos de los problemas que utilizaron la ley distributiva para resolver se pueden agrupar de la siguiente manera

1. Algoritmos
de decodificación Gallager utilizó un algoritmo similar a GDL para decodificar códigos de verificación de paridad de baja densidad. Basado en el trabajo de Gallager, Tanner introdujo el gráfico de Tanner y expresó el trabajo de Gallager en forma de transmisión de mensajes. El gráfico de los curtidores también ayudó a explicar el algoritmo de Viterbi .

Forney observa que la decodificación de máxima verosimilitud de códigos convolucionales de Viterbi también utilizó algoritmos de generalidad similar a GDL.

2. Algoritmo hacia adelante y hacia atrás
El algoritmo hacia adelante y hacia atrás ayudó como algoritmo para rastrear los estados en la cadena de Markov . Y esto también se usó el algoritmo de GDL como generalidad

3. Inteligencia artificial
La noción de árboles de unión se ha utilizado para resolver muchos problemas en IA. Además, el concepto de eliminación de cubos utilizó muchos de los conceptos.

El problema del MPF

MPF o marginar una función de producto es un problema computacional general que, como caso especial, incluye muchos problemas clásicos como el cálculo de la transformada discreta de Hadamard , la decodificación de máxima verosimilitud de un código lineal sobre un canal sin memoria y la multiplicación de la cadena de matrices . El poder del GDL radica en el hecho de que se aplica a situaciones en las que se generalizan las sumas y multiplicaciones. Un semiring conmutativo es un buen marco para explicar este comportamiento. Se define sobre un conjunto ${\ Displaystyle K}$ con operadores " ${\ displaystyle +}$ " y " ${\ Displaystyle.}$ " dónde ${\ Displaystyle (K, \, +)}$ y ${\ Displaystyle (K, \ ,.)}$ son monoides conmutativos y se cumple la ley distributiva.

Dejar ${\ Displaystyle p_ {1}, \ ldots, p_ {n}}$ ser variables tales que ${\ Displaystyle p_ {1} \ in A_ {1}, \ ldots, p_ {n} \ in A_ {n}}$ dónde ${\ Displaystyle A}$ es un conjunto finito y ${\ Displaystyle | A_ {i} | = q_ {i}}$ . Aquí ${\ Displaystyle i = 1, \ ldots, n}$ . Si ${\ Displaystyle S = \ {i_ {1}, \ ldots, i_ {r} \}}$ y ${\ Displaystyle S \, \ subconjunto \ {1, \ ldots, n \}}$ , dejar ${\ Displaystyle A_ {S} = A_ {i_ {1}} \ times \ cdots \ times A_ {i_ {r}}}$ , ${\ Displaystyle p_ {S} = (p_ {i_ {1}}, \ ldots, p_ {i_ {r}})}$ , ${\ Displaystyle q_ {S} = | A_ {S} |}$ , ${\ Displaystyle \ mathbf {A} = A_ {1} \ times \ cdots \ times A_ {n}}$ , y ${\ Displaystyle \ mathbf {p} = \ {p_ {1}, \ ldots, p_ {n} \}}$

Dejar ${\ Displaystyle S = \ {S_ {j} \} _ {j = 1} ^ {M}}$ dónde ${\ Displaystyle S_ {j} \ subconjunto \ {1, ... \ ,, n \}}$ . Supongamos que una función se define como ${\ Displaystyle \ alpha _ {i}: A_ {S_ {i}} \ rightarrow R}$ , dónde ${\ Displaystyle R}$ es un semirrendado conmutativo . También, ${\ Displaystyle p_ {S_ {i}}}$ se denominan los dominios locales y ${\ Displaystyle \ alpha _ {i}}$ como los núcleos locales .

Ahora el kernel global ${\ Displaystyle \ beta: \ mathbf {A} \ rightarrow R}$ Se define como : ${\ Displaystyle \ beta (p_ {1}, ... \ ,, p_ {n}) = \ prod _ {i = 1} ^ {M} \ alpha (p_ {S_ {i}})}$

Definición de problema de MPF : para uno o más índices ${\ Displaystyle i = 1, ... \ ,, M}$ , calcula una tabla de los valores de ${\ Displaystyle S_ {i}}$ - marginación del núcleo global ${\ Displaystyle \ beta}$ , que es la función ${\ Displaystyle \ beta _ {i}: A_ {S_ {i}} \ rightarrow R}$ definido como ${\ Displaystyle \ beta _ {i} (p_ {S_ {i}}) \, = \ Displaystyle \ sum \ limits _ {p_ {S_ {i} ^ {c}} \ in A_ {S_ {i} ^ { c}}} \ beta (p)}$

Aquí ${\ Displaystyle S_ {i} ^ {c}}$ es el complemento de ${\ Displaystyle S_ {i}}$ con respecto a ${\ Displaystyle \ mathbf {\ {} 1, ... \ ,, n \}}$ y el ${\ Displaystyle \ beta _ {i} (p_ {S_ {i}})}$ se llama el ${\ Displaystyle i ^ {th}}$ función objetivo , o la función objetivo en ${\ Displaystyle S_ {i}}$ . Se puede observar que el cálculo de la ${\ Displaystyle i ^ {th}}$ función objetiva de la manera obvia necesita ${\ Displaystyle Mq_ {1} q_ {2} q_ {3} \ cdots q_ {n}}$ operaciones. Esto es porque hay ${\ Displaystyle q_ {1} q_ {2} \ cdots q_ {n}}$ adiciones y ${\ Displaystyle (M-1) q_ {1} q_ {2} ... q_ {n}}$ multiplicaciones necesarias en el cálculo de la ${\ Displaystyle i ^ {\ text {th}}}$ función objetiva. El algoritmo GDL que se explica en la siguiente sección puede reducir esta complejidad computacional.

El siguiente es un ejemplo del problema de MPF. Dejar ${\ Displaystyle p_ {1}, \, p_ {2}, \, p_ {3}, \, p_ {4},}$ y ${\ Displaystyle p_ {5}}$ ser variables tales que ${\ Displaystyle p_ {1} \ in A_ {1}, p_ {2} \ in A_ {2}, p_ {3} \ in A_ {3}, p_ {4} \ in A_ {4},}$ y ${\ Displaystyle p_ {5} \ en A_ {5}}$ . Aquí ${\ Displaystyle M = 4}$ y ${\ Displaystyle S = \ {\ {1,2,5 \}, \ {2,4 \}, \ {1,4 \}, \ {2 \} \}}$ . Las funciones dadas que utilizan estas variables son ${\ Displaystyle f (p_ {1}, p_ {2}, p_ {5})}$ y ${\ Displaystyle g (p_ {3}, p_ {4})}$ y necesitamos calcular ${\ Displaystyle \ alpha (p_ {1}, \, p_ {4})}$ y ${\ Displaystyle \ beta (p_ {2})}$ definido como:

{\ Displaystyle \ alpha (p_ {1}, \, p_ {4}) = \ Displaystyle \ sum \ limits _ {p_ {2} \ in A_ {2}, \, p_ {3} \ in A_ {3} , \, p_ {5} \ in A_ {5}} f (p_ {1}, \, p_ {2}, \, p_ {5}) \ cdot g (p_ {2}, \, p_ {4} )}

{\ Displaystyle \ beta (p_ {2}) = \ sum \ limits _ {p_ {1} \ in A_ {1}, \, p_ {3} \ in A_ {3}, \, p_ {4} \ in A_ {4}, \, p_ {5} \ in A_ {5}} f (p_ {1}, \, p_ {2}, \, p_ {5}) \ cdot g (p_ {2}, \, p_ {4})}

Aquí los dominios locales y los núcleos locales se definen de la siguiente manera:

dominios locales	núcleos locales
${\ Displaystyle \ {p_ {1}, p_ {2}, p_ {5} \}}$	${\ Displaystyle (f (p_ {1}, p_ {2}, p_ {5})}$
${\ Displaystyle \ {p_ {2}, p_ {4} \}}$	${\ Displaystyle g (p_ {2}, p_ {4})}$
${\ Displaystyle \ {p_ {1}, p_ {4} \}}$	${\ Displaystyle 1}$
${\ Displaystyle \ {p_ {2} \}}$	${\ Displaystyle 1}$

dónde ${\ Displaystyle \ alpha (p_ {1}, p_ {4})}$ es el ${\ Displaystyle 3 ^ {rd}}$ función objetivo y ${\ Displaystyle \ beta (p_ {2})}$ es el ${\ Displaystyle 4 ^ {th}}$ función objetiva.

Considere otro ejemplo donde ${\ Displaystyle p_ {1}, p_ {2}, p_ {3}, p_ {4}, r_ {1}, r_ {2}, r_ {3}, r_ {4} \ in \ {0,1 \ }}$ y ${\ Displaystyle f (r_ {1}, r_ {2}, r_ {3}, r_ {4})}$ es una función de valor real. Ahora, consideraremos el problema MPF donde el semiring conmutativo se define como el conjunto de números reales con suma y multiplicación ordinarias y los dominios locales y los núcleos locales se definen de la siguiente manera:

dominios locales	núcleos locales
${\ Displaystyle \ {r_ {1}, r_ {2}, r_ {3}, r_ {4} \}}$	${\ Displaystyle f (r_ {1}, r_ {2}, r_ {3}, r_ {4})}$
${\ Displaystyle \ {p_ {1}, r_ {1} \}}$	${\ Displaystyle (-1) ^ {p_ {1} r_ {1}}}$
${\ Displaystyle \ {p_ {2}, r_ {2} \}}$	${\ Displaystyle (-1) ^ {p_ {2} r_ {2}}}$
${\ Displaystyle \ {p_ {3}, r_ {3} \}}$	${\ Displaystyle (-1) ^ {p_ {3} r_ {3}}}$
${\ Displaystyle \ {p_ {4}, r_ {4} \}}$	${\ Displaystyle (-1) ^ {p_ {4} r_ {4}}}$
${\ Displaystyle \ {p_ {1}, p_ {2}, p_ {3}, p_ {4} \}}$	${\ Displaystyle 1}$

Ahora, dado que el kernel global se define como el producto de los kernels locales, es

{\ Displaystyle F (p_ {1}, p_ {2}, p_ {3}, p_ {4}, r_ {1}, r_ {2}, r_ {3}, r_ {4}) = f (p_ { 1}, p_ {2}, p_ {3}, p_ {4}) \ cdot (-1) ^ {p_ {1} r_ {1} + p_ {2} r_ {2} + p_ {3} r_ { 3} + p_ {4} r_ {4}}}

y la función objetivo en el dominio local ${\ Displaystyle p_ {1}, p_ {2}, p_ {3}, p_ {4}}$ es

{\ Displaystyle F (p_ {1}, p_ {2}, p_ {3}, p_ {4}) = \ Displaystyle \ sum \ limits _ {r_ {1}, r_ {2}, r_ {3}, r_ {4}} f (r_ {1}, r_ {2}, r_ {3}, r_ {4}) \ cdot (-1) ^ {p_ {1} r_ {1} + p_ {2} r_ {2 } + p_ {3} r_ {3} + p_ {4} r_ {4}}.}

Esta es la transformada de Hadamard de la función ${\ Displaystyle f (\ cdot)}$ . Por tanto, podemos ver que el cálculo de la transformada de Hadamard es un caso especial del problema MPF. Se pueden demostrar más ejemplos para demostrar que el problema MPF forma casos especiales de muchos problemas clásicos como se explicó anteriormente, cuyos detalles se pueden encontrar en ^[1]

GDL: un algoritmo para resolver el problema de MPF

Si uno puede encontrar una relación entre los elementos de un conjunto dado ${\ Displaystyle S}$ , entonces se puede resolver el problema de MPF basándose en la noción de propagación de creencias, que es un uso especial de la técnica de "transmisión de mensajes". La relación requerida es que el conjunto dado de dominios locales se puede organizar en un árbol de unión . En otras palabras, creamos un árbol teórico de grafos con los elementos de ${\ Displaystyle S}$ como los vértices del árbol ${\ Displaystyle T}$ , de modo que para dos vértices arbitrarios cualesquiera digamos ${\ Displaystyle v_ {i}}$ y ${\ Displaystyle v_ {j}}$ dónde ${\ Displaystyle i \ neq j}$ y existe un borde entre estos dos vértices, luego la intersección de las etiquetas correspondientes, a saber ${\ Displaystyle S_ {i} \ cap S_ {j}}$ , es un subconjunto de la etiqueta en cada vértice en la ruta única de ${\ Displaystyle v_ {i}}$ a ${\ Displaystyle v_ {j}}$ .

Por ejemplo,

Ejemplo 1: considere los siguientes nueve dominios locales:

${\ Displaystyle \ {p_ {2} \}}$
${\ Displaystyle \ {p_ {3}, p_ {2} \}}$
${\ Displaystyle \ {p_ {2}, p_ {1} \}}$
${\ Displaystyle \ {p_ {3}, p_ {4} \}}$
${\ Displaystyle \ {p_ {3} \}}$
${\ Displaystyle \ {p_ {1}, p_ {4} \}}$
${\ Displaystyle \ {p_ {1} \}}$
${\ Displaystyle \ {p_ {4} \}}$
${\ Displaystyle \ {p_ {2}, p_ {4} \}}$

Para el conjunto de dominios locales dado anteriormente, uno puede organizarlos en un árbol de unión como se muestra a continuación:

De manera similar, si se da otro conjunto como el siguiente

Ejemplo 2: considere los siguientes cuatro dominios locales:

${\ Displaystyle \ {p_ {1}, p_ {2} \}}$
${\ Displaystyle \ {p_ {2}, p_ {3} \}}$
${\ Displaystyle \ {p_ {3}, p_ {4} \}}$
${\ Displaystyle \ {p_ {1}, p_ {4} \}}$

Entonces, construir el árbol solo con estos dominios locales no es posible ya que este conjunto de valores no tiene dominios comunes que puedan colocarse entre dos valores cualesquiera del conjunto anterior. Pero, sin embargo, si agrega los dos dominios ficticios como se muestra a continuación, organizar el conjunto actualizado en un árbol de unión también sería posible y fácil.

5. ${\ Displaystyle \ {p_ {1}, p_ {2}}$ , ${\ Displaystyle p_ {4} \}}$
6. ${\ Displaystyle \ {p_ {2}, p_ {3}}$ , ${\ Displaystyle p_ {4} \}}$

De manera similar, para este conjunto de dominios, el árbol de unión se ve como se muestra a continuación:

Algoritmo de ley distributiva generalizada (GDL)

Entrada: un conjunto de dominios locales.
Resultado: Para el conjunto de dominios dado, se calcula el número mínimo posible de operaciones que se requieren para resolver el problema.
Así que si ${\ Displaystyle v_ {i}}$ y ${\ Displaystyle v_ {j}}$ están conectados por un borde en el árbol de unión, luego un mensaje de ${\ Displaystyle v_ {i}}$ a ${\ Displaystyle v_ {j}}$ es un conjunto / tabla de valores dados por una función: ${\ Displaystyle \ mu _ {i, j}}$ : ${\ Displaystyle A_ {S_ {i} \ cap S_ {j}} \ rightarrow R}$ . Para empezar con todas las funciones, es decir, para todas las combinaciones de ${\ Displaystyle i}$ y ${\ Displaystyle j}$ en el árbol dado, ${\ Displaystyle \ mu _ {i, j}}$ se define para ser idénticamente ${\ Displaystyle 1}$ y cuando se actualiza un mensaje en particular, sigue la ecuación que se indica a continuación.

{\ Displaystyle \ mu _ {i, j} (p_ {S_ {i} \ cap S_ {j}})}

=

{\ Displaystyle \ sum _ {p_ {S_ {i} \ setminus S_ {j}} \ in A_ {S_ {i} \ setminus S_ {j}}} \ alpha _ {i} (p_ {S_ {i}} ) \ prod _ {{v_ {k} \ operatorname {adj} v_ {i}}, {k \ neq j}} \ mu _ {k, j} (p_ {S_ {k} \ cap S_ {i}} ) (1)}

dónde ${\ Displaystyle v_ {k} \ operatorname {adj} v_ {i}}$ significa que ${\ Displaystyle v_ {k}}$ es un vértice adyacente a ${\ Displaystyle v_ {i}}$ en el árbol.

De manera similar, cada vértice tiene un estado que se define como una tabla que contiene los valores de la función ${\ Displaystyle \ sigma _ {i}: A_ {S_ {i}} \ rightarrow R}$ , Del mismo modo que los mensajes se inicializan en 1 de forma idéntica, el estado de ${\ Displaystyle v_ {i}}$ se define como kernel local ${\ Displaystyle \ alpha (p_ {S_ {i}})}$ , pero cuando sea ${\ Displaystyle \ sigma _ {i}}$ se actualiza, sigue la siguiente ecuación:

{\ Displaystyle \ sigma (p_ {S_ {i}}) = \ alpha _ {i} (p_ {S_ {i}}) \ prod _ {v_ {k} \ operatorname {adj} v_ {i}} \ mu _ {k, j} (p_ {S_ {k} \ cap S_ {i}}) (2).}

Funcionamiento básico del algoritmo

Para el conjunto dado de dominios locales como entrada, averiguamos si podemos crear un árbol de unión, ya sea usando el conjunto directamente o agregando dominios ficticios al conjunto primero y luego creando el árbol de unión, si la unión de construcción no es posible, entonces resultado del algoritmo que no hay forma de reducir el número de pasos para calcular el problema de ecuación dado, pero una vez que tengamos el árbol de unión, el algoritmo tendrá que programar mensajes y calcular estados, al hacer esto podemos saber dónde se pueden reducir los pasos, por lo tanto se analiza esto a continuación.

Programación del paso del mensaje y cálculo del estado.

Hay dos casos especiales de los que vamos a hablar aquí, a saber, problema de vértice único en el que la función objetivo se calcula en un solo vértice ${\ Displaystyle v_ {0}}$ y el segundo es el problema de todos los vértices, donde el objetivo es calcular la función objetivo en todos los vértices.

Comencemos con el problema de un solo vértice , GDL comenzará dirigiendo cada borde hacia el vértice objetivo ${\ Displaystyle v_ {0}}$ . Aquí los mensajes se envían solo en la dirección hacia el vértice objetivo. Tenga en cuenta que todos los mensajes dirigidos se envían solo una vez. Los mensajes se inician desde los nodos hoja (donde el grado es 1) suben hacia el vértice de destino ${\ Displaystyle v_ {0}}$ . El mensaje viaja de las hojas a sus padres y luego de allí a sus padres y así sucesivamente hasta llegar al vértice de destino ${\ Displaystyle v_ {0}}$ . El vértice de destino ${\ Displaystyle v_ {0}}$ calculará su estado solo cuando reciba todos los mensajes de todos sus vecinos. Una vez que tenemos el estado, tenemos la respuesta y, por lo tanto, el algoritmo termina.

Por ejemplo, consideremos un árbol de unión construido a partir del conjunto de dominios locales dado anteriormente, es decir, el conjunto del ejemplo 1,
ahora la tabla de programación para estos dominios es (donde el vértice de destino es ${\ Displaystyle p_ {2}}$ ).

${\ displaystyle {\ text {Mensaje redondo o cálculo de estado}}}$
${\ Displaystyle 1. \ mu _ {8,4} (p_ {4}) = \ alpha _ {8} (p_ {4})}$
${\ Displaystyle 2. \ mu _ {8,4} (p_ {4}) = \ Sigma _ {p_ {2}} \ alpha _ {9} (p_ {2}, p_ {4})}$
${\ Displaystyle 3. \ mu _ {5,2} (p_ {3}) = \ alpha _ {5} (p_ {3})}$
${\ Displaystyle 4. \ mu _ {6,3} (p_ {1}) = \ Sigma _ {p_ {4}} \ alpha _ {6} (p_ {1}, p_ {4})}$
${\ Displaystyle 5. \ mu _ {7,3} (p_ {1}) = \ alpha _ {7} (p_ {1})}$
${\ Displaystyle 6. \ mu _ {4,2} (p_ {3}) = \ Sigma _ {p_ {4}} \ alpha _ {4} (p_ {3}, p_ {4}). \ mu _ {8,4} (p_ {4}). \ Mu _ {9,4} (p_ {4})}$
${\ Displaystyle 7. \ mu _ {3,1} (p_ {2}) = \ Sigma _ {p_ {1}} \ alpha _ {3} (p_ {2}, p_ {1}). \ mu _ {6,3} (p_ {1}). \ Mu _ {7,3} (p_ {1})}$
${\ Displaystyle 8. \ mu _ {2,1} (p_ {2}) = \ Sigma _ {p_ {3}} \ alpha _ {2} (p_ {3}, p_ {2}). \ mu _ {4,2} (p_ {3}). \ Mu _ {5,2} (p_ {3})}$
${\ Displaystyle 9. \ sigma _ {1} (p_ {2}) = \ alpha _ {1} (p_ {2}). \ mu _ {2,1} (p_ {2}). \ mu _ { 3,1} (p_ {2})}$

Por lo tanto, la complejidad de GDL de vértice único se puede mostrar como

${\ Displaystyle \ Sigma _ {v} d (v) | A_ {S _ {(v)}} |}$ operaciones aritméticas
Donde (Nota: La explicación de la ecuación anterior se explica más adelante en el artículo)
${\ Displaystyle S (v)}$ es la etiqueta de ${\ Displaystyle v}$ .
${\ Displaystyle d (v)}$ es el grado de ${\ Displaystyle v}$ (es decir, número de vértices adyacentes av).

Para resolver el problema de todos los vértices , podemos programar GDL de varias maneras, algunas de ellas son implementaciones paralelas donde en cada ronda, cada estado se actualiza y cada mensaje se calcula y transmite al mismo tiempo. En este tipo de implementación, los estados y mensajes se estabilizarán después de un número de rondas que sea como máximo igual al diámetro del árbol. En este punto, todos los estados de los vértices serán iguales a la función objetivo deseada.

Otra forma de programar GDL para este problema es la implementación en serie, donde es similar al problema de vértice único, excepto que no detenemos el algoritmo hasta que todos los vértices de un conjunto requerido no hayan obtenido todos los mensajes de todos sus vecinos y hayan calculado su Expresar.
Por lo tanto, el número de aritmética que requiere esta implementación es como máximo ${\ Displaystyle \ Sigma _ {v \ in V} d (v) | A_ {S _ {(v)}} |}$ operaciones aritmeticas.

Construyendo un árbol de unión

La clave para construir un árbol de unión radica en el gráfico de dominio local ${\ Displaystyle G_ {LD}}$ , que es un gráfico completo ponderado con ${\ Displaystyle M}$ vértices ${\ Displaystyle v_ {1}, v_ {2}, v_ {3}, \ ldots, v_ {M}}$ es decir, uno para cada dominio local, con el peso del borde ${\ Displaystyle e_ {i, j}: v_ {i} \ leftrightarrow v_ {j}}$ definido por
${\ Displaystyle \ omega _ {i, j} = | S_ {i} \ cap S_ {j} |}$ .
Si ${\ Displaystyle x_ {k} \ in S_ {i} \ cap S_ {j}}$ , entonces decimos ${\ Displaystyle x_ {k}}$ está contenido en ${\ Displaystyle e_ {i, j}}$ . Denotado por ${\ Displaystyle \ omega _ {max}}$ (el peso de un árbol de expansión de peso máximo de ${\ Displaystyle G_ {LD}}$ ), que se define por

{\ Displaystyle \ omega ^ {*} = \ Sigma _ {i = 1} ^ {M} | S_ {i} | -n}

donde n es el número de elementos de ese conjunto. Para obtener más claridad y detalles, consulte estos. ^[3]^[4]

Teorema de programación

Dejar ${\ Displaystyle 'T'}$ ser un árbol de unión con un conjunto de vértices ${\ displaystyle 'V'}$ y conjunto de bordes ${\ displaystyle 'E'}$ . En este algoritmo, los mensajes se envían en ambas direcciones en cualquier borde, por lo que podemos decir / considerar el conjunto de bordes E como un conjunto de pares ordenados de vértices. Por ejemplo, de la Figura 1 ${\ displaystyle 'E'}$ se puede definir de la siguiente manera

{\ Displaystyle E = \ {(1,2), (2,1), (1,3), (3,1), (4,2), (2,4), (5,2), ( 2,5), (6,3), (3,6), (7,3), (3,7), (8,4), (4,8), (9,4), (4, 9) \}}

NOTA: ${\ Displaystyle E}$ arriba le da todas las direcciones posibles en las que un mensaje puede viajar en el árbol.

El programa para el GDL se define como una secuencia finita de subconjuntos de ${\ Displaystyle E}$ . Que generalmente está representado por ${\ Displaystyle {\ mathcal {E}} =}$ { ${\ Displaystyle E_ {1}, E_ {2}, E_ {3}, \ ldots, E_ {N}}$ }, Dónde ${\ Displaystyle E_ {N}}$ es el conjunto de mensajes actualizados durante el ${\ Displaystyle N ^ {th}}$ ronda de ejecución del algoritmo.

Habiendo definido / visto algunas notaciones, veremos que el teorema dice, cuando se nos da un horario ${\ Displaystyle {\ mathcal {E}} = \ {E_ {1}, E_ {2}, E_ {3}, \ ldots, E_ {N} \}}$ , el enrejado del mensaje correspondiente es un gráfico dirigido finito con un conjunto de vértices de ${\ Displaystyle V \ times \ {0,1,2,3, \ ldots, N \}}$ , en el que un elemento típico se denota por ${\ Displaystyle v_ {i} (t)}$ por ${\ Displaystyle t \ in \ {0,1,2,3, \ ldots, N \}}$ , Luego, después de completar el paso del mensaje, indique en el vértice ${\ Displaystyle v_ {j}}$ será el ${\ Displaystyle j ^ {\ text {th}}}$ objetivo definido en

{\ Displaystyle \ sigma (p_ {S_ {i}}) = \ alpha _ {i} (p_ {S_ {i}}) \ prod _ {v_ {k} \ operatorname {adj} v_ {i}} \ mu _ {k, j} (p_ {S_ {k} \ cap S_ {i}})}

y si hay un camino desde ${\ Displaystyle v_ {i} (0)}$ a ${\ Displaystyle v_ {j} (N)}$

Complejidad computacional

Aquí intentamos explicar la complejidad de resolver el problema MPF en términos del número de operaciones matemáticas necesarias para el cálculo. es decir, comparamos el número de operaciones necesarias cuando se calcula utilizando el método normal (aquí por método normal nos referimos a métodos que no utilizan el paso de mensajes o árboles de unión en métodos cortos que no utilizan los conceptos de GDL) y el número de operaciones que utilizan la ley distributiva generalizada.

Ejemplo: considere el caso más simple en el que necesitamos calcular la siguiente expresión ${\ Displaystyle ab + ac}$ .

Para evaluar esta expresión ingenuamente se requieren dos multiplicaciones y una suma. La expresión cuando se expresa usando la ley distributiva se puede escribir como ${\ Displaystyle a (b + c)}$ una optimización simple que reduce el número de operaciones a una suma y una multiplicación.

De manera similar al ejemplo explicado anteriormente, expresaremos las ecuaciones en diferentes formas para realizar la menor cantidad de operaciones posible aplicando el GDL.

Como se explicó en las secciones anteriores, resolvemos el problema utilizando el concepto de árboles de unión. La optimización obtenida mediante el uso de estos árboles es comparable a la optimización obtenida al resolver un problema de semigrupo en árboles. Por ejemplo, para encontrar el mínimo de un grupo de números podemos observar que si tenemos un árbol y los elementos están todos en la parte inferior del árbol, entonces podemos comparar el mínimo de dos elementos en paralelo y el mínimo resultante será escrito a los padres. Cuando este proceso se propaga por el árbol, el mínimo del grupo de elementos se encontrará en la raíz.

La siguiente es la complejidad para resolver el árbol de unión usando el paso de mensajes

Reescribimos la fórmula utilizada anteriormente en la siguiente forma. Esta es la ecuación para que un mensaje se envíe desde el vértice v hasta w

{\ Displaystyle \ mu _ {v, w} (p_ {v \ cap w}) = \ sum _ {p_ {v \ setminus w} \ in A_ {S (v) \ setminus S (w)}} \ alpha _ {v} (p_ {v}) \ prod _ {uadjv_ {u \ neq v}} \ mu _ {u, v} (p_ {u \ cap v})}

---- ecuación del mensaje

De manera similar, reescribimos la ecuación para calcular el estado del vértice v de la siguiente manera

{\ Displaystyle \ sigma _ {v} (p_ {v}) = \ alpha _ {v} (p_ {v}) \ prod _ {u \ operatorname {adj} v} \ mu _ {v, w} (p_ {v \ cap w})}

Primero analizaremos el problema de un solo vértice y asumiremos que el vértice objetivo es ${\ Displaystyle v_ {0}}$ y por lo tanto tenemos una ventaja de ${\ Displaystyle v}$ a ${\ Displaystyle v_ {0}}$ . Supongamos que tenemos una ventaja ${\ Displaystyle (v, w)}$ calculamos el mensaje usando la ecuación del mensaje. Calcular ${\ Displaystyle p_ {u \ cap v}}$ requiere

{\ Displaystyle q_ {v \ setminus w} -1}

adiciones y

{\ Displaystyle q_ {v \ setminus w} (d (v) -1)}

multiplicaciones.

(Representamos el ${\ Displaystyle | A_ {S (v) \ S (w)} |}$ como ${\ Displaystyle q_ {v \ setminus w}}$ .)

Pero habrá muchas posibilidades de ${\ Displaystyle x_ {v \ cap w}}$ por eso
${\ Displaystyle q_ {v \ cap w} {\ stackrel {\ mathrm {def}} {=}} | A_ {S (v) \ cap S (w)} |}$ posibilidades para ${\ Displaystyle p_ {v \ cap w}}$ . Por lo tanto, todo el mensaje necesitará

{\ Displaystyle (q_ {v \ cap w}) (q_ {v \ setminus w} -1) = q_ {v} -q_ {v \ cap w}}

adiciones y

{\ Displaystyle (q_ {v \ cap w}) q_ {v \ setminus w}. (re (v) -1) = (re (v) -1) q_ {v}}

multiplicaciones

El número total de operaciones aritméticas necesarias para enviar un mensaje hacia ${\ Displaystyle v_ {0}}$ a lo largo de los bordes del árbol será

{\ Displaystyle \ sum _ {v \ neq v0} (q_ {v} -q_ {v \ cap w})}

adiciones y

{\ Displaystyle \ sum _ {v \ neq v0} (re (v) -1) q_ {v}}

multiplicaciones.

Una vez que se han transmitido todos los mensajes, el algoritmo termina con el cálculo del estado en ${\ Displaystyle v_ {0}}$ El cálculo estatal requiere ${\ Displaystyle d (v_ {0}) q_ {0}}$ más multiplicaciones. Por lo tanto, el número de cálculos necesarios para calcular el estado se da a continuación.

{\ Displaystyle \ sum _ {v \ neq v_ {0}} (q_ {v} -q_ {v \ cap w})}

adiciones y

{\ Displaystyle \ sum _ {v \ neq v_ {0}} (re (v) -1) q_ {v} + re (v_ {0}) q_ {v_ {0}}}

multiplicaciones

Por tanto, el gran total del número de cálculos es

{\ Displaystyle \ chi (T) = \ sum _ {v \ in V} d (v) q_ {v} - \ sum _ {e \ in E} q_ {e}}

----

{\ Displaystyle (1)}

dónde ${\ Displaystyle e = (v, w)}$ es un borde y su tamaño está definido por ${\ Displaystyle q_ {v \ cap w}}$

La fórmula anterior nos da el límite superior.

Si definimos la complejidad del borde ${\ Displaystyle e = (v, w)}$ como

{\ Displaystyle \ chi (e) = q_ {v} + q_ {w} -q_ {v \ cap w}}

Por lo tanto, ${\ Displaystyle (1)}$ Se puede escribir como

{\ Displaystyle \ chi (T) = \ sum _ {e \ in E} \ chi (e)}

Ahora calculamos la complejidad del borde para el problema definido en la Figura 1 de la siguiente manera

{\ Displaystyle \ chi (1,2) = q_ {2} + q_ {2} q_ {3} -q_ {2}}

{\ Displaystyle \ chi (2,4) = q_ {3} q_ {4} + q_ {2} q_ {3} -q_ {3}}

{\ Displaystyle \ chi (2,5) = q_ {3} + q_ {2} q_ {3} -q_ {3}}

{\ Displaystyle \ chi (4,8) = q_ {4} + q_ {3} q_ {4} -q_ {4}}

{\ Displaystyle \ chi (4,9) = q_ {2} q_ {4} + q_ {3} q_ {4} -q_ {4}}

{\ Displaystyle \ chi (1,3) = q_ {2} + q_ {2} q_ {1} -q_ {2}}

{\ Displaystyle \ chi (3,7) = q_ {1} + q_ {1} q_ {2} -q_ {1}}

{\ Displaystyle \ chi (3,6) = q_ {1} q_ {4} + q_ {1} q_ {2} -q_ {1}}

La complejidad total será ${\ Displaystyle 3q_ {2} q_ {3} + 3q_ {3} q_ {4} + 3q_ {1} q_ {2} + q_ {2} q_ {4} + q_ {1} q_ {4} -q_ { 1} -q_ {3} -q_ {4}}$ que es considerablemente bajo en comparación con el método directo. (Aquí por método directo nos referimos a métodos que no utilizan el paso de mensajes. El tiempo que se tarda en utilizar el método directo será el equivalente a calcular el mensaje en cada nodo y el tiempo para calcular el estado de cada uno de los nodos).

Ahora consideramos el problema de todos los vértices donde el mensaje tendrá que enviarse en ambas direcciones y el estado debe calcularse en ambos vértices. Esto tomaría ${\ Displaystyle O (\ sum _ {v} re (v) re (v) q_ {v})}$ pero al precalcular podemos reducir el número de multiplicaciones a ${\ Displaystyle 3 (d-2)}$ . Aquí ${\ Displaystyle d}$ es el grado del vértice. Ej: si hay un conjunto ${\ Displaystyle (a_ {1}, \ ldots, a_ {d})}$ con ${\ Displaystyle d}$ números. Es posible calcular todos los productos d de ${\ Displaystyle d-1}$ de El ${\ Displaystyle a_ {i}}$ con como máximo ${\ Displaystyle 3 (d-2)}$ multiplicaciones en lugar de lo obvio ${\ Displaystyle d (d-2)}$ . Hacemos esto calculando previamente las cantidades ${\ Displaystyle b_ {1} = a_ {1}, b_ {2} = b_ {1} \ cdot a_ {2} = a_ {1} \ cdot a_ {2}, b_ {d-1} = b_ {d -2} \ cdot a_ {d-1} = a_ {1} a_ {2} \ cdots a_ {d-1}}$ y ${\ Displaystyle c_ {d} = a_ {d}, c_ {d-1} = a_ {d-1} c_ {d} = a_ {d-1} \ cdot a_ {d}, \ ldots, c_ {2 } = a_ {2} \ cdot c_ {3} = a_ {2} a_ {3} \ cdots a_ {d}}$ esto toma ${\ Displaystyle 2 (d-2)}$ multiplicaciones. Entonces sí ${\ Displaystyle m_ {j}}$ denota el producto de todos ${\ Displaystyle a_ {i}}$ excepto por ${\ Displaystyle a_ {j}}$ tenemos ${\ Displaystyle m_ {1} = c_ {2}, m_ {2} = b_ {1} \ cdot c_ {3}}$ y así sucesivamente necesitará otro ${\ displaystyle d-2}$ multiplicaciones haciendo el total ${\ Displaystyle 3 (d-2)}$

No hay mucho que podamos hacer cuando se trata de la construcción del árbol de unión, excepto que podemos tener muchos árboles de expansión de peso máximo y deberíamos elegir el árbol de expansión con el menor ${\ Displaystyle \ chi (T)}$ ya veces esto podría significar agregar un dominio local para reducir la complejidad del árbol de unión.

Puede parecer que GDL es correcto solo cuando los dominios locales se pueden expresar como un árbol de unión. Pero incluso en los casos en los que hay ciclos y varias iteraciones, los mensajes serán aproximadamente iguales a la función objetivo. Los experimentos con el algoritmo Gallager-Tanner-Wiberg para códigos de verificación de paridad de baja densidad respaldaron esta afirmación.

Referencias

^ ^a ^b c Aji, SM; McEliece, RJ (marzo de 2000). "La ley distributiva generalizada" (PDF) . Transacciones IEEE sobre teoría de la información . 46 (2): 325–343. doi : 10.1109 / 18.825794 .
^ "ley distributiva" . Encyclopædia Britannica. Encyclopædia Britannica Online . Enciclopedia Británica Inc . Consultado el 1 de mayo de 2012 .
^ "Copia archivada" (PDF) . Archivado desde el original (PDF) el 19 de marzo de 2015 . Consultado el 19 de marzo de 2015 .CS1 maint: copia archivada como título ( enlace ) Los algoritmos del árbol de unión
^ Http://www-anw.cs.umass.edu/~cs691t/SS02/lectures/week7.PDF Archivado 2012-05-26 en la Wayback Machine The Junction Algoritmo del árbol

[GenDistLaw-1] Aji, SM; McEliece, RJ (marzo de 2000). "La ley distributiva generalizada" (PDF) . Transacciones IEEE sobre teoría de la información . 46 (2): 325–343. doi : 10.1109 / 18.825794 .

[Britannica-2] "ley distributiva" . Encyclopædia Britannica. Encyclopædia Britannica Online . Enciclopedia Británica Inc . Consultado el 1 de mayo de 2012 .

[3] "Copia archivada" (PDF) . Archivado desde el original (PDF) el 19 de marzo de 2015 . Consultado el 19 de marzo de 2015 .CS1 maint: copia archivada como título ( enlace ) Los algoritmos del árbol de unión

[4] Http://www-anw.cs.umass.edu/~cs691t/SS02/lectures/week7.PDF Archivado 2012-05-26 en la Wayback Machine The Junction Algoritmo del árbol

[1]