Algoritmos de árbol basados en uniones

En informática , los algoritmos de árbol basados en uniones son una clase de algoritmos para árboles de búsqueda binaria autoequilibrados . Este marco tiene como objetivo diseñar algoritmos altamente paralelizados para varios árboles de búsqueda binarios balanceados. El marco algorítmico se basa en una única operación conjunta . ^[1] Bajo este marco, la operación de unión captura todos los criterios de equilibrio de diferentes esquemas de equilibrio, y todas las demás funciones de unión tienen una implementación genérica en diferentes esquemas de equilibrio. Los algoritmos basados en uniones se pueden aplicar a al menos cuatro esquemas de equilibrio: árboles AVL , árboles rojo-negro, árboles y treaps de peso equilibrado .

La unión ${\ Displaystyle (L, k, R)}$ la operación toma como entrada dos árboles binarios balanceados ${\ Displaystyle L}$ y ${\ Displaystyle R}$ del mismo esquema de equilibrio, y una clave ${\ Displaystyle k}$ , y genera un nuevo árbol binario balanceado ${\ Displaystyle t}$ cuyo recorrido en orden es el recorrido en orden de ${\ Displaystyle L}$ , luego ${\ Displaystyle k}$ entonces el recorrido en orden de ${\ Displaystyle R}$ . En particular, si los árboles son árboles de búsqueda , lo que significa que el orden de los árboles mantiene un orden total en las claves, debe satisfacer la condición de que todas las claves en ${\ Displaystyle L}$ son más pequeños que ${\ Displaystyle k}$ y todas las llaves en ${\ Displaystyle R}$ son mayores que ${\ Displaystyle k}$ .

Historia

La operación de unión fue definida por primera vez por Tarjan ^[2] en árboles rojo-negro , que se ejecuta en el peor de los casos logarítmicos. Más tarde, Sleator y Tarjan ^[3] describieron un algoritmo de unión para árboles de splay que se ejecuta en tiempo logarítmico amortizado. Más tarde, Adams ^[4] extendió la unión a árboles con balance de peso y la usó para funciones de conjunto-conjunto rápidas que incluyen unión , intersección y diferencia de conjunto . En 1998, Blelloch y Reid-Miller ampliaron la combinación en treaps y demostraron que el límite de las funciones de conjunto era ${\ Displaystyle O (m \ log (1 + {\ frac {n} {m}}))}$ para dos árboles de tamaño ${\ Displaystyle m}$ y ${\ Displaystyle n (\ geq m)}$ , que es óptimo en el modelo de comparación. También mencionaron el paralelismo en el algoritmo de Adams mediante el uso de un esquema de divide y vencerás . En 2016, Blelloch et al. propuso formalmente los algoritmos basados en unión y formalizó el algoritmo de unión para cuatro esquemas de equilibrio diferentes: árboles AVL , árboles rojo-negro , árboles de peso equilibrado y treaps . En el mismo trabajo, demostraron que los algoritmos de Adams sobre unión, intersección y diferencia son óptimos para el trabajo en los cuatro esquemas de equilibrio.

Unir algoritmos

La función unirse ${\ Displaystyle (t_ {1}, k, t_ {2})}$ considera reequilibrar el árbol y, por lo tanto, depende del esquema de equilibrio de entrada. Si los dos árboles están equilibrados, join simplemente crea un nuevo nodo con el subárbol izquierdo $t 1$ , la raíz $k$ y el subárbol derecho $t 2$ . Suponga que $t 1$ es más pesado (este "más pesado" depende del esquema de equilibrio) que $t 2$ (el otro caso es simétrico). La unión sigue la espina dorsal derecha de $t 1$ hasta un nodo $c$ que está equilibrado con $t 2$ . En este punto, se crea un nuevo nodo con el hijo izquierdo $c$ , la raíz $k$ y el hijo derecho $t 2$ para reemplazar c. El nuevo nodo puede invalidar el invariante de equilibrio. Esto se puede arreglar con rotaciones.

A continuación se muestran los algoritmos de unión en diferentes esquemas de equilibrio.

El algoritmo de unión para árboles AVL :

función joinRightAVL (T _L , k, T _R ) (l, k ', c) = exponer (T _L ) si (h (c) <= h (T _R ) + 1) T '= Nodo (c, k, T _R ) si (h (T ') <= h (l) + 1) entonces devuelve Node (l, k', T ') else return rotateLeft (Node (l, k ', rotateRight (T'))) else T '= joinRightAVL (c, k, T _R ) T = Nodo (l, k ', T')  si (h (T ') <= h (l) + 1) devuelve T else  return rotateLeft (T ) función joinLeftAVL (T _L , k, T _R ) / * simétrico para joinRightAVL * /función join (T _L , k, T _R ) if (h (T _L )> h (T _R ) + 1) return joinRightAVL (T _L , k, T _R ) if (h (T _R )> h (T _L ) + 1) return joinLeftAVL (T _L , k, T _R ) return Node (T _L , k, T _R )

Aquí ${\ Displaystyle h (v)}$ de un nodo ${\ Displaystyle v}$ la altura de ${\ Displaystyle v}$ . exponer (v) = (l, k, r) significa extraer un nodo de árbol ${\ Displaystyle v}$ hijo dejado ${\ Displaystyle l}$ , la clave del nodo ${\ Displaystyle k}$ y el niño adecuado ${\ Displaystyle r}$ . Node (l, k, r) significa crear un nodo de hijo izquierdo ${\ Displaystyle l}$ , clave ${\ Displaystyle k}$ , y el niño correcto ${\ Displaystyle r}$ .

El algoritmo de unión para árboles rojo-negro :

función joinRightRB (T _L , k, T _R ) si r (T _L ) = ⌊r (T _L ) / 2⌋ × 2: return Node (T _L , ⟨k, red⟩, T _R ) else (L ', ⟨K ', c'⟩, R') = exponer (T _L ) T '= Nodo (L', ⟨k ', c'⟩, joinRightRB (R', k, T _R ) si (c '= negro) y (T'.right.color = T'.right.right.color = rojo): T'.right.right.color = negro return rotateLeft (T ') else return T' function joinLeftRB (T _L , k, T _R ) / * simétrico para joinRightRB * /función join (T _L , k, T _R ) si ⌊r (T _L ) / 2⌋> ⌊r (T _R ) / 2⌋ × 2: T '= joinRightRB (T _L , k, T _R ) si (T'.color = red) y (T'.right.color = red): T'.color = negro volver T ' de lo contrario, si ⌊r (T _L ) / 2⌋> ⌊r (T _L ) / 2⌋ × 2 / * simétrico * / si no (T _L .color = negro) y (T _R = negro) Nodo (T _L , ⟨k, red⟩, T _R ) más Nodo (T _L , ⟨k, black⟩, T _R )

Aquí ${\ Displaystyle r (v)}$ de un nodo ${\ Displaystyle v}$ significa el doble de la altura negra de un nodo negro y el doble de la altura negra de un nodo rojo. exponer (v) = (l, ⟨k, c⟩, r) significa extraer un nodo de árbol ${\ Displaystyle v}$ hijo dejado ${\ Displaystyle l}$ , la clave del nodo ${\ Displaystyle k}$ , el color del nodo ${\ Displaystyle c}$ y el niño adecuado ${\ Displaystyle r}$ . Node (l, ⟨k, c⟩, r) significa crear un nodo de hijo izquierdo ${\ Displaystyle l}$ , clave ${\ Displaystyle k}$ , color ${\ Displaystyle c}$ y niño correcto ${\ Displaystyle r}$ .

El algoritmo de unión para árboles con peso equilibrado :

función joinRightWB (T _L , k, T _R ) (l, k ', c) = exponer (T _L ) if balance (| T _L |, | T _L |) return Node (T _L , k, T _R ) else T' = joinRightWB (c, k, T _R ) (l ₁ , k ₁ , r ₁ ) = exponer (T ') if (balance (l, T')) return Node (l, k ', T') else if (balance (| l |, | l ₁ | ) y balance (| l | + | l ₁ |, | r ₁ |)) return rotateLeft (Node (l, k ', T')) else return rotateLeft (Node (l, k ', rotateRight (T')) función joinLeftWB (T _L , k, T _R ) / * simétrico para joinRightWB * /función join (T _L , k, T _R ) if (heavy (T _L , T _R )) return joinRightWB (T _L , k, T _R ) if (heavy (T _R , T _L )) return joinLeftWB (T _L , k, T _R ) Nodo (T _L , k, T _R )

Aquí equilibrio ${\ Displaystyle (x, y)}$ significa dos pesos ${\ Displaystyle x}$ y ${\ Displaystyle y}$ están equilibrados. exponer (v) = (l, k, r) significa extraer un nodo de árbol ${\ Displaystyle v}$ hijo dejado ${\ Displaystyle l}$ , la clave del nodo ${\ Displaystyle k}$ y el niño adecuado ${\ Displaystyle r}$ . Node (l, k, r) significa crear un nodo de hijo izquierdo ${\ Displaystyle l}$ , clave ${\ Displaystyle k}$ y niño correcto ${\ Displaystyle r}$ .

Algoritmos basados en uniones

A continuación, exponer (v) = (l, k, r) significa extraer un nodo de árbol ${\ Displaystyle v}$ hijo dejado ${\ Displaystyle l}$ , la clave del nodo ${\ Displaystyle k}$ y el niño adecuado ${\ Displaystyle r}$ . Node (l, k, r) significa crear un nodo de hijo izquierdo ${\ Displaystyle l}$ , clave ${\ Displaystyle k}$ y niño correcto ${\ Displaystyle r}$ . derecho( ${\ Displaystyle v}$ ) E izquierda( ${\ Displaystyle v}$ ) extrae el hijo derecho y el hijo izquierdo de un nodo de árbol ${\ Displaystyle v}$ , respectivamente. ${\ Displaystyle k (v)}$ extraer la clave de un nodo ${\ Displaystyle v}$ . Muchos de los algoritmos basados en combinaciones son paralelos. " ${\ Displaystyle s_ {1} || s_ {2}}$ "significa que dos declaraciones ${\ Displaystyle s_ {1}}$ y ${\ Displaystyle s_ {2}}$ puede funcionar en paralelo.

Separar

Para dividir un árbol en dos árboles, los más pequeños que la clave x y los más grandes que la clave x , primero dibujamos una ruta desde la raíz insertando x en el árbol. Después de esta inserción, todos los valores menores que x se encontrarán a la izquierda de la ruta, y todos los valores mayores que x se encontrarán a la derecha. Al aplicar Join , todos los subárboles del lado izquierdo se fusionan de abajo hacia arriba usando claves en la ruta como nodos intermedios de abajo hacia arriba para formar el árbol de la izquierda, y la parte derecha es asimétrica. Para algunas aplicaciones, Split también devuelve un valor booleano que indica si x aparece en el árbol. El costo de Split es ${\ Displaystyle O (\ log n)}$ , orden de la altura del árbol.

El algoritmo de división es el siguiente:

función split (T, k) if (T = nil) return (nil, false, nil) (L, m, R) = exponer (T) si (k = m) devuelve (L, verdadero, R) si (k ) (L ', b, R') = dividir (L, k) return (L ', b, join (R', m, R)) si (k> m) (L ', b, R') = dividir (R, k) volver (unirse (L, m, L '), b, R'))

Join2

Esta función se define de forma similar a join pero sin la tecla del medio. Primero divide la última clave ${\ Displaystyle k}$ del árbol de la izquierda, y luego une la parte restante del árbol de la izquierda con el árbol de la derecha con ${\ Displaystyle k}$ . El algoritmo es como sigue:

función splitLast (T) (L, k, R) = exponer (T) si (R = nulo) devuelve (L, k) (T ', k') = splitLast (R) return (join (L, k, T '), k') función join2 (L, R) if (L = nil) return R (L ', k) = splitLast (L) volver unirse (L ', k, R)

El precio es ${\ Displaystyle O (\ log n)}$ para un árbol de tamaño ${\ Displaystyle n}$ .

Insertar y eliminar

Los algoritmos de inserción y eliminación, al hacer uso de la combinación, pueden ser independientes de los esquemas de equilibrio. Para una inserción, el algoritmo compara la clave que se insertará con la clave en la raíz, la inserta en el subárbol izquierdo / derecho si la clave es más pequeña / mayor que la clave en la raíz y une los dos subárboles con la raíz. . Una eliminación compara la clave que se eliminará con la clave en la raíz. Si son iguales, devuelve join2 en los dos subárboles. De lo contrario, elimine la clave del subárbol correspondiente y vuelva a unir los dos subárboles con la raíz. Los algoritmos son los siguientes:

función insertar (T, k) si (T = nil) return Node (nil, k, nil) (L, k ', R) = exponer (T) if (k return join (insert (L, k), k', R) if (k> k ') return join (L, k', insert (R, k)) return T función eliminar (T , k) si (T = nil) devuelve nil (L, k ', R) = exponer (T) if (k return join (eliminar (L, k), k', R) if (k> k ') return join (L, k', delete (R, k)) return join2 (L, R )

Tanto la inserción como la eliminación requieren ${\ Displaystyle O (\ log n)}$ tiempo si ${\ Displaystyle | T | = n}$ .

Funciones set-set

Se han definido varias operaciones de conjuntos en árboles de peso equilibrado: unión , intersección y diferencia de conjuntos . La unión de dos árboles de equilibrado de peso- $T 1$ y $T 2$ que representa conjuntos $A$ y $B$ , es un árbol $t$ que representa $A \cup B$ . La siguiente función recursiva calcula esta unión:

unión de funciones (t ₁ , t ₂ ): si t ₁ = nil: devuelve t ₂ si t ₂ = nil: devuelve t ₁ (t _< , b, t _> ) = divide t ₂ en t ₁ .root nl = unión (izquierda (t ₁ ), t _< ) || nr = union (right (t ₁ ), t _> ) return join (nl, t ₁ .root, nr)

De manera similar, los algoritmos de intersección y diferencia de conjuntos son los siguientes:

intersección de funciones (t ₁ , t ₂ ): si (t ₁ = nil o t ₂ = nil) devuelve nil (t _< , b, t _> ) = dividir t ₂ en t ₁ .root nl = intersección (izquierda (t ₁ ), t _< ) || nr = intersección (right (t ₁ ), t _> ) if (b) return join (nl, t ₁ .root, nr) else  return join2 (nl, nr) función diferencia (t ₁ , t ₂ ): if (t ₁ = nil) devuelve nil si (t ₂ = nil) devuelve t ₁ (t _< , b, t _> ) = divide t ₂ en t ₁ .root nl = diferencia (izquierda (t ₁ ), t _< ) || nr = diferencia (derecha (t ₁ ), t _> ) return join2 (nl, nr)

La complejidad de cada unión, intersección y diferencia es ${\ Displaystyle O \ left (m \ log \ left ({n \ over m} +1 \ right) \ right)}$ para dos árboles de tamaño equilibrado en peso ${\ Displaystyle m}$ y ${\ Displaystyle n (\ geq m)}$ . Esta complejidad es óptima en términos del número de comparaciones. Más importante aún, dado que las llamadas recursivas a unión, intersección o diferencia son independientes entre sí, se pueden ejecutar en paralelo con una profundidad paralela. ${\ Displaystyle O (\ log m \ log n)}$ . ^[1] Cuando ${\ Displaystyle m = 1}$ , la implementación basada en uniones aplica el mismo cálculo que en una inserción o eliminación de un solo elemento si la raíz del árbol más grande se usa para dividir el árbol más pequeño.

Construir

El algoritmo para construir un árbol puede hacer uso del algoritmo de unión y usar el esquema de divide y vencerás:

función build (A [], n): if (n = 0) return nil if (n = 1) return Node (nil, A [0], nil) L = construcción (A, n / 2) || R = (A + n / 2, nn / 2) unión de retorno (L, R)

Este algoritmo cuesta ${\ Displaystyle O (n \ log n)}$ trabaja y tiene ${\ Displaystyle O (\ log ^ {3} n)}$ profundidad. Un algoritmo más eficiente utiliza un algoritmo de clasificación en paralelo.

función buildSorted (A [], n): if (n = 0) return nil if (n = 1) return Node (nil, A [0], nil) L = construcción (A, n / 2) || R = (A + n / 2 + 1, nn / 2-1) return join (L, A [n / 2], R) función build (A [], n): A '= ordenar (A, n) devolver buildSorted (A, n)

Este algoritmo cuesta ${\ Displaystyle O (n \ log n)}$ trabaja y tiene ${\ Displaystyle O (\ log n)}$ profundidad asumiendo que el algoritmo de clasificación tiene ${\ Displaystyle O (n \ log n)}$ trabaja y ${\ Displaystyle O (\ log n)}$ profundidad.

Filtrar

Esta función selecciona todas las entradas en un árbol que satisfacen un indicador ${\ Displaystyle f}$ y devuelve un árbol que contiene todas las entradas seleccionadas. Filtra recursivamente los dos subárboles y los une con la raíz si la raíz satisface ${\ Displaystyle f}$ , de lo contrario une2 los dos subárboles.

función filtro (T, f): si (T = nil) devuelve nil L = filtro (izquierda (T), f) || R = (derecha (T), f) if (f (k (T)) return join (L, k (T), R) de lo contrario  regresa join2 (L, R)

Este algoritmo cuesta trabajo ${\ Displaystyle O (n)}$ y profundidad ${\ Displaystyle O (\ log n)}$ en un árbol de tamaño ${\ Displaystyle n}$ , asumiendo ${\ Displaystyle f}$ tiene costo constante.

Utilizado en bibliotecas

Los algoritmos basados en uniones se aplican para admitir interfaces para conjuntos , mapas y mapas aumentados ^[5] en bibliotecas como Hackage , SML / NJ y PAM . ^[5]

Notas

Referencias

^ ^a b Blelloch, Guy E .; Ferizovic, Daniel; Sun, Yihan (2016), "Just Join for Parallel Ordered Sets", Simposio sobre arquitecturas y algoritmos paralelos, Proc. de 28a ACM Symp. Algoritmos y arquitecturas paralelas (SPAA 2016) , ACM, págs. 253–264, arXiv : 1602.02120 , doi : 10.1145 / 2935764.2935768 , ISBN 978-1-4503-4210-0
^ Tarjan, Robert Endre (1983), "Estructuras de datos y algoritmos de red", Estructuras de datos y algoritmos de red , Siam, págs. 45–56
^ Sleator, Daniel Dominic; Tarjan, Robert Endre (1985), "Árboles de búsqueda binarios autoajustables", Journal of the ACM , Siam
^ Adams, Stephen (1992), "Implementar conjuntos de manera eficiente en un lenguaje funcional", Implementar conjuntos de manera eficiente en un lenguaje funcional , Citeseer, CiteSeerX 10.1.1.501.8427.
^ a b Blelloch, Guy E .; Ferizovic, Daniel; Sun, Yihan (2018), "PAM: mapas aumentados paralelos", Actas del 23º Simposio ACM SIGPLAN sobre Principios y Práctica de la Programación Paralela , ACM, págs. 290–304

enlaces externos

PAM , la biblioteca de mapas aumentada paralela
Hackage , contenedores en Hackage

[join-based-1] Blelloch, Guy E .; Ferizovic, Daniel; Sun, Yihan (2016), "Just Join for Parallel Ordered Sets", Simposio sobre arquitecturas y algoritmos paralelos, Proc. de 28a ACM Symp. Algoritmos y arquitecturas paralelas (SPAA 2016) , ACM, págs. 253–264, arXiv : 1602.02120 , doi : 10.1145 / 2935764.2935768 , ISBN 978-1-4503-4210-0

[join-tarjan-2] Tarjan, Robert Endre (1983), "Estructuras de datos y algoritmos de red", Estructuras de datos y algoritmos de red , Siam, págs. 45–56

[splaytree-3] Sleator, Daniel Dominic; Tarjan, Robert Endre (1985), "Árboles de búsqueda binarios autoajustables", Journal of the ACM , Siam

[adams-4] Adams, Stephen (1992), "Implementar conjuntos de manera eficiente en un lenguaje funcional", Implementar conjuntos de manera eficiente en un lenguaje funcional , Citeseer, CiteSeerX 10.1.1.501.8427.

[pam-5] Blelloch, Guy E .; Ferizovic, Daniel; Sun, Yihan (2018), "PAM: mapas aumentados paralelos", Actas del 23º Simposio ACM SIGPLAN sobre Principios y Práctica de la Programación Paralela , ACM, págs. 290–304

[1]

Algoritmos de árbol basados ​​en uniones