Consulta de rango (estructuras de datos)

En estructuras de datos , una consulta de rango consiste en preprocesar algunos datos de entrada en una estructura de datos para responder de manera eficiente cualquier número de consultas en cualquier subconjunto de la entrada. En particular, hay un grupo de problemas que se han estudiado extensamente donde la entrada es una matriz de números sin clasificar y una consulta consiste en calcular alguna función, como el mínimo, en un rango específico de la matriz.

Definición

Una consulta de rango ${\ Displaystyle q_ {f} (A, i, j)}$ en una matriz ${\ Displaystyle A = [a_ {1}, a_ {2}, .., a_ {n}]}$ de n elementos de algún conjunto $S$ , denotado ${\ Displaystyle A [1, n]}$ , toma dos índices ${\ Displaystyle 1 \ leq i \ leq j \ leq n}$ , una función $f$ definida sobre matrices de elementos de $S$ y salidas ${\ Displaystyle f (A [i, j]) = f (a_ {i}, \ ldots, a_ {j})}$ .

Por ejemplo, para ${\ Displaystyle f = \ sum}$ y ${\ Displaystyle A [1, n]}$ una matriz de números, la consulta de rango ${\ Displaystyle \ sum _ {i, j} A}$ calcula ${\ Displaystyle \ sum A [i, j] = (a_ {i} + \ ldots + a_ {j})}$ , para cualquier ${\ Displaystyle 1 \ leq i \ leq j \ leq n}$ . Estas consultas pueden ser respondidas en tiempo constante y utilizando ${\ Displaystyle O (n)}$ espacio extra calculando las sumas de los primeros $i$ elementos de $A$ y almacenándolos en una matriz auxiliar $B$ , de modo que ${\ Displaystyle B [i]}$ contiene la suma de los primeros $i$ elementos de $A$ para cada ${\ Displaystyle 0 \ leq i \ leq n}$ . Por lo tanto, cualquier consulta se puede responder haciendo ${\ Displaystyle \ sum A [i, j] = B [j] -B [i-1]}$ .

Esta estrategia puede extenderse para todos los operadores de grupo $f$ donde la noción de ${\ displaystyle f ^ {- 1}}$ está bien definido y es fácilmente computable. ^[1] Finalmente, esta solución se puede extender a matrices bidimensionales con un preprocesamiento similar. ^[2]

Ejemplos de

Operadores de semigrupo

Constructing the corresponding Cartesian tree to solve a range minimum query.

Consulta mínima de rango reducida al problema de ancestro común más bajo .

Cuando la función de interés en una consulta de rango es un operador de semigrupo , la noción de ${\ displaystyle f ^ {- 1}}$ no siempre está definida, por lo que la estrategia de la sección anterior no funciona. Andrew Yao demostró ^[3] que existe una solución eficiente para consultas de rango que involucran operadores de semigrupo. Demostró que para cualquier $c$ constante , un preprocesamiento de tiempo y espacio ${\ Displaystyle \ theta (c \ cdot n)}$ permite responder consultas de rango en listas donde $f$ es un operador de semigrupo en ${\ Displaystyle \ theta (\ alpha _ {c} (n))}$ tiempo, donde ${\ Displaystyle \ alpha _ {k}}$ es un cierto inverso funcional de la función de Ackermann .

Hay algunos operadores de semigrupo que admiten soluciones ligeramente mejores. Por ejemplo cuando ${\ Displaystyle f \ in \ {\ max, \ min \}}$ . Asumir ${\ Displaystyle f = \ min}$ luego ${\ Displaystyle \ min (A [1..n])}$ devuelve el índice del elemento mínimo de ${\ Displaystyle A [1..n]}$ . Luego ${\ Displaystyle \ min _ {i, j} (A)}$ denota la consulta de rango mínimo correspondiente. Existen varias estructuras de datos que permiten responder una consulta mínima de rango en ${\ Displaystyle O (1)}$ tiempo usando un preprocesamiento de tiempo y espacio ${\ Displaystyle O (n)}$ . Una de estas soluciones se basa en la equivalencia entre este problema y el problema del antepasado común más bajo .

El árbol cartesiano ${\ Displaystyle T_ {A}}$ de una matriz ${\ Displaystyle A [1, n]}$ tiene como raíz ${\ Displaystyle a_ {i} = \ min \ {a_ {1}, a_ {2}, \ ldots, a_ {n} \}}$ y como subárboles izquierdo y derecho el árbol cartesiano de ${\ Displaystyle A [1, i-1]}$ y el árbol cartesiano de ${\ Displaystyle A [i + 1, n]}$ respectivamente. Una consulta mínima de rango ${\ Displaystyle \ min _ {i, j} (A)}$ es el antepasado común más bajo en ${\ Displaystyle T_ {A}}$ de ${\ Displaystyle a_ {i}}$ y ${\ Displaystyle a_ {j}}$ . Porque el antepasado común más bajo se puede resolver en tiempo constante utilizando un preprocesamiento de tiempo y espacio. ${\ Displaystyle O (n)}$ , la consulta mínima de rango también puede. La solución cuando ${\ Displaystyle f = \ max}$ es análogo. Los árboles cartesianos se pueden construir en tiempo lineal .

Modo

El modo de una matriz A es el elemento que aparece más en A . Por ejemplo, el modo de ${\ Displaystyle A = [4,5,6,7,4]}$ es 4 . En caso de empates, se puede elegir como modo cualquiera de los elementos más frecuentes. Una consulta en modo de rango consiste en preprocesar ${\ Displaystyle A [1, n]}$ de modo que podamos encontrar el modo en cualquier rango de ${\ Displaystyle A [1, n]}$ . Se han ideado varias estructuras de datos para resolver este problema, resumimos algunos de los resultados en la siguiente tabla. ^[1]

Consultas de modo de rango
Espacio	Tiempo de consulta	Restricciones
${\ Displaystyle O (n ^ {2-2 \ epsilon})}$	${\ Displaystyle O (n ^ {\ epsilon} \ log n)}$	${\ Displaystyle 0 \ leq \ epsilon \ leq {\ frac {1} {2}}}$
${\ Displaystyle O \ left ({\ frac {n ^ {2} \ log \ log n} {\ log n}} \ right)}$	${\ Displaystyle O (1)}$

Recientemente, Jørgensen et al. demostró un límite inferior en el modelo de sonda celular de ${\ Displaystyle \ Omega \ left ({\ tfrac {\ log n} {\ log (Sw / n)}} \ right)}$ para cualquier estructura de datos que utilice celdas $S.$ ^[4]

Mediana

Este caso particular es de especial interés ya que encontrar la mediana tiene varias aplicaciones. ^[5] Por otro lado, el problema de la mediana, un caso especial del problema de selección , se puede resolver en O ( n ), utilizando el algoritmo de la mediana de las medianas . ^[6] Sin embargo, su generalización a través de consultas de mediana de rango es reciente. ^[7] Una consulta de mediana de rango ${\ Displaystyle \ operatorname {mediana} (A, i, j)}$ donde A, i y j tienen los significados habituales devuelve el elemento mediano de ${\ Displaystyle A [i, j]}$ . Equivalentemente, ${\ Displaystyle \ operatorname {mediana} (A, i, j)}$ debería devolver el elemento de ${\ Displaystyle A [i, j]}$ de rango ${\ Displaystyle {\ frac {ji} {2}}}$ . Las consultas de mediana de rango no se pueden resolver siguiendo ninguno de los métodos anteriores discutidos anteriormente, incluido el enfoque de Yao para operadores de semigrupo. ^[8]

Se han estudiado dos variantes de este problema, la versión offline , donde todas las k consultas de interés se dan en un lote, y una versión donde todo el preprocesamiento se realiza por adelantado. La versión fuera de línea se puede resolver con ${\ Displaystyle O (n \ log k + k \ log n)}$ tiempo y ${\ Displaystyle O (n \ log k)}$ espacio.

El siguiente pseudocódigo del algoritmo de selección rápida muestra cómo encontrar el elemento de rango $r$ en ${\ Displaystyle A [i, j]}$ una matriz sin clasificar de elementos distintos, para encontrar las medianas de rango que establecemos ${\ Displaystyle r = {\ frac {ji} {2}}}$ . ^[7]

rangeMedian (A, i, j, r) { if A.length () == 1 return A [1] si A.low no está definido, entonces m = mediana (A) A.bajo = [e en A | e <= m] A. alto = [e en A | e> m] calcule t el número de elementos de A [i, j] que pertenecen a A.low si r <= t, entonces  devuelve rangeMedian (A.low, i, j, r) de lo contrario,  devuelve rangeMedian (A.high, i, j, rt)}

El procedimiento rangeMediandivide A, usando Ala mediana de ', en dos matrices A.lowy A.high, donde la primera contiene los elementos de Aque son menores o iguales que la mediana my la última el resto de los elementos de A. Si sabemos que el número de elementos de ${\ Displaystyle A [i, j]}$ que terminan en A.lowes ty este número es mayor de lo rque deberíamos seguir buscando el elemento de rango ren A.low; de lo contrario deberíamos buscar el elemento de rango ${\ Displaystyle (rt)}$ en A.high. Para encontrar $t$ , es suficiente encontrar el índice máximo ${\ Displaystyle m \ leq i-1}$ tal que ${\ Displaystyle a_ {m}}$ está en A.lowy el índice máximo ${\ Displaystyle l \ leq j}$ tal que ${\ Displaystyle a_ {l}}$ está en A.high. Luego ${\ Displaystyle t = lm}$ . El costo total de cualquier consulta, sin considerar la parte de partición, es ${\ Displaystyle \ log n}$ ya que a lo sumo ${\ Displaystyle \ log n}$ Se realizan llamadas de recursividad y solo se realiza un número constante de operaciones en cada una de ellas (para obtener el valor de $t se$ debe usar una cascada fraccional ). Si se usa un algoritmo lineal para encontrar las medianas, el costo total de preprocesamiento para consultas de medianas de rango $k$ es ${\ Displaystyle n \ log k}$ . El algoritmo también se puede modificar para resolver la versión en línea del problema. ^[7]

Problemas relacionados

Todos los problemas descritos anteriormente han sido estudiados para dimensiones superiores así como sus versiones dinámicas. Por otro lado, las consultas de rango pueden extenderse a otras estructuras de datos como árboles , ^[8] como el problema del ancestro de nivel . Una familia similar de problemas son las consultas de rango ortogonal , también conocidas como consultas de recuento.

Ver también

Referencias

↑ ^a ^b Krizanc, Danny; Morin, Pat ; Smid, Michiel HM (2003). "Consultas de modo de rango y mediana de rango en listas y árboles" . ISAAC : 517–526. arXiv : cs / 0307034 .
^ Meng, He; Munro, J. Ian; Nicholson, Patrick K. (2011). "Selección de rango dinámico en espacio lineal". ISAAC : 160–169.
^ Yao, A. C (1982). "Compensación de espacio-tiempo para responder consultas de rango". E XIV Simposio anual de ACM sobre teoría de la computación : 128-136.
^ Greve, M; J {\ o} rgensen, A .; Larsen, K .; Truelsen, J. (2010). "Límites inferiores de la sonda de celda y aproximaciones para el modo de rango". Autómatas, lenguajes y programación : 605–616.
^ Har-Peled, Sariel ; Muthukrishnan, S. (2008). "Medianas de rango". ESA : 503–514.
^ Blum, M .; Floyd, RW ; Pratt, VR ; Rivest, RL ; Tarjan, RE (agosto de 1973). "Plazos de selección" (PDF) . Revista de Ciencias de la Computación y Sistemas . 7 (4): 448–461. doi : 10.1016 / S0022-0000 (73) 80033-9 .
^ a b c Beat, Gfeller; Sanders, Peter (2009). "Hacia las medianas de rango óptimo". Icalp (1) : 475–486.
^ a b Bose, P ; Kranakis, E .; Morin, P .; Tang, Y. (2005). "Consultas de modo de rango aproximado y mediana de rango" . En Actas del 22º Simposio sobre aspectos teóricos de la informática (STACS 2005), Volumen 3404 de Lecture Notes in ComputerScience : 377–388.

enlaces externos

Estructura de datos abierta - Capítulo 13 - Estructuras de datos para enteros
Estructuras de datos para consultas de mediana de rango: Gerth Stolting Brodal y Allan Gronlund Jorgensen

[morin-1] Krizanc, Danny; Morin, Pat ; Smid, Michiel HM (2003). "Consultas de modo de rango y mediana de rango en listas y árboles" . ISAAC : 517–526. arXiv : cs / 0307034 .

[menhe-2] Meng, He; Munro, J. Ian; Nicholson, Patrick K. (2011). "Selección de rango dinámico en espacio lineal". ISAAC : 160–169.

[yao-3] Yao, A. C (1982). "Compensación de espacio-tiempo para responder consultas de rango". E XIV Simposio anual de ACM sobre teoría de la computación : 128-136.

[jorgensen-4] Greve, M; J {\ o} rgensen, A .; Larsen, K .; Truelsen, J. (2010). "Límites inferiores de la sonda de celda y aproximaciones para el modo de rango". Autómatas, lenguajes y programación : 605–616.

[heriel-5] Har-Peled, Sariel ; Muthukrishnan, S. (2008). "Medianas de rango". ESA : 503–514.

[tarjanmedian-6] Blum, M .; Floyd, RW ; Pratt, VR ; Rivest, RL ; Tarjan, RE (agosto de 1973). "Plazos de selección" (PDF) . Revista de Ciencias de la Computación y Sistemas . 7 (4): 448–461. doi : 10.1016 / S0022-0000 (73) 80033-9 .

[ethpaper-7] Beat, Gfeller; Sanders, Peter (2009). "Hacia las medianas de rango óptimo". Icalp (1) : 475–486.

[morin_kranakis-8] Bose, P ; Kranakis, E .; Morin, P .; Tang, Y. (2005). "Consultas de modo de rango aproximado y mediana de rango" . En Actas del 22º Simposio sobre aspectos teóricos de la informática (STACS 2005), Volumen 3404 de Lecture Notes in ComputerScience : 377–388.

[1]