Colación


La intercalación es el ensamblaje de información escrita en un orden estándar. Muchos sistemas de clasificación se basan en orden numérico o alfabético , o extensiones y combinaciones de los mismos. La recopilación es un elemento fundamental de la mayoría de los sistemas de archivo de oficina , catálogos de bibliotecas y libros de referencia .

La colación se diferencia de la clasificación en que las clases en sí mismas no están necesariamente ordenadas. Sin embargo, incluso si el orden de las clases es irrelevante, los identificadores de las clases pueden ser miembros de un conjunto ordenado, lo que permite que un algoritmo de clasificación organice los elementos por clase.

Hablando formalmente, un método de intercalación típicamente define un orden total en un conjunto de identificadores posibles, llamados claves de clasificación, que consecuentemente produce un preorden total en el conjunto de elementos de información (los elementos con el mismo identificador no se colocan en ningún orden definido).

Un algoritmo de clasificación, como el algoritmo de clasificación Unicode, define un orden mediante el proceso de comparar dos cadenas de caracteres determinadas y decidir cuál debe ir antes que la otra. Cuando se ha definido un pedido de esta manera, se puede utilizar un algoritmo de clasificación para poner una lista de cualquier número de elementos en ese orden.

La principal ventaja de la intercalación es que hace que sea rápido y fácil para un usuario encontrar un elemento en la lista o confirmar que está ausente de la lista. En los sistemas automáticos, esto se puede hacer mediante un algoritmo de búsqueda binaria o una búsqueda por interpolación ; La búsqueda manual se puede realizar utilizando un procedimiento más o menos similar, aunque a menudo esto se hará inconscientemente. Otras ventajas son que uno puede encontrar fácilmente el primer o el último elemento de la lista (lo más probable es que sea útil en el caso de datos ordenados numéricamente), o elementos en un rango dado (útil nuevamente en el caso de datos numéricos, y también con datos ordenados alfabéticamente cuando uno puede estar seguro de solo las primeras letras del artículo o artículos buscados).

Las cadenas que representan números se pueden ordenar en función de los valores de los números que representan. Por ejemplo, "-4", "2,5", "10", "89", "30.000". Tenga en cuenta que la aplicación pura de este método puede proporcionar solo un orden parcial en las cadenas, ya que diferentes cadenas pueden representar el mismo número (como con "2" y "2.0" o, cuando se usa notación científica , "2e3" y "2000" ).