Fusión de clasificación de mainframe


La utilidad Ordenar/Combinar es un programa de mainframe para ordenar registros en un archivo en un orden específico, combinar archivos preordenados en un archivo ordenado o copiar registros seleccionados. Internamente, estas utilidades utilizan uno o más de los algoritmos de clasificación estándar , a menudo con un código propietario ajustado.

Los mainframes se suministraron originalmente con una memoria principal limitada según los estándares actuales y la cantidad de datos que debían clasificarse era con frecuencia muy grande. Debido a esto, a diferencia de los programas de clasificación más recientes, los primeros programas Sort/Merge pusieron gran énfasis en técnicas eficientes para clasificar datos en almacenamiento secundario , típicamente cinta [a] o disco . En 1968, el programa OS/360 Sort/Merge proporcionó cinco "técnicas de distribución de secuencias" diferentes que podían usarse según la cantidad y el tipo de dispositivos disponibles. [1]

Antes de System/370 , todos los sistemas operativos de mainframe de IBM incluían utilidades de ordenación/combinación. [b] Con el anuncio de los sistemas operativos de almacenamiento virtual , DOS/VS y OS/VS , IBM desagregó gran parte del software y ofreció productos de programas de clasificación/fusión de pago. Para OS/VS, IBM ofreció 5740-SM1, OS/VS Sort/Merge, más tarde rebautizado como Data Facility Sort (DFSORT).

En 1990, IBM introdujo un nuevo algoritmo de combinación llamado BLOCKSET en DFSORT, el sucesor de OS/360 Sort/Merge. [2] Como nota histórica, el algoritmo BLOCKSET fue inventado por un ingeniero de sistemas de IBM en 1963 y fue descubierto en los archivos de IBM e implementado en 1990. [3]

Ordenar/Combinar se usa con mucha frecuencia; a menudo, el programa de aplicación más comúnmente utilizado en una tienda de mainframe que generalmente consume alrededor del veinte por ciento de la potencia de procesamiento de la tienda.

Los programas modernos de clasificación/combinación también pueden copiar archivos, seleccionar u omitir ciertos registros, resumir registros, eliminar duplicados, reformatear registros, agregar nuevos datos y generar informes. De hecho, la mayoría de las aplicaciones Ordenar/Combinar utilizan la amplia gama de capacidades de procesamiento adicionales, en lugar de simplemente ordenar o combinar registros: el producto Ordenar/Combinar es una forma muy rápida de realizar entradas y salidas de estas funciones. Se admite una gran cantidad de "salidas de usuario", y pueden ser módulos de carga (es decir, un miembro de una biblioteca) o cubiertas de objetos (es decir, la salida de un ensamblador), con la carga de la aplicación Sort/Merge (módulos de carga). ) o vincular (plataformas de objetos; denominada "edición de vínculos dinámicos" en DFSORT) la salida, según se especifica y requiere. Los conjuntos de datos de almacenamiento de trabajo (es decir, SORTWK01, ..., SORTWKnn) pueden ser discos o cintas, aunque el algoritmo BLOCKSET está restringido al almacenamiento de trabajo en disco; más conjuntos de datos de almacenamiento en funcionamiento generalmente mejora el rendimiento.