alquitrán (informática)


En informática , tar es una utilidad de software de computadora para recopilar muchos archivos en un solo archivo , a menudo denominado tarball , con fines de distribución o copia de seguridad. El nombre se deriva de " tape archive ", ya que se desarrolló originalmente para escribir datos en dispositivos de E/S secuenciales sin un sistema de archivos propio. Los conjuntos de datos de archivo creados por tar contienen varios parámetros del sistema de archivos , como el nombre, las marcas de tiempo, la propiedad, los permisos de acceso a los archivos y la organización del directorio . POSIX abandonó tar a favor de pax , peroel alquitrán ve un uso generalizado continuo.

La utilidad de línea de comandos se introdujo por primera vez en la versión 7 de Unix en enero de 1979, reemplazando el programa tp (que a su vez reemplazó a "tap"). [7] La ​​estructura de archivos para almacenar esta información se estandarizó en POSIX .1-1988 [8] y luego en POSIX.1-2001, [9] y se convirtió en un formato compatible con la mayoría de los sistemas de archivo de archivos modernos. El comando tar se abandonó en POSIX.1-2001 a favor del comando pax , que debía admitir el formato de archivo ustar; el comando tar fue indicado para el retiro a favor del comando pax al menos desde 1994.

Hoy en día, los sistemas operativos similares a Unix suelen incluir herramientas para admitir archivos tar, así como utilidades comúnmente utilizadas para comprimirlos, como gzip y bzip2 .

BSD-tar se ha incluido en Microsoft Windows desde la actualización de Windows 10 de abril de 2018 , [11] [12] y, por lo demás, hay varias herramientas de terceros disponibles para leer y escribir estos formatos en Windows.

Muchas unidades de cinta históricas leen y escriben bloques de datos de longitud variable , lo que deja un espacio desperdiciado significativo en la cinta entre bloques (para que la cinta comience y deje de moverse físicamente). Algunas unidades de cinta (y discos sin procesar) solo admiten bloques de datos de longitud fija. Además, al escribir en cualquier medio, como un sistema de archivos o una red, lleva menos tiempo escribir un bloque grande que muchos bloques pequeños. Por lo tanto, el comando tar escribe datos en registros de muchos  bloques 512 B. El usuario puede especificar un factor de bloqueo, que es el número de bloques por registro. El valor predeterminado es 20, lo que produce registros de 10  KiB . [13]

Hay múltiples formatos de archivo tar, incluidos los históricos y los actuales. Dos formatos tar están codificados en POSIX: ustar y pax . No codificado pero todavía en uso actual es el formato tar de GNU.


El archivo tar se usa a menudo junto con un método de compresión, como gzip , para crear un archivo comprimido. Como se muestra, la combinación de archivos en el archivo se comprime como una unidad.