Archivo


Parchive (un acrónimo de parity archive , y conocido formalmente como Parity Volume Set Specification [1] [2] ) es un sistema de código de borrado que produce archivos par para la verificación de suma de verificación de la integridad de los datos , con la capacidad de realizar operaciones de recuperación de datos que pueden reparar o regenerar datos dañados o faltantes.

Parchive se escribió originalmente para resolver el problema del intercambio confiable de archivos en Usenet , [3] pero se puede usar para proteger cualquier tipo de datos contra la corrupción de datos , la podredumbre del disco, la podredumbre de bits y daños accidentales o maliciosos. A pesar del nombre, Parchive utiliza técnicas más avanzadas (específicamente códigos de corrección de errores) que los métodos de paridad simplistas de detección de errores .

A partir de 2014, PAR1 está obsoleto, PAR2 está maduro para un uso generalizado y PAR3 es una versión experimental desarrollada por el autor de MultiPar, Yutaka Sawada. [4] [5] [6] [7] El proyecto SourceForge Parchive original ha estado inactivo desde el 30 de abril de 2015. [8]

Parchive tenía la intención de aumentar la confiabilidad de la transferencia de archivos a través de grupos de noticias de Usenet . Usenet se diseñó originalmente para conversaciones informales y el protocolo subyacente, NNTP , no se diseñó para transmitir datos binarios arbitrarios. Otra limitación, que era aceptable para conversaciones pero no para archivos, era que los mensajes normalmente eran bastante cortos y estaban limitados a texto ASCII de 7 bits. [9]

Se idearon varias técnicas para enviar archivos a través de Usenet, como uuencoding y Base64 . El software Usenet posterior permitió 8 bits ASCII extendido , lo que permitió nuevas técnicas como yEnc . Los archivos grandes se dividieron para reducir el efecto de una descarga corrupta, pero se mantuvo la naturaleza poco confiable de Usenet.

Con la introducción de Parchive, se podían crear archivos de paridad que luego se cargaban junto con los archivos de datos originales. Si alguno de los archivos de datos se dañara o se perdiera mientras se propagaba entre los servidores de Usenet, los usuarios podían descargar archivos de paridad y usarlos para reconstruir los archivos dañados o faltantes. Parchive incluyó la construcción de pequeños archivos de índice (*.par en la versión 1 y *.par2 en la versión 2) que no contienen datos de recuperación. Estos índices contienen hashes de archivos que se pueden usar para identificar rápidamente los archivos de destino y verificar su integridad.