Archivo binario


Un archivo binario es un archivo de computadora que no es un archivo de texto . [1] El término "archivo binario" se usa a menudo como un término que significa "archivo que no es de texto". [2] Muchos formatos de archivos binarios contienen partes que pueden interpretarse como texto; por ejemplo, algunos archivos de documentos informáticos que contienen texto con formato , como los archivos de documentos de Microsoft Word más antiguos , contienen el texto del documento pero también contienen información de formato en forma binaria. [2]

Por lo general, se considera que los archivos binarios son una secuencia de bytes , lo que significa que los dígitos binarios ( bits ) se agrupan en grupos de ocho. Los archivos binarios normalmente contienen bytes que están destinados a ser interpretados como algo diferente a los caracteres de texto . Los programas informáticos compilados son ejemplos típicos; de hecho, a veces los programadores se refieren a las aplicaciones compiladas como archivos binarios . Pero los archivos binarios también pueden significar que contienen imágenes, sonidos, versiones comprimidas de otros archivos, etc., en resumen, cualquier tipo de contenido de archivo. [1]

Algunos archivos binarios contienen encabezados , bloques de metadatos utilizados por un programa de computadora para interpretar los datos del archivo. El encabezado suele contener una firma o un número mágico que puede identificar el formato. Por ejemplo, un archivo GIF puede contener varias imágenes y los encabezados se utilizan para identificar y describir cada bloque de datos de imagen. Los bytes iniciales del encabezado contendrían texto como GIF87ao GIF89aque puede identificar el binario como un archivo GIF . Si un archivo binario no contiene encabezados, puede llamarse archivo binario plano .

Para enviar archivos binarios a través de ciertos sistemas (como el correo electrónico ) que no permiten todos los valores de datos, a menudo se traducen a una representación de texto sin formato (usando, por ejemplo, Base64 ). La codificación de los datos tiene la desventaja de aumentar el tamaño del archivo durante la transferencia (por ejemplo, el uso de Base64 aumentará el tamaño del archivo en aproximadamente un 30 %), además de requerir la traducción a binario después de la recepción. El aumento de tamaño puede contrarrestarse con una compresión de enlace de nivel inferior, ya que los datos de texto resultantes tendrán una entropía mucho menor que el aumento de tamaño, por lo que los datos reales transferidos en este escenario probablemente sean muy parecidos al tamaño del original. datos binarios. Ver Codificación de binario a textopara más sobre este tema.

Microsoft Windows y sus bibliotecas estándar para los lenguajes de programación C y C++ permiten al programador especificar un parámetro que indica si se espera que un archivo sea texto sin formato o binario al abrir un archivo; esto afecta las llamadas de biblioteca estándar para leer y escribir desde el archivo en el sentido de que el sistema convierte entre el carácter de "fin de línea" de C/C++ (el carácter de avance de línea ASCII) y la secuencia de fin de línea que Windows espera en los archivos (el carácter ASCII caracteres de retorno de carro y avance de línea en secuencia). En estilo Unixsistemas, las bibliotecas estándar C y C ++ en esos sistemas también permiten al programador especificar si se espera que un archivo sea de texto o binario, pero las bibliotecas pueden ignorar ese parámetro, y lo hacen, como la secuencia de final de línea en Unix-like. systems es solo el carácter de final de línea de C/C++.

Se puede usar un editor o visor hexadecimal para ver los datos del archivo como una secuencia de valores hexadecimales (o caracteres decimales, binarios o ASCII) para los bytes correspondientes de un archivo binario. [2]


Un volcado hexadecimal del favicon de Wikipedia de 318 bytes , o . La primera columna numera la dirección inicial de la línea, mientras que la indica repetición.W.svg de Wikipedia*