De Wikipedia, la enciclopedia libre
  (Redirigido desde KiB )
Saltar a navegación Saltar a búsqueda

El byte es una unidad de información digital que normalmente consta de ocho bits . Históricamente, el byte era el número de bits utilizados para codificar un solo carácter de texto en una computadora [1] [2] y, por esta razón, es la unidad de memoria direccionable más pequeña en muchas arquitecturas de computadora . Para eliminar la ambigüedad de los bytes de tamaño arbitrario de la definición común de 8 bits , los documentos de protocolo de red como The Internet Protocol (RFC 791) (1981) se refieren a un byte de 8 bits como un octeto . [3]Esos bits en un octeto generalmente se cuentan con una numeración del 0 al 7 o del 7 al 0, según el endianismo . El primer bit es el número 0, lo que hace que el octavo sea el número 7.

El tamaño del byte ha dependido históricamente del hardware y no existían estándares definitivos que exigieran el tamaño. Se han utilizado tamaños de 1 a 48 bits. [4] [5] [6] [7] El código de caracteres de seis bits era una implementación de uso frecuente en los primeros sistemas de codificación, y las computadoras que usaban bytes de seis y nueve bits eran comunes en la década de 1960. Estos sistemas a menudo tenían palabras de memoria de 12, 18, 24, 30, 36, 48 o 60 bits, correspondientes a 2, 3, 4, 5, 6, 8 o 10 bytes de seis bits. En esta era, las agrupaciones de bits en el flujo de instrucciones a menudo se denominaban sílabas [a] o slab , antes de que el término byte se volviera común.

El estándar moderno de facto de ocho bits, como se documenta en ISO / IEC 2382-1: 1993, es una potencia conveniente de dos que permite los valores codificados en binario de 0 a 255 para un byte; 2 elevado a 8 es 256. [8 ] La norma internacional IEC 80000-13 codificó este significado común. Muchos tipos de aplicaciones utilizan información representable en ocho bits o menos y los diseñadores de procesadores la optimizan para este uso común. La popularidad de las principales arquitecturas informáticas comerciales ha contribuido a la aceptación omnipresente del byte de 8 bits. [9] Las arquitecturas modernas suelen utilizar palabras de 32 o 64 bits, compuestas de cuatro u ocho bytes, respectivamente.

El símbolo de unidad para el byte fue designado como la letra mayúscula B por la Comisión Electrotécnica Internacional (IEC) y el Instituto de Ingenieros Eléctricos y Electrónicos (IEEE). [10] Internacionalmente, el octeto unitario , símbolo o, define explícitamente una secuencia de ocho bits, eliminando la ambigüedad del byte. [11] [12]

Historia [ editar ]

El término byte fue acuñado por Werner Buchholz en junio de 1956, [4] [13] [14] [b] durante la fase de diseño inicial del IBM Stretch [15] [16] [1] [13] [14] [17 ] [18] computadora, que tenía direccionamiento al bit y a las instrucciones de longitud de campo variable (VFL) con un tamaño de byte codificado en la instrucción. [13] Es un respeto deliberado de la mordida para evitar una mutación accidental a la mordida . [1] [13] [19] [c]

Otro origen de byte para grupos de bits más pequeños que el tamaño de palabra de una computadora, y en particular grupos de cuatro bits , está registrado por Louis G. Dooley, quien afirmó que acuñó el término mientras trabajaba con Jules Schwartz y Dick Beeler en un sistema de defensa aérea. llamado SAGE en el Laboratorio Lincoln del MIT en 1956 o 1957, que fue desarrollado conjuntamente por Rand , MIT e IBM. [20] [21] Más tarde, el lenguaje JOVIAL de Schwartz usó el término, pero el autor recordó vagamente que se derivaba de AN / FSQ-31 . [22] [21]

Las primeras computadoras usaban una variedad de representaciones decimales codificadas en binario (BCD) de cuatro bits y los códigos de seis bits para patrones gráficos imprimibles comunes en el Ejército de los Estados Unidos ( FIELDATA ) y la Armada . Estas representaciones incluían caracteres alfanuméricos y símbolos gráficos especiales. Estos conjuntos se expandieron en 1963 a siete bits de codificación, denominados Código Estándar Estadounidense para el Intercambio de Información (ASCII) como el Estándar Federal de Procesamiento de Información , que reemplazó los códigos de teleimpresora incompatibles en uso por diferentes ramas del gobierno de los Estados Unidos y universidades durante la década de 1960 . ASCII incluyó la distinción de alfabetos en mayúsculas y minúsculas y un conjunto decontrolar los caracteres para facilitar la transmisión del lenguaje escrito, así como las funciones del dispositivo de impresión, como el avance de página y el avance de línea, y el control físico o lógico del flujo de datos a través de los medios de transmisión. [18] A principios de la década de 1960, mientras que también estaba activo en la estandarización ASCII, IBM introdujo simultáneamente en su línea de productos System / 360 el Código de intercambio decimal codificado en binario extendido (EBCDIC) de ocho bits , una expansión de su código binario de seis bits. representaciones decimales (BCDIC) [d] utilizadas en perforaciones de tarjetas anteriores. [23] La prominencia del System / 360 llevó a la adopción ubicua del tamaño de almacenamiento de ocho bits, [18] [16][13] aunque en detalle los esquemas de codificación EBCDIC y ASCII son diferentes.

A principios de la década de 1960, AT&T introdujo la telefonía digital en líneas troncales de larga distancia . Estos utilizaron la codificación de ley μ de ocho bits . Esta gran inversión prometía reducir los costos de transmisión de datos de ocho bits.

El desarrollo de microprocesadores de ocho bits en la década de 1970 popularizó este tamaño de almacenamiento. Los microprocesadores como el Intel 8008 , el predecesor directo del 8080 y el 8086 , utilizados en las primeras computadoras personales, también podían realizar una pequeña cantidad de operaciones en los pares de cuatro bits en un byte, como el decimal-add-adjust ( Instrucción DAA). Una cantidad de cuatro bits a menudo se denomina nibble , también nybble , que se representa convenientemente mediante un solo dígito hexadecimal .

El término octeto se utiliza para especificar de forma inequívoca un tamaño de ocho bits. [18] [12] Se utiliza ampliamente en las definiciones de protocolos .

Históricamente, el término octad u octade se utilizó para denotar también ocho bits al menos en Europa Occidental; [24] [25] sin embargo, este uso ya no es común. El origen exacto del término no está claro, pero se puede encontrar en fuentes británicas, holandesas y alemanas de las décadas de 1960 y 1970, y en toda la documentación de las computadoras centrales de Philips .

Símbolo de unidad [ editar ]

El símbolo de unidad para el byte se especifica en IEC 80000-13 , IEEE 1541 y el formato de intercambio métrico [10] como el carácter B.

En el Sistema Internacional de Cantidades (ISQ), B es el símbolo del bel , una unidad de relación de potencia logarítmica que lleva el nombre de Alexander Graham Bell , lo que crea un conflicto con la especificación IEC. Sin embargo, existe poco peligro de confusión, porque el bel es una unidad que se usa con poca frecuencia. Se usa principalmente en su fracción decádica, el decibel (dB), para mediciones de la intensidad de la señal y el nivel de presión sonora , mientras que una unidad para una décima parte de un byte, el decibyte y otras fracciones, solo se usan en unidades derivadas, tales como como tasas de transmisión.

La letra minúscula o para el octeto se define como el símbolo del octeto en IEC 80000-13 y se usa comúnmente en idiomas como el francés [26] y el rumano , y también se combina con prefijos métricos para múltiplos, por ejemplo, ko y Mo.

El uso del término octad (e) para ocho bits ya no es común. [24] [25]

Unidades de varios bytes [ editar ]

Existe más de un sistema para definir unidades más grandes en función del byte. Algunos sistemas se basan en potencias de 10 ; otros sistemas se basan en potencias de 2 . La nomenclatura de estos sistemas ha sido objeto de confusión. Los sistemas basados ​​en potencias de 10 utilizan de forma fiable prefijos SI estándar (' kilo ', ' mega ', ' giga ', ...) y sus símbolos correspondientes (k, M, G, ...). Los sistemas basados ​​en potencias de 2, sin embargo, pueden usar prefijos binarios ('kibi', 'mebi', 'gibi, ...) y sus símbolos correspondientes (Ki, Mi, Gi, ...) o pueden usar los prefijos K, M y G, creando ambigüedad.

Si bien la diferencia numérica entre las interpretaciones decimal y binaria es relativamente pequeña para el kilobyte (aproximadamente un 2% más pequeño que el kibibyte), los sistemas se desvían significativamente a medida que las unidades crecen (la desviación relativa crece en un 2,4% por cada tres órdenes de magnitud). Por ejemplo, un yottabyte basado en una potencia de 10 es aproximadamente un 17% más pequeño que un yobibyte basado en una potencia de 2.

Unidades basadas en potencias de 10 [ editar ]

La definición de prefijos utilizando potencias de 10, en la que 1 kilobyte (símbolo kB) se define como igual a 1000 bytes, es recomendada por la Comisión Electrotécnica Internacional (IEC). [27] El estándar IEC define ocho de estos múltiplos, hasta 1 yottabyte (YB), igual a 1000 8 bytes.

Esta definición se usa más comúnmente para las tasas de transferencia de datos en redes de computadoras , bus interno, disco duro y velocidades de transferencia de medios flash, y para las capacidades de la mayoría de los medios de almacenamiento , particularmente discos duros , [28] almacenamiento basado en flash , [29] y DVD . También es coherente con otros usos de los prefijos SI en informática, como las velocidades de reloj de la CPU o las medidas de rendimiento .

Unidades basadas en potencias de 2 [ editar ]

Un sistema de unidades basado en potencias de 2 en el que 1 kibibyte (KiB) es igual a 1024 (es decir, 2 10 ) bytes está definido por las normas internacionales IEC 80000-13 y respaldado por organismos de normalización nacionales e internacionales ( BIPM , IEC, NIST ). El estándar IEC define ocho de estos múltiplos, hasta 1 yobibyte (YiB), igual a 1024 8 bytes.

Un sistema alternativo de nomenclatura para las mismas unidades, en el que 1 kilobyte (KB) es igual a 1024 bytes, [30] [31] [32] 1 megabyte (MB) es igual a 1024 2 bytes y 1 gigabyte (GB) es igual a 1024 3 bytes está definido por un estándar JEDEC de la década de 1990 . Solo los tres primeros múltiplos (hasta GB) están definidos por el estándar JEDEC. Para TB y mayores, los estándares reconocen solo la definición decimal. La convención JEDEC se utiliza de forma destacada por el sistema operativo Microsoft Windows , [33] y la capacidad de memoria de acceso aleatorio , como la memoria principal y la memoria caché de la CPU.tamaño, y en marketing y facturación por empresas de telecomunicaciones, como Vodafone , [34] AT&T , [35] Orange [36] y Telstra . [37]

Historia de las definiciones en conflicto [ editar ]

La diferencia porcentual entre las interpretaciones decimales y binarias de los prefijos de unidad aumenta con el aumento del tamaño de almacenamiento

La memoria de computadora [e] contemporánea tiene una arquitectura binaria que hace una definición de unidades de memoria basada en potencias de 2 más prácticas. El uso del prefijo métrico kilo para múltiplos binarios surgió como una conveniencia, porque 1024 es aproximadamente 1000. [38] Esta definición fue popular en las primeras décadas de la computación personal , con productos como el formato de disquete DD Tandon de 5 14 pulgadas ( con 368,640 bytes) se anuncia como "360 KB", siguiendo la convención de 1024 bytes. Sin embargo, no fue universal. El Shugart SA-400 5 14 pulgadasel disquete contenía 109 375 bytes sin formato, [39] y se anunciaba como "110 Kbyte", utilizando la convención 1000. [40] Del mismo modo, el disquete DEC RX01 de 8 pulgadas (1975) tenía 256,256 bytes formateados y se anunciaba como "256k". [41] Otros discos se publicitaron utilizando una combinación de las dos definiciones: en particular, 3+Los discos HD de 12 pulgadas que se anuncian como "1,44 MB" tienen de hecho una capacidad de 1,440 KiB, el equivalente a 1,47 MB ​​o 1,41 MiB.

En 1995, el Comité Interdivisional de Nomenclatura y Símbolos de la Unión Internacional de Química Pura y Aplicada intentó resolver esta ambigüedad proponiendo un conjunto de prefijos binarios para las potencias de 1024. [42] [43]

En diciembre de 1998, la IEC abordó tales usos y definiciones múltiples creando prefijos como kibi, mebi, gibi, etc., para denotar inequívocamente potencias de 1024. [44] Por lo tanto, el kibibyte (KiB), representa 2 10   bytes = 1024 bytes . Estos prefijos son ahora parte del Sistema Internacional de Cantidades . La IEC especificó además que el kilobyte solo debe usarse para referirse a 1000 bytes. La CEI adoptó la propuesta y publicó la norma en enero de 1999. [45] [46]

En 1999, Donald Knuth sugirió llamar al kibibyte "gran kilobyte" ( KKB ). [47]

Demandas por definición [ editar ]

Las demandas que surgen de la supuesta confusión del consumidor sobre las definiciones binarias y decimales aplicadas al byte generalmente terminaron a favor de los fabricantes, y los tribunales sostuvieron que la definición legal de gigabyte o GB es 1 GB = 1,000,000,000 (10 9 ) bytes (el número decimal definición) en lugar de la definición binaria (2 30 ). Específicamente, los tribunales sostuvieron que "el Congreso de los EE. UU. Ha considerado que la definición decimal de gigabyte es la 'preferida' para los propósitos de 'comercio y comercio de EE. UU.' [...] La Legislatura de California también ha adoptado el sistema decimal para todos 'transacciones en este estado' ". [48]

Las demandas anteriores habían terminado en un acuerdo sin un fallo judicial sobre la cuestión, como una demanda contra el fabricante de unidades Western Digital . [49] [50] Western Digital resolvió el desafío y agregó renuncias explícitas a los productos de que la capacidad utilizable puede diferir de la capacidad anunciada. [49] Seagate fue demandado por motivos similares y también llegó a un acuerdo. [49] [51]

Ejemplos prácticos [ editar ]

Usos comunes [ editar ]

Muchos lenguajes de programación definen el byte del tipo de datos .

Los lenguajes de programación C y C ++ definen el byte como una " unidad direccionable de almacenamiento de datos lo suficientemente grande como para contener cualquier miembro del juego de caracteres básico del entorno de ejecución " (cláusula 3.6 del estándar C). El estándar C requiere que el tipo de datos integral unsigned char debe contener al menos 256 valores diferentes y está representado por al menos ocho bits (cláusula 5.2.4.2.1). Varias implementaciones de C y C ++ reservan 8, 9, 16, 32 o 36 bits para el almacenamiento de un byte. [57] [58] [g] Además, los estándares C y C ++ requieren que no haya espacios entre dos bytes. Esto significa que cada bit de la memoria es parte de un byte. [59]

Elbyte tipo de datos primitivo de Java siempre se define como que consta de 8 bits y es un tipo de datos con signo, que contiene valores de −128 a 127.

Los lenguajes de programación .NET, como C #, definen tanto sin signo bytecomo con signo sbyte, con valores de 0 a 255 y de −128 a 127 , respectivamente.

En los sistemas de transmisión de datos, el byte se define como una secuencia contigua de bits en un flujo de datos en serie que representa la unidad de datos distinguida más pequeña. Una unidad de transmisión puede incluir bits de inicio, bits de parada o bits de paridad y, por lo tanto, puede variar de 7 a 12 bits para contener un solo código ASCII de 7 bits . [60]

Ver también [ editar ]

  • Datos
  • Jerarquía de datos
  • JBOB , solo un montón de bytes
  • Picar
  • Octeto (informática)
  • Tipo de datos primitivo
  • Tryte
  • Qubyte (byte cuántico)
  • Word (arquitectura informática)

Notas [ editar ]

  1. ^ El término sílaba se usó para bytes que contienen instrucciones o constituyentes de instrucciones, no para bytes de datos.
  2. ^ Muchas fuentes indican erróneamente un cumpleaños del término byte en julio de 1956, pero Werner Buchholz afirmó que el término se habría acuñado en junio de 1956 . De hecho, el documento más antiguo que respalda esto data del 11 de junio de 1956. Buchholz declaró que la transición a bytes de 8 bits se concibió en agosto de 1956 , pero el documento más antiguo encontrado utilizando esta noción data de septiembre de 1956 .
  3. ^ Algunas máquinas posteriores, por ejemplo, Burroughs B1700 , CDC 3600 , DEC PDP-6, DEC PDP-10 tenían la capacidad de operar en bytes arbitrarios no mayores que el tamaño de la palabra.
  4. ^ Había más de una página de códigos BCD.
  5. ^ Durante la década de 1970 hubo máquinas conarquitecturas decimales .
  6. ^ El video se codifica a una velocidad de bits de 27,80 Mbit / s, con un tiempo de ejecución de 1,403 min [61] (84180 segundos), lo que da como resultado un tamaño aproximado de ~ 0,2925 terabytes.
  7. ^ El número real de bits en una implementación particular se documentaCHAR_BITcomo implementado en el archivo limits.h .

Referencias [ editar ]

  1. ^ a b c Blaauw, Gerrit Anne ; Brooks, Jr., Frederick Phillips ; Buchholz, Werner (1962), "4: Unidades de datos naturales" (PDF) , en Buchholz, Werner (ed.), Planning a Computer System - Project Stretch , McGraw-Hill Book Company, Inc. / The Maple Press Company, York , PA., Págs. 39–40, LCCN  61-10466 , archivado desde el original (PDF) el 2017-04-03 , consultado el 2017-04-03 , Términos utilizados aquí para describir la estructura impuesta por el diseño de la máquina, en además de bit , se enumeran a continuación.
    Bytedenota un grupo de bits utilizados para codificar un carácter, o el número de bits transmitidos en paralelo hacia y desde unidades de entrada-salida. Aquí se utiliza un término que no sea carácter porque un carácter dado puede estar representado en diferentes aplicaciones por más de un código, y diferentes códigos pueden usar diferentes números de bits (es decir, diferentes tamaños de bytes). En la transmisión de entrada-salida, la agrupación de bits puede ser completamente arbitraria y no tener relación con los caracteres reales. (El término se acuña a partir de mordida , pero se vuelve a escribir para evitar una mutación accidental a bit .)
    Una palabra consiste en el número de bits de datos transmitidos en paralelo desde o hacia la memoria en un ciclo de memoria. Tamaño de palabrase define así como una propiedad estructural de la memoria. (El término catena fue acuñado con este propósito por los diseñadores de la computadora Bull GAMMA 60  [ fr ] .)
    Bloque se refiere al número de palabras transmitidas hacia o desde una unidad de entrada-salida en respuesta a una sola instrucción de entrada-salida. El tamaño del bloque es una propiedad estructural de una unidad de entrada-salida; puede haber sido fijado por el diseño o dejado que el programa lo modifique.
  2. ^ Bemer, Robert William (1959), "Una propuesta para un código de tarjeta generalizado de 256 caracteres", Comunicaciones del ACM , 2 (9): 19-23, doi : 10.1145 / 368424.368435 , S2CID 36115735 
  3. ^ Postel, J. (septiembre de 1981). "Protocolo de Internet" . tools.ietf.org . pag. 43 . Consultado el 28 de agosto de 2020 . octeto Un byte de ocho bits.
  4. ^ a b Buchholz, Werner (11 de junio de 1956). "7. La matriz de cambios" (PDF) . El sistema de enlaces . IBM . págs. 5-6. Stretch Memo No. 39G. Archivado desde el original (PDF) el 4 de abril de 2017 . Consultado el 4 de abril de 2016 . […] Lo más importante, desde el punto de vista de la edición, será la capacidad de manejar cualquier carácter o dígito, de 1 a 6 bits de longitud.
    La Figura 2 muestra la Matriz de Cambio que se utilizará para convertir una palabra de 60 bits , proveniente de la Memoria en paralelo, en caracteres , o 'bytes' como los hemos llamado, para ser enviados al Adder en serie. Los 60 bits se vierten ennúcleos magnéticos en seis niveles diferentes. Por lo tanto, si un 1 sale de la posición 9, aparece en los seis núcleos de abajo. Pulsar cualquier línea diagonal enviará los seis bits almacenados a lo largo de esa línea al Adder. El sumador puede aceptar todos o solo algunos de los bits.
    Suponga que se desea operar con dígitos decimales de 4 bits , comenzando por la derecha. La diagonal 0 se pulsa primero, enviando los seis bits 0 a 5, de los cuales el sumador acepta solo los primeros cuatro (0–3). Los bits 4 y 5 se ignoran. A continuación, se pulsa la diagonal 4. Esto envía los bits 4 a 9, de los cuales los dos últimos se ignoran nuevamente, y así sucesivamente.
    Es igual de fácil usar los seis bits en formato alfanumérico.trabajar, o para manejar bytes de un solo bit para análisis lógico, o para compensar los bytes por cualquier número de bits. Todo esto se puede hacer tirando de las diagonales de cambio apropiadas. Se utiliza una disposición de matriz análoga para cambiar de funcionamiento en serie a paralelo en la salida del sumador. […]
  5. ^ Sistema informático 3600 - Manual de referencia (PDF) . K. St. Paul, Minnesota, Estados Unidos: Control Data Corporation (CDC). 11 de octubre de 1966 [1965]. 60021300. Archivado desde el original (PDF) el 5 de abril de 2017 . Consultado el 5 de abril de 2017 . Byte: una partición de una palabra de computadora. (NB. Analiza bytes de 12 bits, 24 bits y 48 bits).
  6. ^ Rao, Thammavaram RN; Fujiwara, Eiji (1989). McCluskey, Edward J. (ed.). Codificación de control de errores para sistemas informáticos . Serie de Prentice Hall en Ingeniería Informática (1 ed.). Englewood Cliffs, Nueva Jersey, EE.UU .: Prentice Hall . ISBN 0-13-283953-9. LCCN  88-17892 . (NB. Ejemplo del uso de un código para "bytes de 4 bits").
  7. ^ Tafel, Hans Jörg (1971). Einführung in die digitale Datenverarbeitung [ Introducción al procesamiento de información digital ] (en alemán). Múnich: Carl Hanser Verlag . pag. 300. ISBN 3-446-10569-7. Byte = zusammengehörige Folge von ia neun Bits; davon sind acht Datenbits, das neunte ein Prüfbit (NB. Define un byte como un grupo de típicamente 9 bits; 8 bits de datos más 1 bit de paridad).
  8. ^ ISO / IEC 2382-1: 1993, Tecnología de la información - Vocabulario - Parte 1: Términos fundamentales . 1993. byte Una cadena que consta de un número de bits, tratados como una unidad y que generalmente representan un carácter o una parte de un carácter. NOTAS 1 El número de bits en un byte es fijo para un sistema de procesamiento de datos dado. 2 El número de bits en un byte suele ser 8.



  9. ^ "Museo de historia de la computadora - exposiciones - historia de Internet - 1964: historia de Internet 1962 a 1992" . Museo de Historia de la Computación . 2017 [2015]. Archivado desde el original el 3 de abril de 2017 . Consultado el 3 de abril de 2017 .
  10. ↑ a b Jaffer, Aubrey (2011) [2008]. "Formato de intercambio métrico" . Archivado desde el original el 3 de abril de 2017 . Consultado el 3 de abril de 2017 .
  11. Kozierok, Charles M. (20 de septiembre de 2005) [2001]. "La Guía de TCP / IP - Información y representación binaria: Bits, Bytes, Nibbles, Octetos y Caracteres - Byte versus Octeto" . 3.0. Archivado desde el original el 3 de abril de 2017 . Consultado el 3 de abril de 2017 .
  12. ^ a b ISO 2382-4, Organización de datos (2 ed.). byte, octeto, byte de 8 bits: una cadena que consta de ocho bits.
  13. ^ a b c d e Buchholz, Werner (febrero de 1977). "La palabra 'Byte' llega a la mayoría de edad ..." Revista Byte . 2 (2): 144. […] La primera referencia encontrada en los archivos estaba contenida en un memorando interno escrito en junio de 1956 durante los primeros días del desarrollo de Stretch . Se describió que un byte constaba de cualquier número de bits en paralelo del uno al seis. Por tanto, se supuso que un byte tenía una longitud apropiada para la ocasión. Su primer uso fue en el contexto del equipo de entrada y salida de la década de 1950, que manejaba seis bits a la vez. La posibilidad de pasar a bytes de 8 bits se consideró en agosto de 1956 y se incorporó al diseño de Stretch poco después.. La primera referencia publicada al término se produjo en 1959 en un artículo " Processing Data in Bits and Pieces " de G A Blaauw , F P Brooks Jr y W Buchholz en IRE Transactions on Electronic Computers , junio de 1959, página 121. Las nociones de ese artículo fueron elaborados en el Capítulo 4 de Planificación de un sistema informático (Project Stretch) , editado por W Buchholz, McGraw-Hill Book Company (1962). El fundamento para acuñar el término se explicó allí en la página 40 de la siguiente manera:
    Byte denota un grupo de bits utilizados para codificar un carácter, o el número de bits transmitidos en paralelo hacia y desde unidades de entrada-salida. Un término que no sea carácterse usa aquí porque un carácter dado puede estar representado en diferentes aplicaciones por más de un código, y diferentes códigos pueden usar diferentes números de bits (es decir, diferentes tamaños de bytes). En la transmisión de entrada-salida, la agrupación de bits puede ser completamente arbitraria y no tener relación con los caracteres reales. (El término se acuñó a partir de mordida , pero repelido para evitar la mutación accidental a bit .)
    System / 360 asumió muchos de los conceptos de Stretch, incluidos los tamaños básicos de bytes y palabras, que son potencias de 2. Sin embargo, para economía, el byte el tamaño se fijó en el máximo de 8 bits y el direccionamiento a nivel de bit se reemplazó por direccionamiento de bytes. […]
  14. ^ a b "Cronología de la era IBM Stretch / Harvest (1956-1961)" . Museo de Historia de la Computación . Junio ​​de 1956. Archivado desde el original el 29 de abril de 2016 . Consultado el 3 de abril de 2017 . 1956 Verano: Gerrit Blaauw , Fred Brooks , Werner Buchholz , John Cocke y Jim Pomerene se unen al equipo Stretch . Lloyd Hunter proporciona liderazgo en transistores . Julio de 1956 [ sic ]: En un informe, Werner Buchholz enumera las ventajas de una longitud de palabra de 64 bits para Stretch. También es compatible con NSA
    Requisito de bytes de 8 bits. El término de Werner "Byte" se popularizó por primera vez en este memo.
    (NB. Esta línea de tiempo especifica erróneamente la fecha de nacimiento del término "byte" como julio de 1956 , mientras que Buchholz en realidad usó el término ya en junio de 1956 ).
  15. Buchholz, Werner (31 de julio de 1956). "5. Entrada-Salida" (PDF) . Longitud de la palabra de memoria . IBM . pag. 2. Stretch Memo No. 40. Archivado desde el original (PDF) el 4 de abril de 2017 . Consultado el 4 de abril de 2016 . […] 60 es un múltiplo de 1, 2, 3, 4, 5 y 6. Por lo tanto, los bytes de longitud de 1 a 6 bits se pueden empaquetar de manera eficiente en una palabra de 60 bits sin tener que dividir un byte entre una palabra y el siguiente. Si se necesitaran bytes más largos, 60 bits, por supuesto, ya no serían ideales. Con las aplicaciones actuales, 1, 4 y 6 bits son los casos realmente importantes.
    Con palabras de 64 bits, a menudo sería necesario hacer algunos compromisos, como dejar 4 bits sin usar en una palabra cuando se trata de bytes de 6 bits en la entrada y la salida. Sin embargo, la computadora LINK puede equiparse para editar estos espacios y permitir el manejo de bytes que se dividen entre palabras. […]
  16. ^ a b Buchholz, Werner (19 de septiembre de 1956). "2. Tamaño de bytes de entrada-salida" (PDF) . Indización y longitud de palabras de memoria . IBM . pag. 1. Stretch Memo No. 45. Archivado desde el original (PDF) el 4 de abril de 2017 . Consultado el 4 de abril de 2016 . […] El tamaño máximo de bytes de entrada-salida para la operación en serie será ahora de 8 bits, sin contar los bits de detección y corrección de errores. Por lo tanto, Exchange operará sobre una base de bytes de 8 bits, y cualquier unidad de entrada-salida con menos de 8 bits por byte dejará los bits restantes en blanco. Los huecos resultantes se pueden editar más tarde programando […]
  17. ^ Raymond, Eric Steven (2017) [2003]. "definición de bytes" . Archivado desde el original el 3 de abril de 2017 . Consultado el 3 de abril de 2017 .
  18. ^ a b c d Bemer, Robert William (2000-08-08). "Why is a byte 8 bits? Or is it?". Computer History Vignettes. Archived from the original on 2017-04-03. Retrieved 2017-04-03. […] I came to work for IBM, and saw all the confusion caused by the 64-character limitation. Especially when we started to think about word processing, which would require both upper and lower case. […] I even made a proposal (in view of STRETCH, the very first computer I know of with an 8-bit byte) that would extend the number of punch card character codes to 256 […]. So some folks started thinking about 7-bit characters, but this was ridiculous. With IBM's STRETCH computer as background, handling 64-character words divisible into groups of 8 (I designed the character set for it, under the guidance of Dr. Werner Buchholz, the man who DID coin the term 'byte' for an 8-bit grouping). […] It seemed reasonable to make a universal 8-bit character set, handling up to 256. In those days my mantra was 'powers of 2 are magic'. And so the group I headed developed and justified such a proposal […] The IBM 360 used 8-bit characters, although not ASCII directly. Thus Buchholz's 'byte' caught on everywhere. I myself did not like the name for many reasons. The design had 8 bits moving around in parallel. But then came a new IBM part, with 9 bits for self-checking, both inside the CPU and in the tape drives. I exposed this 9-bit byte to the press in 1973. But long before that, when I headed software operations for Cie. Bull in France in 1965–66, I insisted that 'byte' be deprecated in favor of 'octet'. […] It is justified by new communications methods that can carry 16, 32, 64, and even 128 bits in parallel. But some foolish people now refer to a '16-bit byte' because of this parallel transfer, which is visible in the UNICODE set. I'm not sure, but maybe this should be called a 'hextet'. […]
  19. ^ Blaauw, Gerrit Anne; Brooks, Jr., Frederick Phillips; Buchholz, Werner (June 1959). "Processing Data in Bits and Pieces". IRE Transactions on Electronic Computers: 121.
  20. ^ Dooley, Louis G. (February 1995). "Byte: The Word". BYTE. Ocala, FL, USA. Archived from the original on 1996-12-20. […] The word byte was coined around 1956 to 1957 at MIT Lincoln Laboratories within a project called SAGE (the North American Air Defense System), which was jointly developed by Rand, Lincoln Labs, and IBM. In that era, computer memory structure was already defined in terms of word size. A word consisted of x number of bits; a bit represented a binary notational position in a word. Operations typically operated on all the bits in the full word.
    We coined the word byte to refer to a logical set of bits less than a full word size. At that time, it was not defined specifically as x bits but typically referred to as a set of 4 bits, as that was the size of most of our coded data items. Shortly afterward, I went on to other responsibilities that removed me from SAGE. After having spent many years in Asia, I returned to the U.S. and was bemused to find out that the word byte was being used in the new microcomputer technology to refer to the basic addressable memory unit.
    (NB. According to his son, Dooley wrote to him: "On good days, we would have the XD-1 up and running and all the programs doing the right thing, and we then had some time to just sit and talk idly, as we waited for the computer to finish doing its thing. On one such occasion, I coined the word "byte", they (Jules Schwartz and Dick Beeler) liked it, and we began using it amongst ourselves. The origin of the word was a need for referencing only a part of the word length of the computer, but a part larger than just one bit...Many programs had to access just a specific 4-bit segment of the full word...I wanted a name for this smaller segment of the fuller word. The word "bit" lead to "bite" (meaningfully less than the whole), but for a unique spelling, "i" could be "y", and thus the word "byte" was born.")
  21. ^ a b Ram, Stefan. "Erklärung des Wortes "Byte" im Rahmen der Lehre binärer Codes" (in German). Berlin, Germany: Freie Universität Berlin. Retrieved 2017-04-10.
  22. ^ Origin of the term "byte", 1956, archived from the original on 2017-04-10, retrieved 2017-04-10, A question-and-answer session at an ACM conference on the history of programming languages included this exchange:
    JOHN GOODENOUGH: You mentioned that the term "byte" is used in JOVIAL. Where did the term come from?
    JULES SCHWARTZ (inventor of JOVIAL): As I recall, the AN/FSQ-31, a totally different computer than the 709, was byte oriented. I don't recall for sure, but I'm reasonably certain the description of that computer included the word "byte," and we used it.
    FRED BROOKS: May I speak to that? Werner Buchholz coined the word as part of the definition of STRETCH, and the AN/FSQ-31 picked it up from STRETCH, but Werner is very definitely the author of that word.
    SCHWARTZ: That's right. Thank you.
  23. ^ "List of EBCDIC codes by IBM". ibm.com.
  24. ^ a b Williams, R. H. (1969-01-01). British Commercial Computer Digest: Pergamon Computer Data Series. Pergamon Press. ISBN 1483122107. 978-1483122106.
  25. ^ a b "Philips – Philips Data Systems' product range – April 1971" (PDF). Philips. April 1971. Archived from the original (PDF) on 2016-03-04. Retrieved 2015-08-03.
  26. ^ "When is a kilobyte a kibibyte? And an MB an MiB?". The International System of Units and the IEC. International Electrotechnical Commission. Retrieved 2010-08-30.)
  27. ^ Prefixes for Binary Multiples Archived 2007-08-08 at the Wayback Machine — The NIST Reference on Constants, Units, and Uncertainty
  28. ^ 1977 Disk/Trend Report Rigid Disk Drives, published June 1977
  29. ^ SanDisk USB Flash Drive Archived 2008-05-13 at the Wayback Machine "Note: 1 megabyte (MB) = 1 million bytes; 1 gigabyte (GB) = 1 billion bytes."
  30. ^ Kilobyte – Definition and More from the Free Merriam-Webster Dictionary Archived 2010-04-09 at the Wayback Machine. Merriam-webster.com (2010-08-13). Retrieved on 2011-01-07.
  31. ^ Kilobyte | Define Kilobyte at Dictionary.com Archived 2010-09-01 at the Wayback Machine. Dictionary.reference.com (1995-09-29). Retrieved on 2011-01-07.
  32. ^ Definition of kilobyte from Oxford Dictionaries Online Archived 2006-06-25 at the Wayback Machine. Askoxford.com. Retrieved on 2011-01-07.
  33. ^ "Determining Actual Disk Size: Why 1.44 MB Should Be 1.40 MB". Support.microsoft.com. 2003-05-06. Archived from the original on 2014-02-09. Retrieved 2014-03-25.
  34. ^ "3G/GPRS data rates". Vodafone Ireland. Archived from the original on 26 October 2016. Retrieved 26 October 2016.
  35. ^ "Data Measurement Scale". AT&T. Retrieved 26 October 2016.[permanent dead link]
  36. ^ "Internet Mobile Access". Orange Romania. Archived from the original on 26 October 2016. Retrieved 26 October 2016.
  37. ^ "Our Customer Terms" (PDF). Telstra. p. 7. Archived (PDF) from the original on 10 April 2017. Retrieved 26 October 2016.
  38. ^ "Prefixes for binary multiples". iec.ch. International Electrotechnical Commission. Archived from the original on 25 September 2016. Retrieved 1 October 2016.
  39. ^ "SA400 minifloppy". Swtpc.com. 2013-08-14. Archived from the original on 2014-05-27. Retrieved 2014-03-25.
  40. ^ "Archived copy" (PDF). Archived from the original (PDF) on 2011-06-08. Retrieved 2011-06-24.CS1 maint: archived copy as title (link)
  41. ^ "Archived copy" (PDF). Archived from the original (PDF) on 2011-04-23. Retrieved 2011-06-24.CS1 maint: archived copy as title (link)
  42. ^ IUCr 1995 Report - IUPAC Interdivisional Committee on Nomenclature and Symbols (IDCNS) http://ww1.iucr.org/iucr-top/cexec/rep95/idcns.htm
  43. ^ "Binary Prefix" University of Auckland Department of Computer Science https://wiki.cs.auckland.ac.nz/stageonewiki/index.php/Binary_prefix
  44. ^ National Institute of Standards and Technology. "Prefixes for binary multiples". Archived from the original on 2007-08-08. "In December 1998 the International Electrotechnical Commission (IEC) [...] approved as an IEC International Standard names and symbols for prefixes for binary multiples for use in the fields of data processing and data transmission."
  45. ^ NIST "Prefixes for binary multiples" https://physics.nist.gov/cuu/Units/binary.html
  46. ^ Amendment 2 to IEC International Standard IEC 60027-2: Letter symbols to be used in electrical technology - Part 2: Telecommunications and electronics.
  47. ^ "What is a kilobyte?". Retrieved 2010-05-20.
  48. ^ "Order Granting Motion to Dismiss" (PDF). United States District Court. Retrieved 2020-01-24.
  49. ^ a b c Mook, Nate (2006-06-28). "Western Digital Settles Capacity Suit". betanews. Retrieved 2009-03-30.
  50. ^ Baskin, Scott D. (2006-02-01). "Defendant Western Digital Corporation's Brief in Support of Plaintiff's Motion for Preliminary Approval". Orin Safier v. Western Digital Corporation. Western Digital Corporation. Retrieved 2009-03-30.
  51. ^ Judge, Peter (2007-10-26). "Seagate pays out over gigabyte definition". ZDNet. Retrieved 2014-09-16.
  52. ^ Allison Dexter, "How Many Words are in Harry Potter?", [1]; shows 190,637 words
  53. ^ Kilobytes Megabytes Gigabytes Terabytes (Stanford University)
  54. ^ Perenson, Melissa J. (4 January 2007). "Hitachi Introduces 1-Terabyte Hard Drive". www.pcworld.com. Retrieved 5 December 2020.
  55. ^ "What does a petabyte look like?". Archived from the original on 28 January 2018. Retrieved 19 February 2018.
  56. ^ Gross, Grant (24 November 2007). "Internet Could Max Out in 2 Years, Study Says". PC World. Archived from the original on 26 November 2007. Retrieved 28 November 2007.
  57. ^ Cline, Marshall. "I could imagine a machine with 9-bit bytes. But surely not 16-bit bytes or 32-bit bytes, right?".
  58. ^ Klein, Jack (2008), Integer Types in C and C++, archived from the original on 2010-03-27, retrieved 2015-06-18
  59. ^ Cline, Marshall. "C++ FAQ: the rules about bytes, chars, and characters".
  60. ^ "External Interfaces/API". Northwestern University.
  61. ^ "Avatar - The Last Airbender: The Complete Series Blu-ray". Blu-ray.com. Archived from the original on 28 April 2020. Retrieved 24 February 2021.

Further reading[edit]

  • Programming with the PDP-10 Instruction Set (PDF). PDP-10 System Reference Manual. 1. Digital Equipment Corporation (DEC). August 1969. Archived (PDF) from the original on 2017-04-05. Retrieved 2017-04-05.
  • Ashley Taylor. “Bits and Bytes.” Stanford. https://web.stanford.edu/class/cs101/bits-bytes.html