ISO / IEC 8859-1


ISO / IEC 8859-1: 1998 , Tecnología de la información - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Parte 1: Alfabeto latino No. 1 , es parte de la serie ISO / IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primero edición publicada en 1987. ISO 8859-1 codifica lo que se denomina "alfabeto latino nº 1", que consta de 191 caracteres de la escritura latina . Este esquema de codificación de caracteres se utiliza en América , Europa Occidental , Oceanía y gran parte de África.. Es la base de algunos conjuntos de caracteres de 8 bits populares y los dos primeros bloques de caracteres en Unicode .

ISO-8859-1 era (de acuerdo con el estándar, al menos) la codificación predeterminada de documentos entregados a través de HTTP con un tipo MIME que comienza con "texto /" ( HTML5 cambió esto a Windows-1252 ). [1] [2] En noviembre de 2021 , el 1,1% de todos los sitios web (pero solo 5 de los 1000 principales [3] ) utilizan ISO 8859-1 . [4] [5] Es la codificación de caracteres de un solo byte más declarada en el mundo en la web, pero como los navegadores web la interpretan como el superconjunto Windows-1252, los documentos pueden incluir caracteres de ese conjunto.

Dependiendo del país, el uso puede ser mucho más alto que el promedio mundial, por ejemplo, para Alemania con un 5,1% (e incluyendo Windows-1252 con un 5,4%). [6] [7]

ISO-8859-1 fue la codificación predeterminada de los valores de ciertos encabezados HTTP descriptivos, y definió el repertorio de caracteres permitidos en los  documentos HTML 3.2, y está especificado por muchos otros estándares. A veces se asume que esta es la codificación de texto en Microsoft Windows (y Unix ) si no hay una marca de orden de bytes (BOM); esto solo se está cambiando gradualmente a UTF-8 .

ISO-8859-1 es el nombre preferido de IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO / IEC 6429 . Los siguientes otros alias están registradas: iso-IR-100 , csISOLatin1 , latin1 , l1 , IBM819 . La página de códigos 28591, también conocida como Windows-28591, se utiliza para ello en Windows. [8] IBM lo llama página de códigos 819 o CP819 ( CCSID 819). [9] [10] [11] [12] Oracle lo llama WE8ISO8859P1. [13]

Cada carácter se codifica como un único valor de código de ocho bits. Estos valores de código se pueden utilizar en casi cualquier sistema de intercambio de datos para comunicarse en los siguientes idiomas (aunque pueden excluir las comillas correctas , como en muchos idiomas, incluidos el alemán y el islandés):