ISO/CEI 8859-1


ISO/IEC 8859-1:1998 , Tecnología de la información — Juegos de caracteres gráficos codificados de un solo byte de 8 bits — Parte 1: Alfabeto latino n.° 1 , es parte de la serie ISO/IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primero edición publicada en 1987. ISO 8859-1 codifica lo que se denomina "alfabeto latino n. ° 1", que consta de 191 caracteres de la escritura latina . Este esquema de codificación de caracteres se utiliza en todo el continente americano , Europa occidental , Oceanía y gran parte de África .. Es la base de algunos juegos de caracteres populares de 8 bits y los primeros dos bloques de caracteres en Unicode .

ISO-8859-1 era (según el estándar, al menos) la codificación predeterminada de documentos entregados a través de HTTP con un tipo MIME que comienza con "text/" ( HTML5 cambió esto a Windows-1252 ). [1] [2] A partir de enero de 2022 , el 1,1 % de todos los sitios web (pero solo 5 de los 1000 principales [3] ) usan ISO 8859-1 . [4] [5] Es la codificación de caracteres de un solo byte más declarada del mundo en la web, pero como los navegadores web la interpretan como el superconjunto Windows-1252, los documentos pueden incluir caracteres de ese conjunto.

Dependiendo del país, el uso puede ser mucho más alto que el promedio mundial, por ejemplo, para Alemania con un 4,6 % (e incluyendo Windows-1252 con un 5,1 %). [6] [7]

ISO-8859-1 fue la codificación predeterminada de los valores de ciertos encabezados HTTP descriptivos y definió el repertorio de caracteres permitidos en los documentos HTML  3.2, y está especificado por muchos otros estándares. A veces se supone que se trata de la codificación de texto en Microsoft Windows (y Unix ) si no hay una marca de orden de bytes (BOM); esto solo se está cambiando gradualmente a UTF-8 .

ISO-8859-1 es el nombre preferido de IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO/IEC 6429 . Los siguientes otros alias están registrados: iso-ir-100 , csISOLatin1 , latin1 , l1 , IBM819 . La página de códigos 28591, también conocida como Windows-28591, se usa en Windows. [8] IBM lo llama página de códigos 819 o CP819 ( CCSID 819). [9] [10] [11] [12] Oracle lo llama WE8ISO8859P1. [13]

Cada carácter se codifica como un único valor de código de ocho bits. Estos valores de código se pueden usar en casi cualquier sistema de intercambio de datos para comunicarse en los siguientes idiomas (aunque puede excluir las comillas correctas , como en muchos idiomas, incluidos el alemán y el islandés):