ISO / IEC 8859-15: 1999 , Tecnología de la información - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Parte 15: Alfabeto latino No. 9 , es parte de la serie ISO / IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primero edición publicada en 1999. Se le conoce informalmente como Latin-9 (y por un tiempo Latin-0 ). Es similar a la norma ISO 8859-1 y, por lo tanto, también está destinada a los idiomas de "Europa occidental", pero reemplaza algunos símbolos menos comunes con el símbolo del euro y algunas letras que se consideraron necesarias: [1]
MIME / IANA | ISO-8859-15 |
---|---|
Alias | latín-9, latín-0 |
Estándar | ISO / IEC 8859 |
Clasificación | ISO 8859 ( ASCII extendido , ISO 4873 nivel 1) |
Se extiende | US-ASCII |
Residencia en | ISO-8859-1 |
Precedido por | ISO-8859-1 |
A4 | A6 | A8 | B4 | B8 | antes de Cristo | BD | SER | |
---|---|---|---|---|---|---|---|---|
8859-1 | ¤ | ¦ | ¨ | ´ | ¸ | ¼ | ½ | ¾ |
8859-15 | € | S | s | Ž | ž | Œ | œ | Ÿ |
ISO-8859-15 es el nombre de juego de caracteres preferido de IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO / IEC 6429 .
Microsoft ha asignado la página de códigos 28605, también conocida como Windows-28605, a ISO-8859-15. IBM ha asignado la página de códigos 923 ( CCSID 923) a ISO 8859-15. [2] [3]
Todos los caracteres imprimibles de ISO / IEC 8859-1 e ISO / IEC 8859-15 también se encuentran en Windows-1252 . Desde octubre de 2016, el 0,1% de todos los sitios web utilizan ISO-8859-15. [4] [5]
Historia
El identificador ISO 8859-15 se propuso para los idiomas sami en 1996, que finalmente fue rechazado, pero pasó a ser ISO-IR 197 . [6] [7] [8]
En 1997 se hizo una propuesta denominada ISO 8859-0 para reemplazar 4 caracteres ISO 8859-1 no utilizados o que se utilizan raramente ( ¤ , ¨ , ´ y ¸ ) por € , Œ , œ y Ÿ . [9] € se hicieron necesarios cuando se introdujo el euro . Œ y œ son ligaduras francesas, y Ÿ es necesaria para que el texto en francés se pueda convertir de minúsculas a mayúsculas y viceversa sin pérdida. Irónicamente, la última tres ya habían estado presentes en diciembre 's juego de caracteres multinacional (MCS) en 1983, un conjunto de caracteres de la que ECMA-94 se derivaron (1985) e ISO-8859-1 (1987). Dado que sus puntos de código originales ahora estaban ocupados por otros caracteres, se tuvieron que elegir puntos de código menos lógicos para su reintroducción.
La misma propuesta también recomendó reemplazar 6 caracteres más ( ¢ , ¦ , ± , ¼ , ½ , ¾ ) con "algunos otros caracteres para cubrir un máximo de idiomas". [9] Para el signo del euro, algunos querían reemplazar el signo más-menos en lugar del signo de la moneda. El signo de moneda se utiliza en algunas aplicaciones como separador de campo y en otras para indicar el subtotal ). Hubo una fuerte oposición a esto. Una persona dijo: "La propuesta« + - »no es una alternativa adecuada, ya que esta secuencia, aunque rara vez se usa, ya tiene un significado matemático fijo, bastante diferente de« ± »; y, incluso si un lector pudiera deducir la es decir, «±», del contexto, «+ -» en lugar de «±» dañará los sentimientos estéticos de un físico al menos tanto como «oe» en lugar de una ligadura oe de un francófono .. " [10] En el fin, ± y ¢ no fueron reemplazados. Finalmente, se seleccionaron cuatro caracteres: Š , š , Ž y ž [ cita requerida ] , que se utilizan en finlandés y estonio para la transliteración de préstamos y nombres rusos . La propuesta pasó a llamarse ISO 8859-15. [ cuando? ]
Hubo intentos de hacer que ISO 8859-15 sea el conjunto de caracteres predeterminado para la comunicación de 8 bits, pero nunca pudo suplantar al popular ISO 8859-1. Se usó como el juego de caracteres predeterminado para la consola de texto y los programas de terminal en Linux cuando se necesitaba el signo del euro, pero el uso de Unicode completo no era práctico, pero desde entonces ha sido reemplazado por UTF-8 .
Cobertura
ISO 8859-15 codifica lo que se denomina " alfabeto latino nº 9". Este conjunto de caracteres se utiliza en América , Europa Occidental , Oceanía y gran parte de África . También se usa comúnmente en la mayoría de las romanizaciones estándar de los idiomas del este de Asia.
Cada carácter se codifica como un único valor de código de ocho bits. Estos valores de código se pueden utilizar en casi cualquier sistema de intercambio de datos para comunicarse en los siguientes idiomas:
- Idiomas modernos con cobertura completa de su alfabeto.
|
|
|
|
|
- Notas
- ^ Soporte completo excepto Ǿ / ǿ que faltan. Ǿ / ǿ se puede reemplazar con Ø / ø a costa de una mayor ambigüedad.
- ^ Comúnmente compatible con una cobertura casi completa del alfabeto holandés, ya que la IJ , ij que faltasiempre debe representarse como IJ o ij de dos caracteres en formato electrónico.
- ^ Estados Unidos y británicos modernos.
- ^ Nueva ortografía.
- ^ Ortografía clásica básica.
- ^ Ortografía clásica básica.
- ^ Guión de Rumi .
- ^ Bokmål y Nynorsk.
- ^ Europeo y brasileño.
Cobertura de signos de puntuación y apóstrofos
Para algunos idiomas enumerados anteriormente, faltan las comillas tipográficas correctas , ya que solo se incluyen «,», "y '.
Además, esta codificación no proporciona el carácter correcto para el apóstrofo y las comillas altas simples orientadas, aunque algunos textos usan el acento grave con espaciado y el acento agudo con espaciado, que son parte de ISO 8859-1, en lugar de la forma de 6 Comillas o apóstrofos en forma de / 9 (y esto funciona de manera confiable con algunos estilos de fuente, donde todos estos caracteres se muestran como glifos de cuña inclinados).
Diseño de página de códigos
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | ¡ 00A1 | ¢ 00A2 | £ 00A3 | 20 € AC | ¥ 00A5 | Š 0160 | § 00A7 | š 0161 | © 00A9 | ª 00AA | « 00AB | ¬ 00AC | SHY 00AD | ® 00AE | ¯ 00AF |
B_ 176 | ° 00B0 | ± 00B1 | ² 00B2 | ³ 00B3 | Ž 017D | µ 00B5 | ¶ 00B6 | · 00B7 | § 017E | ¹ 00B9 | º 00BA | » 00BB | Œ 0152 | œ 0153 | Ÿ 0178 | ¿ 00BF |
C_ 192 | À 00C0 | Á 00C1 | Â 00C2 | Ã 00C3 | Ä 00C4 | Å 00C5 | Æ 00C6 | Ç 00C7 | È 00C8 | É 00C9 | Ê 00CA | Ë 00CB | Ì 00CC | Í 00CD | Î 00CE | Ï 00CF |
D_ 208 | Ð 00D0 | Ñ 00D1 | Ò 00D2 | Ó 00D3 | Ô 00D4 | Õ 00D5 | Ö 00D6 | × 00D7 | Ø 00D8 | Ù 00D9 | Ú 00DA | Û 00DB | Ü 00DC | Ý 00DD | Þ 00DE | ß 00DF |
E_ 224 | à 00E0 | á 00E1 | â 00E2 | ã 00E3 | ä 00E4 | å 00E5 | æ 00E6 | ç 00E7 | è 00E8 | é 00E9 | ê 00EA | ë 00EB | ì 00EC | í 00ED | î 00EE | ï 00EF |
F_ 240 | ð 00F0 | ñ 00F1 | ò 00F2 | ó 00F3 | ô 00F4 | õ 00F5 | ö 00F6 | ÷ 00F7 | ø 00F8 | ù 00F9 | ú 00FA | û 00FB | ü 00FC | ý 00FD | þ 00FE | ÿ 00FF |
Letra Número Puntuación Símbolo Otro Indefinido Diferencias con ISO-8859-1
Alias
ISO 8859-15 también tiene los siguientes alias específicos del proveedor:
- WE8ISO8859P15 ( base de datos Oracle ) [14]
Ver también
- Conjuntos de caracteres del latín occidental (informática)
Referencias
- ^ "ISO-8859-15" . IANA . Consultado el 8 de marzo de 2016 .
- ^ "Documento de información de la página de códigos 923" . Archivado desde el original el 28 de febrero de 2013.
- ^ "Documento de información CCSID 923" . Archivado desde el original el 1 de diciembre de 2014.
- ^ "Tendencias históricas en el uso de codificaciones de caracteres, noviembre de 2018" . w3techs.com .
- ^ "Preguntas frecuentes" . w3techs.com .
- ^ "Sami suplementario latín no 2" (PDF) . www.itscj.ipsj.or.jp . Consultado el 5 de enero de 2019 .
- ^ Everson, Michael. "Propuesta de ISO 8859-15" . Consultado el 26 de febrero de 2017 .
- ^ Everson, Michael. "Propuesta de ISO 8859-14 (más tarde 15)" . Consultado el 26 de febrero de 2017 .
- ^ a b Everson, Michael. "Propuesta de ISO 8859-0 (más tarde 15)" . Consultado el 26 de febrero de 2017 .
- ^ Stolz, Otto (11 de julio de 1997). "Re: Nuevo borrador de ISO 8859-0" . Lista de correo Unicode (lista de correo).
- ^ Página de códigos CPGID 00923 (pdf) (PDF) , IBM
- ^ Página de códigos CPGID 00923 (txt) , IBM
- ^ Componentes internacionales para Unicode (ICU), ibm-923_P100-1998.ucm , 2002-12-03
- ^ Baird, Cathy; Chiba, Dan; Chu, Winson; Fan, Jessica; Ho, Claire; Ley, Simón; Lee, Geoff; Linsley, Peter; Matsuda, Keni; Oscroft, Tamzin; Takeda, Shige; Tanaka, Linus; Tozawa, Makoto; Trute, Barry; Tsujimoto, Mayumi; Wu, Ying; Yau, Michael; Yu, Tim; Wang, Chao; Wong, Simon; Zhang, Weiran; Zheng, Lei; Zhu, Yan; Moore, Valarie (2002) [1996]. "Apéndice A: Datos de configuración regional". Guía de soporte para la globalización de la base de datos Oracle9i (PDF) (Versión 2 (9.2) ed.). Oracle Corporation . Oracle A96529-01. Archivado (PDF) desde el original el 14 de febrero de 2017 . Consultado el 14 de febrero de 2017 .
enlaces externos
- ISO / IEC 8859-15: 1999
- ISO / IEC 8859-15: 1998 - Juegos de caracteres gráficos codificados de un solo byte de 8 bits, Parte 15: Alfabeto latino No. 9 (borrador del 1 de agosto de 1997; reemplazado por ISO / IEC 8859-15: 1999, publicado el 15 de marzo , 1999)
- ISO Latin 9 en comparación con ISO Latin 1
- ISO-IR 203 Conjunto latino suplementario europeo (16 de septiembre de 1998)