La página de códigos de Windows 936 (abreviado MS936 , Windows-936 o (ambiguamente) CP936 ), [1] es la codificación de caracteres de Microsoft para chino simplificado , uno de los cuatro DBCS para idiomas de Asia oriental . Originalmente, Windows-936 cubría GB 2312 (en su forma EUC-CN ), pero se expandió para cubrir la mayor parte de GBK con el lanzamiento de Windows 95 .
La página de códigos 936 [2] de IBM es una codificación diferente para chino simplificado, aunque International Components para Unicode no incluye un códec IBM-936 y utiliza la página de códigos de Windows para la etiqueta "cp936". [1] La página de códigos de IBM para la cobertura GBK es la página de códigos 1386 ( CP1386 o IBM-1386 ), que se define como una combinación de la página de códigos de un solo byte 1114 y la página de códigos de dos bytes 1385 . [3]
Fue reemplazado por la página de códigos 54936 ( GB 18030 ), pero a partir de 2014 [actualizar]todavía prevalecía en uso. El símbolo del sistema de Windows usa CP936 como la página de códigos predeterminada para las instalaciones en chino simplificado, aunque parte del GB 18030 se hizo obligatorio para todos los productos de software vendidos en China. En 2002, el nombre de Internet de IANA GBK se registró con el mapeo de Windows-936, [4] [5] convirtiéndolo en la definición de facto de GBK en Internet.
Los conceptos de "Windows-936", "GBK", [a] "GB2312" y "EUC-CN" a veces se confunden en varios productos de software. Las páginas de códigos MS936 y 1386 no son idénticas a GBK porque una página de códigos codifica caracteres, mientras que GBK solo [ cita requerida ] define puntos de código. Además, el signo del euro (€), codificado como 0x80 tanto en Windows-936 como en IBM-1386, no está definido en GBK. Por otro lado, 95 caracteres definidos en GBK inicialmente no se codificaron en Windows-936.
Esto se resuelve parcialmente en versiones posteriores de Windows y, al igual que en Windows 7, todos los caracteres GBK que no están en el área de uso privado de Unicode BMP se pueden mostrar usando la página de códigos 936, pero la codificación de los 95 caracteres aún no era compatible a partir de 2014 [actualizar]. Sin embargo, "CP936" y "GBK" a menudo se usan indistintamente debido a la popularidad de los productos de Microsoft en el mercado chino cuando se publicó GBK.
Dado que GBK reemplazó a GB 2312 hace mucho tiempo, estos dos términos también se han convertido virtualmente en equivalentes para muchos usuarios, por lo que muchos malinterpretan "Windows-936", "GBK" y "GB 2312" como lo mismo, aunque en realidad difieren significativamente. En lugar de admitir exactamente EUC-CN / GB 2312, la mayoría de los productos de software basados en Windows de hoy en día significan compatibilidad parcial para GBK a través de Windows-936 cuando utilizan el término "GB 2312" como una opción de codificación de caracteres. Esto se puede observar en productos como Microsoft Internet Explorer y Notepad ++.
Notas
- ^ GBK 1.0
Referencias
- ^ a b "windows-936-2000 (alias cp936)" . Demostración de UCI - Explorador de convertidores . Componentes internacionales para Unicode.
- ^ "Identificadores de juego de caracteres codificados - CCSID 936" . Globalización de IBM . IBM. Archivado desde el original el 1 de diciembre de 2014.
- ^ "Identificadores de juego de caracteres codificados - CCSID 1386" . IBM. Archivado desde el original el 29 de noviembre de 2014.
- ^ "Juegos de caracteres" . Consultado el 3 de octubre de 2016 .
- ^ Aplicación de registro de juego de caracteres de IANA para GBK
enlaces externos
Windows-936:
- Referencia de Microsoft para Windows-936
- Archivo de página de códigos para Windows-936
- Asignación de Windows-936 a Unicode
- Demostración de UCI de Windows-936
- Componentes internacionales para Unicode (ICU), windows-936-2000.ucm
IBM-1386: