De Wikipedia, la enciclopedia libre
  (Redirigido desde CJK )
Saltar a navegación Saltar a búsqueda
Caracteres CJKV derivados de caracteres chinos antiguos. De izquierda a derecha: japonés, vietnamita, coreano, chino simplificado, chino tradicional taiwanés.

En la internacionalización , los caracteres CJK es un término colectivo para los idiomas chino , japonés y coreano , todos los cuales incluyen caracteres chinos y sus derivados en sus sistemas de escritura, a veces combinados con otros alfabetos. En conjunto, los caracteres CJK suelen incluir hànzì en chino , kanji , kana en japonés , hanja y hangul en coreano . En raras ocasiones, se incluye el vietnamita , lo que hace que la abreviatura CJKV, ya que los vietnamitas históricamente también usaron caracteres chinos; para obtener detalles sobre los caracteres chino-vietnamitas, consulte el artículo Chữ Nôm .

Repertorio de personajes [ editar ]

El chino mandarín estándar y el cantonés estándar están escritos casi exclusivamente en caracteres chinos. Requiere más de 3,000 caracteres para la alfabetización general , pero hasta 40,000 caracteres para una cobertura razonablemente completa. El japonés usa menos caracteres; se puede esperar una alfabetización general en japonés con 2.136 caracteres. El uso de caracteres chinos en Corea es cada vez más raro, aunque el uso idiosincrásico de caracteres chinos en nombres propios requiere el conocimiento (y por lo tanto la disponibilidad) de muchos más caracteres. Sin embargo, incluso hoy, a los estudiantes de Corea del Sur se les enseñan 1.800 caracteres.

Otras escrituras utilizadas para estos idiomas, como bopomofo y el pinyin de origen latino para el chino, hiragana y katakana para el japonés y hangul para el coreano, no son estrictamente "caracteres CJK", aunque los conjuntos de caracteres CJK casi siempre los incluyen como necesarios para el cobertura de los idiomas de destino.

Hasta principios del siglo XX, el chino clásico fue el idioma escrito del gobierno y la erudición en Vietnam. La literatura popular en vietnamita se escribió en la escritura chữ Nôm , que consta de caracteres chinos prestados junto con muchos caracteres creados localmente. Desde la década de 1920 en adelante, el guión que se ha utilizado desde entonces para registrar literatura ha sido el alfabeto latino vietnamita . [1] [2]

El sinólogo Carl Leban (1971) produjo un estudio temprano de los sistemas de codificación CJK.

Codificación [ editar ]

El número de caracteres necesarios para una cobertura completa de las necesidades de todos los idiomas no caben en el espacio de código de 256 caracteres de 8 bits de codificación de caracteres , lo que requiere al menos una de 16 bits de ancho fijo codificación o de múltiples bytes codificaciones de longitud variable. Las codificaciones de ancho fijo de 16 bits, como las de Unicode hasta la versión 2.0 incluida, ahora están en desuso debido al requisito de codificar más caracteres de los que puede admitir una codificación de 16 bits (Unicode 5.0 tiene unos 70.000 caracteres Han) y el requisito del gobierno chino de que el software en China admita el juego de caracteres GB 18030 .

Aunque las codificaciones CJK tienen conjuntos de caracteres comunes, las codificaciones que se utilizan a menudo para representarlas han sido desarrolladas por separado por diferentes gobiernos y empresas de software de Asia oriental, y son mutuamente incompatibles. Unicode ha intentado, con cierta controversia, unificar los conjuntos de caracteres en un proceso conocido como unificación Han .

Las codificaciones de caracteres CJK deben consistir como mínimo en caracteres Han más escrituras fonéticas específicas del idioma, como pinyin , bopomofo , hiragana, katakana y hangul.

Las codificaciones de caracteres CJK incluyen:

  • Big5 (la codificación más frecuente antes de que se implementara Unicode)
  • CCCII
  • CNS 11643 (estándar oficial de la República de China )
  • EUC-JP
  • EUC-KR
  • GB2312 (subconjunto y predecesor de GB18030)
  • GB18030 (estándar obligatorio en la República Popular de China )
  • Conjunto de caracteres Giga (GCS)
  • ISO 2022-JP
  • KS C 5861
  • Mayús-JIS
  • TRON
  • Unicode

Los juegos de caracteres CJK ocupan la mayor parte del espacio de código Unicode asignado . Existe mucha controversia entre los expertos japoneses en caracteres chinos sobre la conveniencia y el mérito técnico del proceso de unificación Han utilizado para mapear múltiples conjuntos de caracteres chinos y japoneses en un solo conjunto de caracteres unificados. [ cita requerida ]

Los tres idiomas se pueden escribir tanto de izquierda a derecha como de arriba a abajo (de derecha a izquierda y de arriba a abajo en documentos antiguos), pero generalmente se consideran escrituras de izquierda a derecha cuando se discuten problemas de codificación.

Situación legal [ editar ]

Las bibliotecas cooperaron en los estándares de codificación para los caracteres JACKPHY a principios de la década de 1980. Según Ken Lunde , la abreviatura "CJK" era una marca comercial registrada de Research Libraries Group [3] (que se fusionó con OCLC en 2006). La marca comercial propiedad de OCLC entre 1987 y 2009 ya venció. [4]

Ver también [ editar ]

  • Idiomas de descripción de caracteres chinos
  • Codificación de caracteres chinos
  • Métodos de entrada chinos para computadoras
  • Ideogramas de compatibilidad CJK
  • Trazos CJK
  • Ideogramas unificados de CJK
  • Lenguajes de diseño de texto complejos (CTL)
  • Editor de métodos de entrada
  • Lengua japonesa y computadoras
  • Idioma coreano y computadoras
  • Lista de fuentes CJK
  • Sinoxénico
  • Codificación de ancho variable

Referencias [ editar ]

  1. ^ Coulmas (1991) , págs. 113-115.
  2. ^ DeFrancis (1997) .
  3. ^ Ken Lunde, 1996
  4. ^ Listado de Justia

Este artículo se basa en material extraído del Diccionario de Computación en línea gratuito antes del 1 de noviembre de 2008 e incorporado bajo los términos de "renovación de licencias" de la GFDL , versión 1.3 o posterior.

  • DeFrancis, John . El idioma chino: realidad y fantasía . Honolulu: University of Hawaii Press, 1990. ISBN  0-8248-1068-6 .
  • Hannas, William C. El dilema ortográfico de Asia . Honolulu: University of Hawaii Press, 1997. ISBN 0-8248-1892-X (rústica); ISBN 0-8248-1842-3 (tapa dura).  
  • Lemberg, Werner: El paquete CJK para LATEX2ε: soporte multilingüe más allá de babel. TUGboat, Volumen 18 (1997), No. 3 — Actas de la Reunión Anual de 1997.
  • Líbano, Carl. Sistemas ortográficos automatizados para idiomas de Asia oriental (chino, japonés, coreano) , informe de vanguardia, preparado para la junta directiva de la Asociación de Estudios Asiáticos. 1971.
  • Lunde, Ken . Procesamiento de información CJKV . Sebastopol, Calif .: O'Reilly & Associates, 1998. ISBN 1-56592-224-7 . 

Enlaces externos [ editar ]

  • CJKV: Una breve introducción
  • Artículo de Lemberg CJK desde arriba, TUGboat18-3
  • Sobre "CJK Unified Ideograph" , de Wenlin.com
  • FGA: racionalización del juego de caracteres Unicode CJKV