De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

Diseño estándar de Corea del Sur Dubeolsik (tipo de dos juegos).

El sistema de escritura del coreano , Hangul , es un alfabeto organizado en bloques de sílabas ; los caracteres no se pueden escribir simplemente de izquierda a derecha. Debido a esto, todas las sílabas posibles en coreano deben representarse como bloques de sílabas con una fuente o codificarse por separado. Unicode usa la última opción. Como ejemplo, la sílaba 하 (ha) consta de los caracteres ㅎ (h) y ㅏ (a), pero ambos están codificados por separado.

Diseño Dubeolsik estándar de Corea del Norte

Codificaciones de caracteres [ editar ]

En RFC 1557 , se describió un método conocido como ISO-2022-KR para una codificación de 7 bits de caracteres coreanos en el correo electrónico . Cuando se permiten 8 bits, se prefiere la codificación EUC-KR . Estas dos codificaciones combinan US-ASCII ( ISO 646 ) con la norma coreana KS X 1001 : 1992 [1] (anteriormente denominada KS C 5601: 1987). En Corea del Norte , se utiliza un conjunto de caracteres separado llamado KPS 9566 , que es bastante similar a KS X 1001.

El estándar internacional Unicode contiene caracteres especiales para representar el idioma coreano en el sistema fonético nativo hangul . Hay dos formas compatibles con Unicode. La forma utilizada por Microsoft Windows es tener cada una de las 11.172 combinaciones de sílabas como un código y un carácter de fuente preformado. La otra forma es codificar letras ( jamos ) y dejar que el software las combine en combinaciones correctas, lo que no es compatible con Windows. Por supuesto, la primera forma necesita más memoria de fuentes, pero brinda la posibilidad de obtener mejores formas, ya que es complicado crear combinaciones estilísticamente correctas que pueden ser las preferidas al crear documentos.

También existe la posibilidad de simplemente apilar una (secuencia de) medial (s) ( jungseong ) - y luego una (secuencia de) final (s) ( jongseong ) y / o una marca de tono de coreano medio , si es necesario - encima de la (secuencia de) inicial (es) ( elegida ), si la fuente tiene jamos medial y final con espaciado de ancho cero que se insertan a la izquierda del cursor o el símbolo de intercalación, apareciendo así en el lugar correcto debajo o a la derecha de la inicial. Si una sílaba tiene un medial horizontal ( , , , o ), la inicial probablemente aparecerá más a la izquierda en una sílaba completa que en el caso de las sílabas preformadas debido al espacio que debe reservarse para un medial vertical, dando un aspecto estéticamente pobre a lo que puede ser la única forma de mostrar Middle Texto hangul coreano sin recurrir a imágenes, romanización, sustitución de jamo obsoleto o codificaciones no estándar. Sin embargo, la mayoría de las fuentes actuales no lo admiten.

El estándar Unicode también ha intentado crear un conjunto de caracteres CJK unificado que pueda representar el chino ( Hanzi ), así como los derivados japoneses ( Kanji ) y coreano ( Hanja ) de este script a través del proceso de unificación Han , que no discrimina por idioma ni región para representar caracteres chinos, siempre y cuando las diferentes tradiciones tipográficas no hayan dado lugar a diferencias importantes con respecto a cómo se ve el carácter; consulte la Imagen: Xin-jiu-zixing.png para ver ejemplos de caracteres cuya apariencia recientemente experimentó solo cambios menores en China continental . La unificación de Han ha recibido algunas críticas.

Entrada de texto [ editar ]

En un teclado de computadora coreano, el texto generalmente se ingresa simplemente presionando una tecla para el jamo apropiado ; el sistema operativo crea cada carácter compuesto sobre la marcha. Dependiendo del IME y la distribución del teclado, se pueden ingresar consonantes dobles manteniendo presionado el botón Shift. Cuando todos los jamo que componen un bloque silábico han sido ingresados, el usuario puede iniciar una conversión a hanja u otros caracteres especiales usando un atajo de teclado o un botón de interfaz; Los teclados de Corea del Sur tienen una tecla separada para esto. La conversión posterior de hanja semiautomática se admite en diversos grados en procesadores de texto.

Cuando se usa un teclado de otro idioma, la mayoría de los sistemas operativos requieren que el usuario escriba usando una distribución de teclado coreana original, la más común de las cuales es 2 (du) -beolsik . Esto contrasta con algunos otros idiomas, como el japonés, donde se puede ingresar texto usando un sistema de romanización en teclados no nativos.

No es así que la mayoría de los sistemas operativos, como Linux, permitan engine / hangul / hangul-keyboard = 'ro' , que da como resultado un teclado Romaja, donde teclear "seonggye" da como resultado 성계. [2] En esta configuración, ㄲ se obtiene mediante "gg" y no mediante shift-g. Esto permite teclear "jasanGun" para obtener 자산 군 en lugar de teclear "jasangun" que proporcionaría 자 상운.

Hanja [ editar ]

Aparte de los problemas de conversión mencionados anteriormente, algunas fuentes coreanas no incluyen hanja para empezar. Al mismo tiempo, los procesadores de texto actuales no permiten que el usuario especifique qué fuente usar como respaldo para cualquier hanja que pueda aparecer en un texto. En ese caso, cada secuencia de hanja debe formatearse manualmente para que aparezca en la fuente deseada.

Situaciones especiales [ editar ]

El HTML y la mayoría de los procesadores de texto soportan mal o nada el texto en líneas verticales , aunque esto no es un problema para el coreano moderno, ya que generalmente se escribe horizontalmente. Sin embargo, hasta la segunda mitad del siglo XX, el coreano solía escribirse verticalmente. Los textos del siglo XV escritos en hangul tenían marcas de tono a la izquierda de las sílabas, que están incluidas en Unicode, aunque la mayoría de las fuentes actuales tampoco las admiten adecuadamente.

Consulte la sección anterior sobre codificaciones de caracteres para ver los jamo obsoletos.

Programas [ editar ]

Los programas notables diseñados específicamente para el uso relacionado con el idioma coreano incluyen:

  • Reconocimiento de idioma
    • Se dice que un programa de reconocimiento de voz de Corea del Norte reconoce 100.000 palabras y logra una tasa de éxito de más del 90%. [3]
    • Mongnan ( 목란 ; KCC , [4] Corea del Norte): software de reconocimiento óptico de caracteres con una supuesta tasa de éxito del 99% para texto impreso y del 95% para el reconocimiento de escritura a mano . [3]
  • Editores de métodos de entrada
    • Tan'gun ( 단군 ; Centro de información de Pyongyang , Corea del Norte): permite el uso de hangul en las ediciones en inglés de Windows. [4]
    • Editor de métodos de entrada Hangul de Nalgaeset (날개 셋 한글 입력기); Kim Yongmook, Corea del Sur): un método de entrada hangul que está especialmente diseñado para la distribución de teclado 3 (se) -beolsik (solo funciona en Microsoft Windows).
    • Nabi ( 나비 ), ami ( 아미 ; Corea del Sur): permite escribir hangul en Linux .
    • m17n  : permite usar la romanización revisada para la entrada hangul en Unix.
    • SCIM e iBus  : permite escribir hangul y hanja ensistemas operativos de estilo POSIX , incluidos Linux y BSD .
  • Los procesadores de texto  - Todos los programas enumerados a continuación incluyen fuentes hangul domésticos, fuentes no hangul y un hangul- hanja utilidad de conversión.
    • Hangul ( Haansoft , Corea del Sur)
    • Ch'angdŏk ( 창덕 ; PIC, [4] Corea del Norte) - Este programa existe popular en un MS-DOS versión desarrollada en abril de 1990 [1] y una versión de Windows desarrollado en 1996. [5] Se incluye una peculiar culto a la personalidad característica por lo que presionarCtrl+IoCtrl+Jproduce títulos que exaltan a Kim Il-sung y Kim Jong-il , respectivamente. [6]

Hangul en Unicode [ editar ]

Caracteres Hangul Jamo en Unicode
Bloque Jamo de compatibilidad con Hangul en Unicode

Las letras Hangul se detallan en varias partes separadas de la especificación Unicode:

  • Sílabas Hangul (AC00 – D7A3)
  • Hangul Jamo (11.00 a 11ff)
  • Compatibilidad con Hangul Jamo (3130–318F)
  • Hangul Jamo Extended-A (A960 – A97F)
  • Hangul Jamo Extended-B (D7B0 – D7FF)

Bloque de sílabas Hangul [ editar ]

Las sílabas hangul precompuestas en el bloque de sílabas Hangul en Unicode se definen algorítmicamente, utilizando la siguiente fórmula:

[(inicial) × 588 + (medial) × 28 + (final)] + 44032
  • Consonantes iniciales
  • Vocales mediales
  • Consonantes finales

Por ejemplo, si uno quiere encontrar el punto de código de " 한 " en Unicode:

  • El valor de la consonante inicial ㅎ es 18.
  • El valor de la vocal medial ㅏ es 0.
  • El valor de la consonante final ㄴ es 4.

Sustituyendo estos valores a la fórmula anterior, se obtiene [(18 × 588) + (0 × 28) + 4] + 44032 = 54620. Esto significa que el valor Unicode de 한 es 54620 en decimal, 한por la referencia de carácter numérico , y U + D55C en notación Unicode hexadecimal.

Bloque Jamo de compatibilidad con Hangul [ editar ]

Compatibilidad con Hangul El bloque Jamo es parte de Unicode que ha sido asignado para compatibilidad con el juego de caracteres KS X 1001 . Suele utilizarse para representar algún hangul jamo por sí solo, sin distinguir inicial y final .

Bloques Hangul Jamo [ editar ]

Los bloques Hangul Jamo , Hangul Jamo Extended-A y Hangul Jamo Extended-B contienen jamo inicial , jamo medial y jamo final , incluido el jamo obsoleto.

Código de área de uso privado de Hanyang [ editar ]

Hangul (procesador de textos) se envía con fuentes de Hanyang Information and Communication . Sus fuentes asignan caracteres hangul obsoletos al área de uso privado de Unicode. A pesar del uso del Área de uso privado en lugar de puntos de código dedicados, el mapeo de Hanyang fue en 2007 la forma más popular de representar hangul obsoleto en Corea del Sur.

A partir de Hangul 2010, Hancom desaprobó el código PUA de Hanyang y eligió representar caracteres hangul obsoletos utilizando hangul jamo en Unicode.

Ver también [ editar ]

  • Lengua japonesa y computadoras
  • Computadoras y lengua vietnamita
  • Lista de fuentes CJK
  • McCune – Reischauer
  • Romanización de Yale del coreano
  • Romanización revisada
  • Nueva ortografía coreana

Referencias [ editar ]

  1. ^ "KS X 1001: 1992" (PDF) .
  2. ^ https://github.com/libhangul/ibus-hangul
  3. ↑ a b 김치관 (2 de diciembre de 2000).문답 으로 보는 북한 정보화 의 현주소. Tongilnews.com (en coreano) . Consultado el 3 de diciembre de 2006 . CS1 maint: parámetro desalentado ( enlace )
  4. ↑ a b c 김효석 (2 de diciembre de 2000). "<국회 자료집> 북한 S / W 현황 과 시연 자료" . Tongilnews.com (en coreano) . Consultado el 3 de diciembre de 2006 . CS1 maint: parámetro desalentado ( enlace )
  5. ^ Yonhap (7 de enero de 1998).북한 의 컴퓨터 산업 어디 까지 왔나. Tongilnews.com (en coreano) . Consultado el 3 de diciembre de 2006 . CS1 maint: parámetro desalentado ( enlace )[ enlace muerto ]
  6. ^ "북한 용어 사전: 평양 정보 센터 (PIC)" (en coreano). Archivado desde el original el 28 de septiembre de 2007 . Consultado el 3 de diciembre de 2006 .

Enlaces externos [ editar ]

  • Teclado virtual coreano en línea
  • InputKing Online Input System , una herramienta en línea para escribir coreano
  • "Jamo en Unicode" (PDF) . (186 KB)
  • "Sílabas Hangul" (PDF) . (3,86 MB)
  • Hoffmann, Frank. "Estudios coreanos: convertidor Unicode" . koreanstudies.com ., una herramienta en línea para convertir texto coreano en varios formatos de codificación y viceversa