ISO 11940 es una norma ISO para la transcripción de caracteres tailandeses , publicada en 1998 y actualizada en septiembre de 2003 y confirmada en 2008. Una extensión de esta norma denominada ISO 11940-2 define una transcripción simplificada basada en ella.
Consonantes
tailandés | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
YO ASI | k | k̄h | ḳ̄h | kh | k̛h | ḳh | ng | C | c̄h | ch | s | c̣h | ỵ |
tailandés | ฎ | ฏ | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | |
YO ASI | D | ṭ | ṭ̄h | ṯh | t̛h | norte | D | t | t̄h | th | ṭh | norte | |
tailandés | บ | ป | ผ | ฝ | พ | ฟ | ภ | ม | |||||
YO ASI | B | pag | p̄h | F | ph | F | p̣h | metro | |||||
tailandés | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ |
YO ASI | y | r | v | l | ł | w | s | s | s | h̄ | ḷ | X | ḥ |
La transliteración de las consonantes puras se deriva de su pronunciación habitual como consonante inicial. Se utiliza una h sin marcar para formar dígrafos que denotan consonantes aspiradas . Los pares de consonantes altos y bajos se diferencian sistemáticamente aplicando un macron a la consonante de clase alta. Se obtiene una mayor diferenciación de consonantes con función fonética idéntica dejando las más frecuentes sin marcar, marcando la segunda más común con un punto debajo, marcando la tercera más común con un cuerno y marcando la cuarta más común subrayando. El uso de un punto a continuación tiene un efecto similar a la práctica indológica de distinguir consonantes retroflexivas mediante un punto debajo, pero hay diferencias sutiles: son las transliteraciones de ธtho thong y ศso sala las que están punteadas debajo, no las del consonantes retroflex correspondientes . Las transliteraciones de consonantes deben ingresarse en el orden de la letra base, macron si lo hay, y luego el punto debajo, cuerno o "macron debajo".
Solo tres consonantes tienen el cuerno en su transliteración, ฅkho khon , ฒtho phuthao y ษso ruesi , y solo una consonante tiene un subrayado, ฑtho nang montho .
Vocales
tailandés | ะ | - ั | า | ำ | - ิ | - ี | - ึ | - ื | - ุ | - ู | เ | แ | โ | ใ | ไ | ฤ | ฤๅ | ฦ | ฦๅ | ย | ว | อ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
YO ASI | a | a | a | a | I | I | ụ | ụ̄ | tu | ū | mi | æ | o | I | I | v | vɨ | ł | łɨ | y | w | X |
La letra å es el único carácter precompuesto especificado en la salida de la transliteración.
Lakkhangyao (ๅ) se ha mostrado solo en combinación con las letras vocales ฤ y ฦ. El estándar simplemente enumera ฤ y ฦ con las consonantes y lakkhangyao con las vocales. Un lakkhangyao aislado también sería transcrito por una letra minúscula "i" con trazo ( ɨ ), pero esto no debería ocurrir en tailandés, pali o sánscrito.
Las transliteraciones de วwo waen y อo ang se han incluido aquí debido a su uso como símbolos de vocales completos, pero su transcripción no depende de cómo se estén usando y el estándar simplemente los enumera con las consonantes.
Los símbolos de vocales compuestas se transliteran de acuerdo con sus constituyentes.
Otras marcas de combinación
tailandés | - ่ | - ้ | - ๊ | - ๋ | - ็ | - ์ | - ๎ | - ํ | - ฺ |
---|---|---|---|---|---|---|---|---|---|
YO ASI | - | - | - | –̌ | –̆ | –̒ | ~ | –̊ | –̥ |
Tenga en cuenta que yamakkan (- ๎) está representado por una tilde de espaciado, no una tilde de superíndice.
Puntuación y dígitos
tailandés | ๆ | ฯ | ๏ | ฯ | ๚ | ๛ | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
YO ASI | « | ǂ | § | ǀ | ǁ | » | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
ISO 11940: 1998 distingue el símbolo de abreviatura paiyannoi (ฯ) del terminador de oración angkhandiao (ฯ), aunque ni el estándar de carácter nacional TIS 620-2533 ni la versión 5.0 de Unicode los distinguen. Paiyannoi se transcribe como ǂ y angkhandiao se transcribe como ǀ . Tenga en cuenta que paiyannoi , angkhandiao y angkhankhu (๚) se transliteran con las letras utilizadas para las consonantes de clic , no con doble daga, barras verticales o dandas .
Secuencia de caracteres
En general, los caracteres se transcriben de izquierda a derecha y, cuando los caracteres tienen la misma posición horizontal, de arriba a abajo. De hecho, la secuencia vertical se especifica simplemente como marcas de tono y thanthakhat (- ์ ) precede a cualquier otra marca por encima o por debajo de la consonante. El estándar niega al final de la Sección 4.2 que la combinación de sara u (◌ ุ, ◌ ู) y nikkhahit (◌ ํ) pueda ocurrir y luego da un ejemplo al especificar la transliteración de nikkhahit , pero no muestra la transliteración de la combinación. El efecto de estas reglas es que, a excepción de nikkhahit , todas las marcas no vocales adjuntas a una consonante en tailandés se adjuntan a la consonante en la transliteración romana.
El estándar admite que intentar transponer vocales y consonantes prepuestas puede ser reconfortante para aquellos que están acostumbrados al alfabeto romano , pero recomienda que las vocales prepuestas no sean transpuestas.
Por ejemplo, ภาษา ไทย ( RTGS : Phasa Thai ) debe transliterarse a p̣hās̛̄āịthy y เชียงใหม่ ( RTGS : Chiang Mai ) a echīyngıh̄m̀ .
Variaciones
Causas
El estándar especifica el orden en el que se deben escribir los acentos, pero no todos los sistemas de entrada registrarán los acentos en el orden en que se escriben. Unicode especifica dos formas normalizadas para letras con varios acentos, y es muy probable que el texto transliterado se almacene en una de estas formas. Esto complica la transliteración inversa automática. Como los procesos que cumplen con Unicode deben manejar tales variaciones correctamente, las transliteraciones en esta página se han elegido para facilitar la visualización; los sistemas de renderización actuales pueden mostrar formas equivalentes de manera diferente.
Muchas fuentes muestran mal combinaciones novedosas de consonantes y acentos. Por ejemplo, el Instituto de la Lengua de Estonia publica una explicación de la aplicación del estándar al tailandés en la web y, con una excepción, parece ser un cumplimiento del estándar. La excepción es que, a excepción del macrón, los acentos sobre las consonantes están desplazados hacia la derecha, dando la impresión de que se han introducido como los correspondientes caracteres que no se combinan. El estándar especifica las transliteraciones en puntos de código, pero alguien que trabaje con esta explicación libre podría deducir fácilmente que se deben usar las formas de espaciado de los acentos de tono.
UCI (CLDR 1.4.1)
La implementación de ICU , registrada en la versión 1.4.1 del repositorio de datos de configuración regional común patrocinada por Unicode , [1] utiliza un primo en lugar de un cuerno en la transliteración de consonantes. Esto afecta la transliteración de ฅkho khon , ฒtho phuthao y ษso bo ruesi . ฏa patak también se transcribe de manera diferente, como t̩ en lugar de ṭ .
Esta implementación transcribe ำ como ả en lugar de å para evitar la ambigüedad con la secuencia hipotética de escritura tailandesa ะํ ( sara a , nikkhahit ). La implementación de ICU transcribe ฺphinthu como ˌ en lugar de evitar problemas con la normalización Unicode . Esto tiene el efecto secundario de mejorar la legibilidad cuando se aplica a una consonante sin puntos.
La implementación de la UCI translitera ฯpaiyannoi como ‡ (doble daga) y angkhankhu como || (dos barras verticales ASCII). Como la implementación de la UCI usa Unicode, no puede distinguir de manera confiable angkhandiao de paiyannoi sin un análisis semántico, y no hace tal intento.
La secuencia de caracteres de la implementación de la UCI es diferente. Transpone vocales prepuestas con la siguiente consonante y procesa las marcas de una consonante en el orden en que se almacenan en la memoria. (La mayoría de los métodos de entrada tailandeses aseguran que las marcas se almacenen en orden de abajo hacia arriba). No transpone vocales prepuestas con grupos de consonantes completos; Los grupos de consonantes no se pueden identificar con total precisión, y la transposición de vocales con grupos requeriría un símbolo adicional para permitir una conversión confiable de nuevo a la escritura tailandesa.
Por ejemplo, bajo esta implementación ภาษา ไทย se transcribe a p̣hās̄ʹāthịy y เชียงใหม่ a cheīyngh̄ım̀ .
Finalmente, esta implementación genera transliteraciones en Unicode Normalization Form C (NFC).
Ver también
Referencias
- ^ http://unicode.org/Public/cldr/1.4.1/core.zip archivos transforms / ThaiLogical-Latin.xml y transforms / Thai-ThaiLogical.xml (utilizado por los transliteradores de ICU "Thai-Latin" y "Latin- Tailandés")