El código de escritura tamil para el intercambio de información ( TSCII ) es un esquema de codificación para representar la escritura tamil . Los 128 puntos de código inferiores son ASCII simple , los 128 puntos de código superiores son específicos de TSCII. Después de muchos años de ser utilizado en Internet solo mediante acuerdos privados, se registró con éxito en la IANA en 2007. [1]
TSCII codifica los caracteres en orden visual (escrito), en paralelo al uso de la máquina de escribir tamil.
Unicode ha utilizado la estrategia de codificación de orden lógico para Tamil, siguiendo ISCII , en contraste con el caso de Thai , donde se adoptó la codificación de orden visual protegida por TIS-620 .
El gobierno de Tamil Nadu respalda sus propios estándares TAB / TAM para la codificación de 8 bits y todavía se pueden encontrar otros esquemas de codificación más antiguos en la WWW.
La colección gratuita de etext en Project Madurai usa la codificación TSCII , pero ya ha comenzado a proporcionar versiones Unicode .
Historia
Los miembros de varios foros basados en listas de correo sintieron la necesidad de una codificación común para Tamil a mediados de la década de 1990, ya que en esos foros prevalecían varias fuentes codificadas personalizadas. Si bien algunas de las codificaciones comerciales eran populares que otras, no fueron aceptadas por una comunidad más amplia debido a intereses comerciales en conflicto. Si bien Unicode fue aceptado por la mayoría como el estándar futuro, la mayoría de los sistemas de escritorio en ese momento todavía no eran capaces de manejar Unicode para el lenguaje tamil, y se requería una codificación provisional de 8 bits.
En 1997 se creó una lista de correo separada para la discusión de tales codificaciones ([email protected]) para iniciar esta discusión, comenzando con un correo electrónico escrito por el doctor K. Kalyanasundaram al popular autor tamil Sujatha, quien encabezó el comité para la estandarización de la lengua tamil. teclado. [2] Este foro atrajo rápidamente a participantes entusiastas de todo el mundo, incluidos varios destacados eruditos tamiles. INFITT mantiene los archivos de esta discusión . [3]
Después de la publicación de TSCII, la mayoría de los miembros de la lista de correo [email protected] se convirtieron en parte de INFITT, que es una iniciativa más amplia para lograr la estandarización y el desarrollo continuo en varias áreas de la informática tamil.
Diseño de página de códigos
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ 128 | ௦ [a] 0BE6 | ௧ 0BE7 | ஸ்ரீ 0BB8 0BCD 0BB0 0BC0 | ஜ 0B9C | ஷ 0BB7 | ஸ 0BB8 | ஹ 0BB9 | க்ஷ 0B95 0BCD 0BB7 | ஜ் 0B9C 0BCD | ஷ் 0BB7 0BCD | ஸ் 0BB8 0BCD | ஹ் 0BB9 0BCD | க்ஷ் 0B95 0BCD 0BB7 0BCD | ௨ 0BE8 | ௩ 0BE9 | ௪ 0BEA |
9_ 144 | ௫ 0BEB | ' 2018 | ' 2019 | “ 201C | " 201D | ௬ 0BEC | ௭ 0 CAMA | ௮ 0BEE | ௯ 0BEF | ஙு 0B99 0BC1 | ஞு 0B9E 0BC1 | ஙூ 0B99 0BC2 | ஞூ 0B9E 0BC2 | ௰ 0BF0 | ௱ 0BF1 | ௲ 0BF2 |
A_ 160 | NBSP 00A0 | ா 0BBE | ி 0BBF | ீ 0BC0 | ு 0BC1 | ூ 0BC2 | ெ 0BC6 | ே 0BC7 | ை 0BC8 | © 00A9 | ௗ 0BD7 | அ 0B85 | ஆ 0B86 | ஈ 0B88 | உ 0B89 | |
B_ 176 | ஊ 0B8A | எ 0B8E | ஏ 0B8F | ஐ 0B90 | ஒ 0B92 | ஓ 0B93 | ஔ 0B94 | ஃ 0B83 | க 0B95 | ங 0B99 | ச 0B9A | ஞ 0B9E | ட 0B9F | ண 0BA3 | த 0BA4 | ந 0BA8 |
C_ 192 | ப 0BAA | ம 0BAE | ய 0BAF | ர 0BB0 | ல 0BB2 | வ 0BB5 | ழ 0BB4 | ள 0BB3 | ற 0BB1 | ன 0BA9 | டி 0B9F 0BBF | டீ 0B9F 0BC0 | கு 0B95 0BC1 | சு 0B9A 0BC1 | டு 0B9F 0BC1 | ணு 0BA3 0BC1 |
D_ 208 | து 0BA4 0BC1 | நு 0BA8 0BC1 | பு 0BAA 0BC1 | மு 0BAE 0BC1 | யு 0BAF 0BC1 | ரு 0BB0 0BC1 | லு 0BB2 0BC1 | வு 0BB5 0BC1 | ழு 0BB4 0BC1 | ளு 0BB3 0BC1 | று 0BB1 0BC1 | னு 0BA9 0BC1 | கூ 0B95 0BC2 | சூ 0B9A 0BC2 | டூ 0B9F 0BC2 | ணூ 0BA3 0BC2 |
E_ 224 | தூ 0BA4 0BC2 | நூ 0BA8 0BC2 | பூ 0BAA 0BC2 | மூ 0BAE 0BC2 | யூ 0BAF 0BC2 | ரூ 0BB0 0BC2 | லூ 0BB2 0BC2 | வூ 0BB5 0BC2 | ழூ 0BB4 0BC2 | ளூ 0BB3 0BC2 | றூ 0BB1 0BC2 | னூ 0BA9 0BC2 | க் 0B95 0BCD | ங் 0B99 0BCD | ச் 0B9A 0BCD | ஞ் 0B9E 0BCD |
F_ 240 | ட் 0B9F 0BCD | ண் 0BA3 0BCD | த் 0BA4 0BCD | ந் 0BA8 0BCD | ப் 0BAA 0BCD | ம் 0BAE 0BCD | ய் 0BAF 0BCD | ர் 0BB0 0BCD | ல் 0BB2 0BCD | வ் 0BB5 0BCD | ழ் 0BB4 0BCD | ள் 0BB3 0BCD | ற் 0BB1 0BCD | ன் 0BA9 0BCD | இ 0B87 |
Letra Número Puntuación Símbolo Otro Indefinido
- ^ U + 0BE6 TAMIL DIGIT ZERO, que se agregó con la versión 4.1 de Unicode en marzo de 2005
Herramientas de conversión
Puede convertir documentos codificados en UTF-8 a TSCII utilizando las herramientas GNU iconv de la siguiente manera,
$ iconv -f utf-8 -t tscii hola.utf8> hola.tscii
Mientras que la conversión de TSCII a UTF-8 se realiza intercambiando indicadores -f y -t .
Aplicación visual
Un proyecto de código abierto está disponible en AnyTaFont2UTF8 es mantenido por Isaiyini Tamil Community
Ver también
- TACE16 (codificación de todos los caracteres en tamil)