Este artículo contiene caracteres especiales . Sin el soporte de renderizado adecuado , es posible que vea signos de interrogación, cuadros u otros símbolos . |
En la tipografía digital , la combinación de caracteres son caracteres que están destinados a modificar otros caracteres. Los caracteres combinados más comunes en la escritura latina son los signos diacríticos combinados (incluida la combinación de acentos ).
Unicode también contiene muchos caracteres precompuestos , por lo que en muchos casos es posible usar tanto la combinación de diacríticos como los caracteres precompuestos, a elección del usuario o de la aplicación. Esto conduce a un requisito para realizar la normalización Unicode antes de comparar dos cadenas Unicode y diseñar cuidadosamente convertidores de codificación para mapear correctamente todas las formas válidas de representar un carácter en Unicode a una codificación heredada para evitar la pérdida de datos. [1]
En Unicode, el bloque principal de combinación de diacríticos para idiomas europeos y el alfabeto fonético internacional es U + 0300 – U + 036F. La combinación de signos diacríticos también está presente en muchos otros bloques de caracteres Unicode. En Unicode, los diacríticos siempre se agregan después del personaje principal (a diferencia de algunos conjuntos de caracteres combinados más antiguos, como ANSEL ), y es posible agregar varios diacríticos al mismo carácter, incluidos los diacríticos apilados arriba y abajo, aunque algunos sistemas pueden no hazlos bien.
Los siguientes bloques están dedicados específicamente a combinar personajes:
La combinación de personajes no se limita a estos bloques; por ejemplo, la combinación de dakuten (U + 3099) y la combinación de handakuten (U + 309A) están en el bloque Hiragana , el bloque de Devanagari contiene la combinación de signos vocales y otras marcas para usar con esa escritura, y así sucesivamente. A la combinación de caracteres se les asigna la categoría principal Unicode "M" ("Marca").
Combinación de marcas diacríticas [1] Cuadro de códigos oficial del Consorcio Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | mi | F | |
U + 030x | ◌̀ | ◌́ | ◌̂ | ◌̃ | ◌̄ | ◌̅ | ◌̆ | ◌̇ | ◌̈ | ◌̉ | ◌̊ | ◌̋ | ◌̌ | ◌̍ | ◌̎ | ◌̏ |
U + 031x | ◌̐ | ◌̑ | ◌̒ | ◌̓ | ◌̔ | ◌̕ | ◌̖ | ◌̗ | ◌̘ | ◌̙ | ◌̚ | ◌̛ | ◌̜ | ◌̝ | ◌̞ | ◌̟ |
U + 032x | ◌̠ | ◌̡ | ◌̢ | ◌̣ | ◌̤ | ◌̥ | ◌̦ | ◌̧ | ◌̨ | ◌̩ | ◌̪ | ◌̫ | ◌̬ | ◌̭ | ◌̮ | ◌̯ |
U + 033x | ◌̰ | ◌̱ | ◌̲ | ◌̳ | ◌̴ | ◌̵ | ◌̶ | ◌̷ | ◌̸ | ◌̹ | ◌̺ | ◌̻ | ◌̼ | ◌̽ | ◌̾ | ◌̿ |
U + 034x | ◌̀ | ◌́ | ◌͂ | ◌̓ | ◌̈́ | ◌ͅ | ◌͆ | ◌͇ | ◌͈ | ◌͉ | ◌͊ | ◌͋ | ◌͌ | ◌͍ | ◌͎ | CGJ |
U + 035x | ◌͐ | ◌͑ | ◌͒ | ◌͓ | ◌͔ | ◌͕ | ◌͖ | ◌͗ | ◌͘ | ◌͙ | ◌͚ | ◌͛ | ◌͜◌ | ◌͝◌ | ◌͞◌ | ◌͟◌ |
U + 036x | ◌͠◌ | ◌͡◌ | ◌͢◌ | ◌ͣ | ◌ͤ | ◌ͥ | ◌ͦ | ◌ͧ | ◌ͨ | ◌ͩ | ◌ͪ | ◌ͫ | ◌ͬ | ◌ͭ | ◌ͮ | ◌ͯ |
Notas
|
Los puntos de código U + 032A y U + 0346–034A son símbolos IPA :
Los puntos de código U + 034B – 034E son signos diacríticos IPA para el habla desordenada :
U + 034F es el " combinador de grafema combinado " (CGJ) y no tiene ningún glifo visible.
Los puntos de código U + 035C – 0362 son signos diacríticos dobles , signos diacríticos colocados en dos letras.
Los puntos de código U + 0363–036F son diacríticos de letras en superíndice medievales, letras escritas directamente sobre otras letras que aparecen en manuscritos germánicos medievales, pero en algunos casos se utilizan hasta el siglo XIX. Por ejemplo, U + 0364 es una e escrita encima de la letra anterior, que se usará para la notación de diéresis del nuevo alemán alto ( temprano ) , como uͤ para el alemán moderno ü .
Ampliación de la combinación de marcas diacríticas [1] [2] Cuadro de códigos oficial del Consorcio Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | mi | F | |
U + 1ABx | ◌᪰ | ◌᪱ | ◌᪲ | ◌᪳ | ◌᪴ | ◌᪵ | ◌᪶ | ◌᪷ | ◌᪸ | ◌᪹ | ◌᪺ | ◌᪻ | ◌᪼ | ◌᪽ | ◌᪾ | ◌ᪿ |
U + 1ACx | ◌ᫀ | ◌᫁ | ◌᫂ | ◌᫃ | ◌᫄ | ◌᫅ | ◌᫆ | ◌᫇ | ◌᫈ | ◌᫉ | ◌᫊ | ◌᫋ | ◌ᫌ | ◌ᫍ | ◌ᫎ | |
U + 1ADx | ||||||||||||||||
U + 1AEx | ||||||||||||||||
U + 1AFx | ||||||||||||||||
Notas
|
Suplemento de combinación de marcas diacríticas [1] Cuadro de códigos oficial del Consorcio Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | mi | F | |
U + 1DCx | ◌᷀ | ◌᷁ | ◌᷂ | ◌᷃ | ◌᷄ | ◌᷅ | ◌᷆ | ◌᷇ | ◌᷈ | ◌᷉ | ◌᷊ | ◌᷋ | ◌᷌ | ◌᷍ | ◌᷎ | ◌᷏ |
U + 1DDx | ◌᷐ | ◌᷑ | ◌᷒ | ◌ᷓ | ◌ᷔ | ◌ᷕ | ◌ᷖ | ◌ᷗ | ◌ᷘ | ◌ᷙ | ◌ᷚ | ◌ᷛ | ◌ᷜ | ◌ᷝ | ◌ᷞ | ◌ᷟ |
U + 1DEx | ◌ᷠ | ◌ᷡ | ◌ᷢ | ◌ᷣ | ◌ᷤ | ◌ᷥ | ◌ᷦ | ◌ᷧ | ◌ᷨ | ◌ᷩ | ◌ᷪ | ◌ᷫ | ◌ᷬ | ◌ᷭ | ◌ᷮ | ◌ᷯ |
U + 1DFx | ◌ᷰ | ◌ᷱ | ◌ᷲ | ◌ᷳ | ◌ᷴ | ◌᷵ | ◌᷶ | ◌᷷ | ◌᷸ | ◌᷹ | ◌᷺ | ◌᷻ | ◌᷼ | ◌᷽ | ◌᷾ | ◌᷿ |
Notas
|
Combinación de marcas diacríticas para símbolos [1] [2] Cuadro de códigos oficial del Consorcio Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | mi | F | |
U + 20Dx | ◌⃐ | ◌⃑ | ◌⃒ | ◌⃓ | ◌⃔ | ◌⃕ | ◌⃖ | ◌⃗ | ◌⃘ | ◌⃙ | ◌⃚ | ◌⃛ | ◌⃜ | ◌⃝ | ◌⃞ | ◌⃟ |
U + 20Ex | ◌⃠ | ◌⃡ | ◌⃢ | ◌⃣ | ◌⃤ | ◌⃥ | ◌⃦ | ◌⃧ | ◌⃨ | ◌⃩ | ◌⃪ | ◌⃫ | ◌⃬ | ◌⃭ | ◌⃮ | ◌⃯ |
U + 20Fx | ◌⃰ | |||||||||||||||
Notas
|
Combinación de medias marcas [1] Cuadro de códigos oficial del Consorcio Unicode (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | mi | F | |
U + FE2x | ◌︠ | ◌︡ | ◌︢ | ◌︣ | ◌︤ | ◌︥ | ◌︦ | ◌︧ | ◌︨ | ◌︩ | ◌︪ | ◌︫ | ◌︬ | ◌︭ | ◌︮ | ◌︯ |
Notas
|
OpenType tiene la "etiqueta de función" ccmp para definir glifos que son composiciones o descomposiciones que involucran la combinación de caracteres, la etiqueta de marca para definir el posicionamiento de los caracteres combinados en el glifo base y mkmk para las posiciones de los caracteres combinados entre sí.
La combinación de caracteres se ha utilizado para crear texto de Zalgo , que es texto que parece "corrupto" o "espeluznante" debido al uso excesivo de diacríticos. Esto hace que el texto se extienda verticalmente y se superponga a otro texto. [2]