De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda
Logotipo de Unicode

Esta es una lista de caracteres Unicode ; hay 143.859 caracteres, con Unicode 13.0, que cubren 154 escrituras modernas e históricas , así como múltiples conjuntos de símbolos. Como no es técnicamente posible enumerar todos estos caracteres en una sola página de Wikipedia, esta lista se limita a un subconjunto de los caracteres más importantes para los lectores de idioma inglés, con enlaces a otras páginas que enumeran los caracteres complementarios. Este artículo incluye los 1062 caracteres del subconjunto Multilingual European Character Set 2 ( MES-2 ) y algunos caracteres adicionales relacionados.

Descripción general de la referencia de personajes [ editar ]

Una referencia de carácter numérico HTML o XML se refiere a un carácter por su punto de código Unicode / Conjunto de caracteres universal , y usa el formato

&#nnnn;

o

&#xhhhh;

donde nnnn es el punto de código en forma decimal y hhhh es el punto de código en forma hexadecimal . La x debe estar en minúsculas en los documentos XML. El nnnn o hhhh puede tener cualquier número de dígitos y puede incluir ceros a la izquierda. El hhhh puede mezclar mayúsculas y minúsculas, aunque mayúsculas es el estilo habitual.

Por el contrario, una referencia de entidad de carácter se refiere a un carácter por el nombre de una entidad que tiene el carácter deseado como texto de reemplazo . La entidad debe estar predefinida (incorporada en el lenguaje de marcado) o declarada explícitamente en una Definición de tipo de documento (DTD). El formato es el mismo que para cualquier referencia de entidad:

&nombre;

donde nombre es el nombre de la entidad que distingue entre mayúsculas y minúsculas. Se requiere el punto y coma.

Códigos de control [ editar ]

65 caracteres, incluido DEL . Todos pertenecen al guión común .

Notas a pie de página:

1 Control-C se ha utilizado típicamente como una tecla de "interrupción" o "interrupción".
2 Se ha utilizado Control-D para señalar "fin de archivo" para el texto escrito en la terminal en sistemas Unix / Linux. Windows, DOS y miniordenadores más antiguos usaban Control-Z para este propósito.
3 Control-G es un artefacto de los días en que se usaban los teletipos . Los mensajes importantes se pueden señalar tocando la campana en el teletipo. Esto se transfirió a las PC generando un zumbido.
4 El avance de línea se utiliza para "fin de línea" en archivos de texto en sistemas Unix / Linux.
5 El retorno de carro (acompañado de salto de línea) se usa como carácter de "fin de línea" en Windows, DOS y la mayoría de las miniordenadores que no sean sistemas basados ​​en Unix / Linux.
6 Control-O ha sido la tecla "descartar salida" en miniordenadores. La salida no se envía al terminal, pero se descarta, hasta que se escribe otro Control-o.
7 Control-Q se ha utilizado para decirle a una computadora host que reanude el envío de salida después de que Control-S lo detuvo.
8 Control-S se ha utilizado para decirle a una computadora host que posponga el envío de salida al terminal. La salida se suspende hasta que se reinicia con la tecla Control-Q.
9 Control-U fue utilizado originalmente por las computadoras de Digital Equipment Corporation para cancelar una línea de texto escrito. Otros fabricantes utilizaron Control-X para este propósito.
10 Control-X se usaba comúnmente para cancelar una línea de entrada ingresada en el terminal.
11 Control-Z se ha utilizado comúnmente en miniordenadores, sistemas Windows y DOS para indicar el "final del archivo" en una terminal o en un archivo de texto. Los sistemas Unix / Linux usan Control-D para indicar el final del archivo en una terminal.

Escritura latina [ editar ]

El estándar Unicode (versión 13.0) clasifica 1.374 caracteres como pertenecientes a la escritura latina.

Latín básico [ editar ]

95 caracteres; los 52 caracteres del alfabeto pertenecen al alfabeto latino. Los 43 restantes pertenecen al guión común .
Los 33 caracteres clasificados como signos de puntuación y símbolos ASCII también se denominan a veces caracteres especiales ASCII . Consulte § Suplemento Latin-1 y § Símbolos Unicode para obtener "caracteres especiales" adicionales. Se pueden usar ciertos caracteres especiales en las contraseñas; algunas organizaciones requieren su uso. Consulte la Lista de caracteres especiales para contraseñas .

Suplemento Latin-1 [ editar ]

96 caracteres; las 62 letras y dos indicadores ordinales pertenecen al alfabeto latino. Los 32 restantes pertenecen al guión común .

Latín extendido-A [ editar ]

128 caracteres; todos pertenecen a la escritura latina.

Latin Extended-B [ editar ]

208 caracteres; todos pertenecen a la escritura latina; 33 en el subconjunto MES-2.

Latín extendido adicional [ editar ]

256 caracteres; todos pertenecen a la escritura latina; 23 en el subconjunto MES-2. Para el resto, consulte Latin Extended Additional (bloque Unicode) .

Latín adicional extendido [ editar ]

  • Latin Extended-C (bloque Unicode)
  • Latin Extended-D (bloque Unicode)
  • Latin Extended-E (bloque Unicode)

Escrituras fonéticas [ editar ]

Extensiones IPA [ editar ]

96 caracteres; todos pertenecen a la escritura latina; tres en el subconjunto MES-2. Para el resto, consulte Extensiones IPA (bloque Unicode) .

Letras modificadoras de espaciado [ editar ]

80 caracteres; 15 en el subconjunto MES-2.

Extensiones fonéticas [ editar ]

  • Extensiones fonéticas (bloque Unicode)
  • Suplemento de extensiones fonéticas (bloque Unicode)

Combinando marcas [ editar ]

  • Combinación de marcas diacríticas (bloque Unicode)
  • Combinación de marcas diacríticas extendidas (bloque Unicode)
  • Combinación de medias marcas (bloque Unicode)
  • Suplemento de combinación de marcas diacríticas (bloque Unicode)
  • Combinación de marcas diacríticas para símbolos (bloque Unicode)

Griego y copto [ editar ]

144 puntos de código; 135 caracteres asignados; 85 en el subconjunto MES-2.

Griego extendido [ editar ]

Para ortografía politónica . 256 puntos de código; 233 caracteres asignados, todos en el subconjunto MES-2 (# 670 - 902).

Cirílico [ editar ]

256 caracteres; 191 en el subconjunto MES-2.

Suplementos cirílicos [ editar ]

  • Suplemento cirílico (bloque Unicode)
  • Cirílico Extendido-A (bloque Unicode)
  • Cirílico Extendido-B (bloque Unicode)
  • Cirílico Extended-C (bloque Unicode)

Armenio [ editar ]

  • Armenio (bloque Unicode)

Lenguas semíticas [ editar ]

  • Escritura árabe en Unicode , incluido el alfabeto persa , el alfabeto jawi y otros
  • Unicode y HTML para el alfabeto hebreo
  • Mandaic (bloque Unicode)
  • Samaritan (bloque Unicode)
  • Siríaco (bloque Unicode)
  • Suplemento siríaco (bloque Unicode)

Thaana [ editar ]

  • Thaana (bloque Unicode)

Escrituras brahmicas (índicas) [ editar ]

El rango de U + 0900 a U + 0DFF incluye devanagari , escritura bengalí , gurmukhi , escritura gujarati , alfabeto odia , escritura tamil , escritura telugu , escritura kannada , escritura malayalam y escritura cingalés .

  • Devanagari en Unicode
  • Bengalí (bloque Unicode)
  • Gurmukhi (bloque Unicode)
  • Gujarati (bloque Unicode)
  • Oriya (bloque Unicode)
  • Tamil (bloque Unicode)
  • Suplemento tamil (bloque Unicode)
  • Telugu (bloque Unicode)
  • Kannada (bloque Unicode)
  • Malayalam (bloque Unicode)
  • Sinhala (bloque Unicode)
  • Números arcaicos cingaleses (bloque Unicode)

Otros scripts brahmicos e índicos en Unicode incluyen:

  • Ahom (bloque Unicode)
  • Balinés (bloque Unicode)
  • Batak (bloque Unicode)
  • Bhaiksuki (bloque Unicode)
  • Brahmi (bloque Unicode)
  • Buhid (bloque Unicode)
  • Buginés (bloque Unicode)
  • Chakma (bloque Unicode)
  • Cham (bloque Unicode)
  • Formularios de números índicos comunes (bloque Unicode)
  • Dives Akuru (bloque Unicode)
  • Dogra (bloque Unicode)
  • Grantha (bloque Unicode)
  • Gunjala Gondi (bloque Unicode)
  • Hanunoo (bloque Unicode)
  • Javanés (bloque Unicode)
  • Kaithi (bloque Unicode)
  • Khmer (bloque Unicode)
  • Símbolos Khmer (bloque Unicode)
  • Khojki (bloque Unicode)
  • Khudawadi (bloque Unicode)
  • Lao (bloque Unicode)
  • Lepcha (bloque Unicode)
  • Limbu (bloque Unicode)
  • Mahajani (bloque Unicode)
  • Makasar (bloque Unicode)
  • Marchen (bloque Unicode)
  • Meetei Mayek (bloque Unicode)
  • Extensiones Meetei Mayek (bloque Unicode)
  • Modi (bloque Unicode)
  • Multani (bloque Unicode)
  • Myanmar (bloque Unicode)
  • Nuevo Tai Lue (bloque Unicode)
  • Newa (bloque Unicode)
  • Ol Chiki (bloque Unicode)
  • Phags-pa (bloque Unicode)
  • Rejang (bloque Unicode)
  • Saurashtra (bloque Unicode)
  • Sharada (bloque Unicode)
  • Siddham (bloque Unicode)
  • Sundanés (bloque Unicode)
  • Suplemento sundanés (bloque Unicode)
  • Syloti Nagri (bloque Unicode)
  • Tagalog (bloque Unicode)
  • Tagbanwa (bloque Unicode)
  • Tai Le (bloque Unicode)
  • Tai Tham (bloque Unicode)
  • Tai Viet (bloque Unicode)
  • Takri (bloque Unicode)
  • Tailandés (bloque Unicode)
  • Tibetano (bloque Unicode)
  • Tirhuta (bloque Unicode)

Otros sistemas de escritura de Asia meridional y central [ editar ]

  • Masaram Gondi (bloque Unicode)
  • Mro (bloque Unicode)
  • Sora Sompeng (bloque Unicode)
  • Warang Citi (bloque Unicode)

Georgiano [ editar ]

  • Georgiano (bloque Unicode)
  • Georgiano extendido (bloque Unicode)
  • Suplemento georgiano (bloque Unicode)

Escrituras africanas [ editar ]

  • Adlam (bloque Unicode)
  • Bamum (bloque Unicode)
  • Suplemento de Bamum (bloque Unicode)
  • Bassa Vah (bloque Unicode)
  • Ge'ez / escritura etíope
  • Medefaidrin (bloque Unicode)
  • Mende Kikakui (bloque Unicode)
  • NKo (bloque Unicode)
  • Osmanya (bloque Unicode)
  • Números otomanos Siyaq (bloque Unicode)
  • Tifinagh (bloque Unicode)
  • Vai (bloque Unicode)

Guiones americanos [ editar ]

  • Cherokee (bloque Unicode)
  • Suplemento Cherokee (bloque Unicode)
  • Deseret (bloque Unicode)
  • Osage (bloque Unicode)
  • Sílabas aborígenes canadienses unificadas (bloque Unicode)
  • Sílabas aborígenes canadienses unificadas extendidas (bloque Unicode)

Mongol [ editar ]

  • Mongol (bloque Unicode)
  • Suplemento de Mongolia (bloque Unicode)

Símbolos Unicode [ editar ]

Puntuación general [ editar ]

112 puntos de código; 111 caracteres asignados; 24 en el subconjunto MES-2.

Superíndices y subíndices [ editar ]

Símbolos de moneda [ editar ]

Símbolos en forma de letras [ editar ]

Formularios numéricos [ editar ]

Flechas [ editar ]

  • Símbolos y flechas varios (bloque Unicode)
  • Flechas suplementarias-A (bloque Unicode)
  • Flechas suplementarias-B (bloque Unicode)
  • Flechas suplementarias-C (bloque Unicode)

Símbolos matemáticos [ editar ]

  • Operadores matemáticos suplementarios (bloque Unicode)
  • Símbolos matemáticos varios-A (bloque Unicode)
  • Símbolos matemáticos varios-B (bloque Unicode)
  • Símbolos alfanuméricos matemáticos: Símbolos alfanuméricos matemáticos (bloque Unicode)

Técnico misceláneo [ editar ]

Reconocimiento óptico de caracteres [ editar ]

  • Reconocimiento óptico de caracteres (bloque Unicode)

Alfanuméricos adjuntos [ editar ]

Dibujo de caja [ editar ]

Elementos de bloque [ editar ]

Formas geométricas [ editar ]

Símbolos varios [ editar ]

Símbolos para la informática heredada [ editar ]

Dingbats [ editar ]

  • Dingbat

Sistemas de escritura de Asia oriental [ editar ]

  • Bopomofo (bloque Unicode)
  • Bopomofo Extended (bloque Unicode)
  • Ideogramas unificados de CJK
  • Suplemento de radicales CJK (bloque Unicode)
  • Trazos CJK (bloque Unicode)
  • Símbolos y puntuación CJK (bloque Unicode)
  • Contando números de varilla (bloque Unicode)
  • Suplemento alfanumérico adjunto (bloque Unicode)
  • Cartas y meses CJK adjuntos (bloque Unicode)
  • Suplemento ideográfico adjunto (bloque Unicode)
  • Formularios de ancho medio y ancho completo (bloque Unicode)
  • Hangul en Unicode
  • Hiragana (bloque Unicode)
  • Caracteres de descripción ideográfica (bloque Unicode)
  • Símbolos ideográficos y puntuación (bloque Unicode)
  • Kanbun (bloque Unicode)
  • Radicales Kangxi (bloque Unicode)
  • Katakana (bloque Unicode)
  • Kana Extended-A (bloque Unicode)
  • Suplemento de Kana (bloque Unicode)
  • Extensiones fonéticas de Katakana (bloque Unicode)
  • Khitan Small Script (bloque Unicode)
  • Lisu (bloque Unicode)
  • Suplemento Lisu (bloque Unicode)
  • Miao (bloque Unicode)
  • Letras de tono modificador (bloque Unicode)
  • Nushu (bloque Unicode)
  • Nyiakeng Puachue Hmong (bloque Unicode)
  • Variantes de formato pequeño (bloque Unicode)
  • Pequeña extensión de Kana (bloque Unicode)
  • Símbolos Tai Xuan Jing (bloque Unicode)
  • Tangut (bloque Unicode)
  • Componentes Tangut (bloque Unicode)
  • Suplemento Tangut (bloque Unicode)
  • Formas verticales (bloque Unicode)
  • Wancho (bloque Unicode)
  • Sílabas Yi (bloque Unicode)
  • Radicales Yi (bloque Unicode)
  • Símbolos de hexagrama de Yijing (bloque Unicode)

Sistemas de escritura del sudeste asiático [ editar ]

  • Hanifi Rohingya (bloque Unicode)
  • Kayah Li (bloque Unicode)
  • Pahawh Hmong (bloque Unicode)
  • Pau Cin Hau (bloque Unicode)
  • Meetei Mayek (bloque Unicode)

Formularios de presentación alfabéticos [ editar ]

Escrituras antiguas e históricas [ editar ]

  • Números del Egeo (bloque Unicode)
  • Jeroglíficos de Anatolia (bloque Unicode)
  • Números griegos antiguos (bloque Unicode)
  • Símbolos antiguos (bloque Unicode)
  • Avestan (bloque Unicode)
  • Carian (bloque Unicode)
  • Albanés caucásico (bloque Unicode)
  • Chorasmian (bloque Unicode)
  • Cuneiforme (bloque Unicode)
  • Números cuneiformes y puntuación (bloque Unicode)
  • Silabario chipriota (bloque Unicode)
  • Cuneiforme dinástico temprano (bloque Unicode)
  • Controles de formato de jeroglíficos egipcios (bloque Unicode)
  • Jeroglíficos egipcios (bloque Unicode)
  • Elbasan (bloque Unicode)
  • Elymaic (bloque Unicode)
  • Glagolítico (bloque Unicode)
  • Suplemento glagolítico (bloque Unicode)
  • Gótico (bloque Unicode)
  • Hatran (bloque Unicode)
  • Arameo imperial (bloque Unicode)
  • Números Indic Siyaq (bloque Unicode)
  • Pahlavi inscripcional (bloque Unicode)
  • Parthian inscripcional (bloque Unicode)
  • Kharoshthi (bloque Unicode)
  • Lineal A (bloque Unicode)
  • Ideogramas lineales B (bloque Unicode)
  • Silabario lineal B (bloque Unicode)
  • Lycian (bloque Unicode)
  • Lidio (bloque Unicode)
  • Maniqueo (bloque Unicode)
  • Números mayas (bloque Unicode)
  • Cursiva meroítica (bloque Unicode)
  • Jeroglíficos meroíticos (bloque Unicode)
  • Nabateo (bloque Unicode)
  • Nandinagari (bloque Unicode)
  • Ogham (bloque Unicode)
  • Húngaro antiguo (bloque Unicode)
  • Cursiva antigua (bloque Unicode)
  • Antiguo árabe del norte (bloque Unicode)
  • Permic antiguo (bloque Unicode)
  • Persa antiguo (bloque Unicode)
  • Viejo Sogdian (bloque Unicode)
  • Viejo sur de Arabia (bloque Unicode)
  • Turco antiguo (bloque Unicode)
  • Palmyrene (bloque Unicode)
  • Disco de Phaistos (bloque Unicode)
  • Fenicio (bloque Unicode)
  • Salterio Pahlavi (bloque Unicode)
  • Rúnico (bloque Unicode)
  • Sogdian (bloque Unicode)
  • Soyombo (bloque Unicode)
  • Ugarítico (bloque Unicode)
  • Yezidi (bloque Unicode)
  • Plaza Zanabazar (bloque Unicode)

Shavian [ editar ]

  • Shavian (bloque Unicode)

Sistemas de notación [ editar ]

Braille [ editar ]

  • Patrones Braille (bloque Unicode)

Música [ editar ]

  • Símbolos musicales occidentales (bloque Unicode)
  • Símbolos musicales bizantinos (bloque Unicode)
  • Notación musical griega antigua (bloque Unicode)

Taquigrafía [ editar ]

  • Duployan (bloque Unicode)
  • Controles de formato abreviado (bloque Unicode)

Sutton SignWriting [ editar ]

  • Sutton SignWriting: Sutton SignWriting (bloque Unicode)

Emoji [ editar ]

  • Emoji en Unicode

Símbolos alquímicos [ editar ]

  • Símbolos alquímicos (bloque Unicode)

Símbolos del juego [ editar ]

  • Símbolos de ajedrez (bloque Unicode)
  • Azulejos de Domino (bloque Unicode)
  • Azulejos de Mahjong (bloque Unicode)
  • Jugando a las cartas

Áreas especiales y caracteres de formato [ editar ]

  • Imágenes de control (bloque Unicode)
  • Áreas de uso privado
    • Área de uso privado (bloque Unicode)
    • Área de uso privado complementario-A (bloque Unicode)
    • Área de uso privado complementario-B (bloque Unicode)
  • Especiales (bloque Unicode)
  • Sustitutos
    • Sustitutos bajos (bloque Unicode)
    • Altos sustitutos (bloque Unicode)
    • Suplentes de uso privado alto (bloque Unicode)
  • Etiquetas (bloque Unicode)
  • Selectores de variación
    • Selectores de variación (bloque Unicode)
    • Suplemento de selectores de variación (bloque Unicode)

Ver también [ editar ]

  • Comparación de codificaciones Unicode
  • Tipos de letra Unicode de software libre
  • GNU Unifont
  • Lista de radicales Unicode
  • Lista de fuentes Unicode
  • Lista de tipos de letra
  • Unidad tipográfica
  • Consorcio Unicode
  • Fuente de respaldo Unicode
  • Tipografía Unicode
  • Personajes del juego de caracteres universal

Referencias [ editar ]

  1. ^ En desuso a partir de la versión 5.2.0 de Unicode [1] "U + 0149 La letra minúscula latina n precedida por un apóstrofo se codificó para su uso en afrikaans. El carácter está en desuso y se desaconseja su uso. En casi todos los casos está mejor representado por una secuencia de un apóstrofe seguido de "n". " [2] pág. 208
  • Gráficos de códigos de caracteres Unicode 7.0 , Unicode, Inc.
  • CWA 13873: 2000 - Subconjuntos europeos multilingües en el acuerdo de taller ISO / IEC 10646-1 CEN 13873
  • Juego de caracteres europeos multilingües 2 (MES-2) Justificación , Markus Kuhn , 1998

Enlaces externos [ editar ]

  • Sitio web oficial del Consorcio Unicode (inglés)
  • decodeunicode.org Unicode-Wiki con imágenes de los 98.884 caracteres gráficos Unicode (alemán / inglés, búsqueda de texto completo )
  • Letras con signos diacríticos, agrupadas alfabéticamente , Pinyin.info
  • Tabla de codificación UTF-8 y caracteres Unicode
  • Eliminar especial | Caracteres específicos de la cadena de texto.
  • Tabla de caracteres Unicode®