De Wikipedia, la enciclopedia libre
  (Redirigido desde números Unicode )
Saltar a navegación Saltar a búsqueda

Los números (a menudo llamados números en Unicode ) son caracteres o secuencias de caracteres que denotan un número. El sistema numérico hindú-árabe (base 10) se usa ampliamente en varios sistemas de escritura en todo el mundo y todos comparten la misma semántica para denotar números. Sin embargo, los grafemas que representan los números difieren ampliamente de un sistema de escritura a otro. Para admitir estas diferencias de grafemas, Unicode incluye codificaciones de estos números en muchos de los bloques de secuencias de comandos. Los dígitos decimales se repiten en 22 bloques separados. Además de muchas formas de los números hindúes-arábigos, Unicode también incluye varios números menos comunes, como números egeos , números romanos, contando números de varilla , números cuneiformes y números griegos antiguos . También hay un gran número de variaciones tipográficas de los números arábigos para uso matemático especializado y para compatibilidad con conjuntos de caracteres anteriores, y también caracteres compuestos que contienen números arábigos como ½.

Los números implican invariablemente la composición de glifos, ya que un número limitado de caracteres se componen para formar otros números. Por ejemplo, la secuencia 9-9-0 en números arábigos compone el número de novecientos noventa (990). En números romanos, el mismo número se expresa mediante el número compuesto Ⅹↀ o ⅩⅯ. Cada uno de estos es un número distinto para representar el mismo número abstracto. La semántica de los números difiere en particular en su composición. Los dígitos hindúes-árabes son composiciones de valor posicional, mientras que los números romanos son valores de signo y son aditivos y sustractivos según su composición.

Números por propiedad numérica [ editar ]

Agrupados por su propiedad numérica como se usa en un texto, Unicode tiene cuatro valores para Tipo numérico. Primero está el tipo "no es un número". Luego están los números de base decimal , comúnmente usados ​​en decimales de estilo occidental (0–9 sin formato), hay números que no forman parte de un sistema decimal, como los números romanos, y números decimales en contexto tipográfico, como los números rodeados por un círculo. No se anota una numeración como "ABC" para la numeración de capítulos.

Dígitos hexadecimales [ editar ]

Los dígitos hexadecimales en Unicode no son caracteres separados; se utilizan letras y números existentes. Estos personajes tienen propiedades de carácter marcadas Hex_digit=Yes, y ASCII_Hex_digit=Yescuando sea apropiado.

Números por guión [ editar ]

Números hindúes-arábigos [ editar ]

El sistema de numeración hindú-árabe consta de diez dígitos que representan del 0 al 9. Unicode incluye los números arábigos occidentales en el bloque Latín básico (o derivado de ASCII). Los dígitos se repiten en varias otras escrituras: árabe oriental , balinés, bengalí, devanagari, etíope, gujarati, gurmukhi, telugu, jemer, lao, limbu, malayalam, mongol, Myanmar, nuevo Tai Lue, Nko, Oriya, telugu, tailandés Tibetano, Osmanya. Unicode incluye una propiedad de valor numérico para cada dígito para ayudar en la clasificación y otras operaciones de procesamiento de texto. Sin embargo, no existe un mapeo entre los diversos dígitos relacionados.

Aunque el árabe se escribe de derecha a izquierda, mientras que el inglés se escribe de izquierda a derecha, en ambos idiomas los números se escriben con el dígito más significativo a la izquierda y el menos significativo a la derecha.

Fracciones [ editar ]

El carácter de barra inclinada de fracción (U + 2044) permite a los autores que utilizan Unicode componer cualquier fracción arbitraria junto con los dígitos decimales. Esto tenía la intención de instruir al renderizado de fuentes para hacer los dígitos circundantes más pequeños y subirlos a la izquierda y bajarlos a la derecha, pero esto rara vez se implementa. (Una solución es utilizar los caracteres super / subíndice que se describen a continuación, pero solo están disponibles los números arábigos). Unicode también incluye un puñado de fracciones vulgares como caracteres de compatibilidad, pero desaconseja su uso.

Fracciones decimales [ editar ]

Varios caracteres en Unicode pueden servir como separador decimal según la configuración regional. Las fracciones decimales se representan en el texto como una secuencia de números de dígitos decimales con un separador decimal que separa la parte del número entero de la parte fraccionaria. Por ejemplo, la fracción decimal para "¼" se expresa como cero coma dos cinco ("0.25"). Unicode no tiene un separador decimal general dedicado, pero unifica la función del separador decimal con otros caracteres de puntuación. Entonces el "." usado en "0.25" es el mismo carácter de punto (U + 002E) usado para terminar la oración. Sin embargo, las culturas varían en el glifo o grafema utilizado para un separador decimal. Entonces, en algunas configuraciones regionales, la coma (U + 002C) se puede usar en lugar de "0,25". Otras configuraciones regionales utilizan un espacio (o un espacio sin interrupciones) para "0 25".El sistema de escritura árabe incluye un carácter dedicado para un separador decimal que se parece mucho a una coma "٫" (U + 066B) que cuando se combina con los dígitos árabes para expresar un cuarto aparece como: "٠ ٫ ٢٥".

Caracteres para constantes matemáticas [ editar ]

Actualmente, tres caracteres Unicode representan semánticamente constantes matemáticas: U + 210E CONSTANTE DE PLANCHA , U + 210FCONSTANTE DE PLANCHA SOBRE DOS PI y U + 2107CONSTANTE DE EULER . Se pueden representar otras constantes matemáticas mediante caracteres que tienen múltiples usos semánticos. Por ejemplo, aunque Unicode incluye un carácter para el exponente natural ℯ (U + 212F), su nombre canónico UCS deriva de su glifo: U + 212FSCRIPT SMALL E ; y la constante matemática π , 3.141592 .., está representada por U + 03C0 π LETRA MINÚSCULA GRIEGA PI .

Texto enriquecido y otros números de compatibilidad [ editar ]

Los números arábigos occidentales también aparecen entre los caracteres de compatibilidad como formas variantes de texto enriquecido que incluyen negrita, doble golpe, monoespacio, sans-serif y sans-serif negrita, junto con variantes de ancho completo para el soporte de texto vertical heredado.

El texto enriquecido entre paréntesis, en círculos y otras variantes también se incluyen en los bloques Letras y meses CJK adjuntos; Alfanuméricos adjuntos, superíndices y subíndices; Formularios numéricos; y Dingbats.

CJK Suzhou (huāmǎ) numerales [ editar ]

El sistema huāmǎ es una variación del sistema de numeración de barras. Los números de las varillas están estrechamente relacionados con las varillas de conteo y el ábaco , por lo que los símbolos numéricos de 1, 2, 3, 6, 7 y 8 en el sistema huāmǎ se representan de manera similar a los del ábaco. Hoy en día, el sistema huāmǎ solo se utiliza para mostrar precios en los mercados chinos o en facturas manuscritas tradicionales.

Números de Suzhou (huāmǎ) en Unicode [ editar ]

Según la versión 3.0 del estándar Unicode , estos caracteres se denominan números de estilo Hangzhou . Esto indica que no solo lo usan los cantoneses en Hong Kong. En el estándar Unicode 4.0, se agregó una errata que decía:

Los dígitos de los números de Suzhou se designan en el bloque de símbolos y puntuación de CJK entre U + 3021 y U + 3029, U + 3007, U + 5341, U + 5344 y U + 5345.

Números japoneses y coreanos [ editar ]

Números griegos antiguos [ editar ]

Unicode proporciona soporte para varias variantes de números griegos , asignados al plano multilingüe complementario desde U + 10140 hasta U + 1018F. [1]

Los antiguos griegos usaban números áticos , posiblemente desde el siglo VII a . C. También eran conocidos como números Herodianic porque fueron descritos por primera vez en un manuscrito del siglo segundo por Herodes . También se conocen como números acrofónicos porque todos los símbolos utilizados derivan de las primeras letras de las palabras que representan los símbolos: 'uno', 'cinco', 'diez', 'cien', 'mil' y 'diez mil' . Véanse los números griegos y la acrofonía .

Números romanos [ editar ]

Los números romanos se originaron en la antigua Roma , adaptados de los números etruscos . El sistema utilizado en la antigüedad clásica se modificó ligeramente en la Edad Media para producir el sistema que utilizamos hoy. Se basa en ciertas letras a las que se les dan valores como números.

Los números romanos se usan comúnmente hoy en día en listas numeradas (en formato de esquema), caras de reloj, páginas que preceden al cuerpo principal de un libro, tríadas de acordes en el análisis de música ( análisis de números romanos ), la numeración de secuelas de películas y videojuegos, fechas de publicación de libros, líderes políticos sucesivos o niños con nombres idénticos, y la numeración de algunos eventos deportivos, como los Juegos Olímpicos o el Super Bowl .

Unicode tiene una cantidad de caracteres específicamente designados como números romanos, como parte del rango de Formas numéricas [2] desde U + 2160 a U + 2188. Este rango incluye números en mayúsculas y minúsculas, así como caracteres combinados previamente para números hasta el 12 (Ⅻ o XII). Una de las razones de la existencia de números combinados previamente es facilitar la configuración de números de varias letras (como VIII) en una sola línea horizontal en el texto vertical asiático. El estándar Unicode, sin embargo, incluye puntos de código de números romanos especiales solo para compatibilidad, indicando que "[para] o para la mayoría de los propósitos, es preferible componer los números romanos a partir de secuencias de las letras latinas apropiadas". [3]

Además, existen caracteres para formas arcaicas [2] de 1000, 5000, 10,000, C invertida grande (Ɔ) , finales de 6 (ↅ, similar al estigma griego : Ϛ), principios de los 50 (ↆ, similar a la flecha hacia abajo ↓ ⫝⊥ [ 4] ), 50.000 y 100.000. La c pequeña invertida, ↄ, no está destinada a utilizarse en números romanos, sino como letra claudiana minúscula Ↄ.

Si utiliza letras negras o tipografías de escritura , los números romanos se establecen en tipo romano . Estos tipos de letra pueden contener números romanos que coincidan con el estilo del tipo de letra en el rango Unicode U + 2160–217F; si no existen, se utiliza un tipo de letra Antiqua coincidente para los números romanos.

Unicode tiene caracteres para fracciones romanas en el bloque Ancient Symbols [6] : sextans, uncia, semuncia, sextula, dimidia sextula, siliqua y as.

Contando números de varilla [ editar ]

Las barras verticales suelen ser para potencias pares de diez (1, 100, 10000 ...) y las horizontales para potencias impares (10, 1000 ...). Por ejemplo, 126 está representado por en lugar de , que podría confundirse con 36. Históricamente, las barras rojas se usaban para los números positivos y las barras negras para los números negativos .

Contar números de varilla en Unicode [ editar ]

Los números de las varillas de conteo se incluyen en su propio bloque en el plano multilingüe suplementario (SMP) de U + 1D360 a U + 1D37F. A partir de Unicode 5.0 se incluyen dieciocho caracteres para dígitos verticales y horizontales del 1 al 9, aunque los valores vertical y horizontal son opuestos a la descripción anterior. Se reservan catorce puntos de código para uso futuro. El cero debe estar representado por U + 3007 (〇, número ideográfico cero) y el signo negativo debe estar representado por U + 20E5 (combinando la superposición de sólido inverso). [7] Como estos se agregaron recientemente al conjunto de caracteres y ya que están incluidos en el SMP, el soporte de fuentes aún puede ser limitado.

Ver también [ editar ]

  • Formularios numéricos (bloque Unicode)

Referencias [ editar ]

  1. ^ Gráficos Unicode: números griegos antiguos
  2. ^ a b Formularios de números Unicode
  3. ^ El estándar Unicode, versión 6.0 - Edición electrónica (PDF) , Unicode, Inc., 2011, p. 486
  4. ^ David J. Perry: propuesta para agregar caracteres romanos antiguos adicionales a UCS
  5. ^ Para las dos primeras filas
  6. ^ Símbolos antiguos Unicode
  7. ^ El estándar Unicode, versión 5.0 - Edición electrónica (PDF) , Unicode, Inc., 2006, págs. 499–500