Este artículo incluye una lista de referencias , lecturas relacionadas o enlaces externos , pero sus fuentes siguen sin estar claras porque carece de citas en línea . ( Septiembre de 2016 ) ( Obtenga información sobre cómo y cuándo eliminar este mensaje de plantilla ) |
El algoritmo de clasificación Unicode ( UCA ) es un algoritmo definido en el Informe técnico de Unicode n. ° 10, que es un método personalizable para producir claves binarias a partir de cadenas que representan texto en cualquier sistema de escritura e idioma que se pueda representar con Unicode . Estas claves se pueden comparar de manera eficiente byte a byte para clasificarlas o clasificarlas de acuerdo con las reglas del idioma, con opciones para ignorar mayúsculas y minúsculas, acentos, etc.
El Informe técnico de Unicode n. ° 10 también especifica la tabla de elementos de intercalación Unicode predeterminada (DUCET). Este archivo de datos especifica un orden de clasificación predeterminado. El DUCET se puede personalizar para diferentes idiomas. Algunas de estas personalizaciones se pueden encontrar en el repositorio de datos de configuración regional común de Unicode (CLDR).
Se incluye una implementación de código abierto de UCA con International Components for Unicode , ICU. ICU admite la adaptación, y las adaptaciones de recopilación de CLDR se incluyen en ICU. Los efectos de la adaptación y muchas adaptaciones específicas del idioma se muestran en el Explorador de configuración regional de ICU en línea .
Ver también [ editar ]
- Colación
- ISO / IEC 14651
- Normas europeas de pedidos (EOR)
- Repositorio de datos de configuración regional común (CLDR)
Enlaces externos [ editar ]
- Algoritmo de clasificación Unicode : Estándar técnico Unicode n. ° 10
- Gráficos de clasificación Unicode de Mimer SQL
Herramientas [ editar ]
- ICU Locale Explorer Una demostración en línea del algoritmo de clasificación Unicode utilizando componentes internacionales para Unicode
- msort Un programa de ordenación que proporciona un nivel inusual de flexibilidad para definir intercalaciones y extraer claves.