Un término de representación es una palabra, o una combinación de palabras, que representan semánticamente el tipo de datos (dominio de valor) de un elemento de datos. Los que están familiarizados con los diccionarios de datos se refieren comúnmente a un término de representación como una palabra de clase . ISO / IEC 11179-5: 2005 define el término de representación como una designación de una instancia de una clase de representación.Como se usa en ISO / IEC 11179 , el término de representación es la parte del nombre de un elemento de datos que proporciona un puntero semántico al tipo de datos subyacente. . Una clase de representación es una clase de representaciones. Esta clase de representación proporciona una forma declasificar o agrupar elementos de datos .
Un término de representación puede considerarse como un atributo de un elemento de datos en un registro de metadatos que clasifica el elemento de datos según el tipo de datos almacenados en el elemento de datos. [1]
Los términos de representación suelen ser "aprobados" por la organización o el organismo de normalización que los utiliza. Por ejemplo, la ONU publica su lista aprobada como parte de la Especificación técnica de componentes básicos de UN / CEFACT. El marco universal de elementos de datos utiliza un subconjunto de términos de representación CCTS y asigna códigos numéricos a los que se utilizan.
Casos de uso para el término de representación
Gestión de dominios de valor
Un dominio de valor expresa el conjunto de valores permitidos para un elemento de datos. El término de representación (y típicamente el término de tipo de datos correspondiente) comprende una taxonomía para los dominios de valor dentro de un conjunto de datos. Esta taxonomía es la clase de representación. Por tanto, el término de representación se puede utilizar para controlar la proliferación de dominios de valor garantizando que los dominios de valor equivalente utilicen el mismo término de representación.
Encontrar propiedades equivalentes
Cuando una persona o un agente de software está analizando dos registros de metadatos separados para encontrar la equivalencia de propiedad , el Término de representación se puede utilizar como guía. Por ejemplo, si el sistema A tiene un elemento de datos como PersonGenderCode y el sistema B tiene un elemento de datos como PersonSexCode, el sufijo del código puede ayudar a los dos sistemas a hacer coincidir solo los elementos de datos que tienen el sufijo "Código". Sin embargo, una taxonomía de términos de propiedad (es decir, "sexo" o "género") es mucho más eficiente a este respecto.
Inferencia
El término de representación se puede utilizar de muchas formas para hacer inferencias sobre conjuntos de datos. Los términos de representación informan al observador de cualquier flujo de datos sobre los tipos de datos y dan una indicación de cómo se puede utilizar el elemento de datos. Esto es fundamental cuando se asignan registros de metadatos a elementos de datos externos. Por ejemplo, si se le envía un registro sobre una persona, puede buscar cualquier sufijo "ID" para comprender cómo el sistema remoto puede diferenciar dos registros distintos.
Campos requeridos
Los Términos de representación también se utilizan para hacer inferencias sobre los requisitos de una propiedad. Por ejemplo, si un flujo de datos tuviera el elemento de datos PersonBirthDateAndTime, sabría que tanto la fecha como la hora están disponibles y son relevantes, no solo la fecha. Si la hora de nacimiento es opcional, se deben usar elementos de datos separados como PersonBirthDate y PersonBirthTime.
Encontrar dimensiones y medidas del almacén de datos
Al crear un almacén de datos, un analista de negocios examina los Términos de representación para encontrar rápidamente las dimensiones y medidas de un tema a fin de construir cubos OLAP. Por ejemplo:
- El indicador o el código se utilizan para crear dimensiones del almacén de datos
- La fecha o la fecha y hora se utilizan para relacionarse con la dimensión de tiempo, que con frecuencia se comparten entre cubos que utilizan dimensiones ajustadas.
- Los términos de cantidad , número , medida o valor (que se pueden sumar) son candidatos para una medida
- El nombre y el texto se utilizan para etiquetas de pantalla u otros elementos descriptivos.
- El porcentaje debe analizarse ya que realmente no se pueden sumar con un significado claro
- La identificación se usa para eliminar registros duplicados
Especificación técnica de los componentes principales
La especificación técnica conjunta de los componentes básicos ISO / ONU define formalmente tanto el conjunto permitido de términos de representación como el conjunto correspondiente de tipos de datos. ISO 15000-5 es una capa de implementación de ISO 11179 y expresa normativamente un conjunto de reglas para definir semánticamente modelos de datos conceptuales y físicos / lógicos para una amplia variedad de usos. En ISO 15000-5, el término de representación proporciona un mecanismo para armonizar los dominios de valor de los elementos de datos candidatos antes de agregarlos a los modelos de datos generales. ISO 15000-5 está siendo utilizado por varios gobiernos, organizaciones de desarrollo de estándares y el sector privado como base para el modelado de datos.
Marco universal de elementos de datos
Algunos estándares informales como el Marco Universal de Elementos de Datos (que se refieren a un Término de Representación como una "Palabra de Propiedad") asignan ID enteros únicos a cada Término de Representación. Esto permite que las herramientas de mapeo de metadatos mapeen un conjunto de elementos de datos en otros vocabularios de metadatos. Puede encontrar un ejemplo de estas asignaciones en ID de palabra de propiedad . Tenga en cuenta que a noviembre de 2005 los conceptos de UDEF no se han adoptado ampliamente.
Ejemplo de términos de representación como sufijo XML
Por ejemplo, si un fragmento de datos XML tiene lo siguiente:
123-45-6789 Juan Smith 14 de agosto de 1990
En el ejemplo anterior, los términos de representación son "ID" para
Términos de representación de muestra
Los siguientes son ejemplos de términos de representación que se han utilizado para el intercambio de mensajes electrónicos en sistemas como NIEM o GJXDM 3.0: [nota: las restricciones expresadas aquí se limitan a esas especificaciones y no representan el consenso universal]
Término | Uso |
---|---|
Monto | Valor monetario con unidades monetarias. |
BinaryObject | Conjunto de secuencias de longitud finita de octetos binarios que se utilizan para representar sonido, imágenes y otras estructuras. |
Código | Una lista enumerada de todos los valores permitidos. Cada valor enumerado es una cadena que, por brevedad, representa un significado específico. Por ejemplo, para un PersonGenderCode, los valores válidos pueden ser "masculino", "femenino" o "desconocido". |
Fecha | Una fecha ISO 8601 generalmente con el formato AAAA-MM-DD |
Fecha y hora | Una fecha ISO 8601 (en el formato AAAA-MM-DD) Y estructura de tiempo. Nota: No lo utilice a menos que TANTO la fecha como la hora sean campos REQUERIDOS. Si uno O el otro es opcional, especifique siempre los elementos de datos como elementos de fecha y hora separados. |
Gráfico | Se utiliza para almacenar imágenes. Secundario al objeto binario. |
IDENTIFICACIÓN | Abreviatura de identificador |
Identificador | Etiqueta, signo o símbolo independiente del idioma que se utiliza para establecer la identidad y distinguir de forma única una instancia de un objeto dentro de un esquema de identificación . |
Indicador | Booleano, exactamente dos valores mutuamente excluyentes (verdadero o falso). Debe darse una definición precisa del significado de un valor verdadero. |
La medida | Valor numérico determinado por medición con unidades. Suele utilizarse con elementos como la altura o el peso. si la unidad de medida no está clara, debe especificarse. |
Nombre | Una etiqueta textual utilizada como identificación de un objeto. Un nombre suele tener significado en algún idioma y es el medio principal de identificación de objetos para los humanos. A diferencia de un identificador , un nombre no es necesariamente único. |
Número | Asignado o determinado por cálculo. |
Texto | Cadena de caracteres generalmente en forma de palabras. |
Hora | Una estructura de tiempo ISO 8601 . |
Valor | Un tipo de numérico. |
Por ciento | Un tipo de numérico que tradicionalmente es el resultado de un cálculo de razón que varía de valores de 0 a 1 para valores de 0% a 100%. |
Cantidad | Valor numérico no monetario o cuenta con unidades. |
Velocidad | Un tipo de numérico |
Año | Un ISO 8601 Año |
Ventajas de los términos de representación
- El uso de términos de representación en el nombre de un elemento de datos es una convención que es ampliamente adoptada por varios sistemas grandes como NIEM , GJXDM y ebXML .
- Muchos arquitectos de datos que son responsables de mapear XML de fuentes externas encuentran muy útiles los términos de representación.
- Los estándares como UDEF dependen de una codificación precisa de los Términos de representación.
- Las herramientas que validan contra listas de enumeración pueden distinguir valores codificados rápidamente buscando el sufijo "Código".
- El análisis dimensional de datos puede utilizar términos de representación para crear almacenes de datos. Los términos de representación como Código e Indicador se pueden convertir en dimensiones y Cantidades y Medidas se pueden convertir en medidas en una tabla de hechos.
Contras de los términos de representación
- No existe un acuerdo universal sobre el conjunto definitivo de términos de representación.
- No siempre existe una relación directa entre un término de representación y el dominio de valor que representa. Esto se debe a la calificación adicional del término de tipo de datos correspondiente.
Estándares que utilizan términos de representación
- Comercio electrónico utilizando eXtensible Markup Language
- El modelo de intercambio de información nacional del gobierno de EE. UU. Requiere el uso de términos de representación para los elementos de datos XML.
- Los estándares de intercambio de datos del Departamento de Justicia de los EE. UU. El modelo de datos XML de justicia global requería el uso de términos de representación para elementos de datos XML.
[Nota] Este es un conjunto extremadamente limitado de la amplia gama de estándares que especifican el uso de términos de representación.
Ver también
Notas
- ^ ISO / IEC 11179-5 3.11(archivo zip 238K)
- ^ EnISO / IEC 11179-3: 2003 5.4(archivo zip 546K), en realidad es la clase de representación la que se especifica como un atributo de unelemento de datos.
enlaces externos
- ISO / TS 15000-5: 2005 Electronic Business Extensible Markup Language (ebXML) - Parte 5: Especificación técnica de los componentes principales de ebXML, versión 2.01 (ebCCTS) (archivo pdf de 1 MB)
- ISO / IEC 11179-3: 2003 Registros de metadatos (MDR) - Parte 3: Metamodelo de registro y atributos básicos (archivo zip 546K)
- ISO / IEC 11179-5: 2005 Registros de metadatos (MDR) - Parte 5: Principios de denominación e identificación (archivo zip 238K)
- ISO / IEC TR 20943-1: 2003 (E) Procedimientos para lograr la coherencia del contenido del registro de metadatos - Parte 1: Elementos de datos Consulte la página 84. (archivo zip de 700K)
- Diapositivas de capacitación sobre nombres de DOJ y GJXDM
- Metadatos ISO / IEC JTC 1 / SC 32 / WG 2
- ENLACE ROTO: http://ashcomp.com/DOI_Representation_terms.html Términos de representación del Departamento del Interior de EE. UU.
- Capacitación de NIEM, consulte la diapositiva en la página 8 para conocer los términos cubiertos en la clase de capacitación.
- Términos de representación de NIEM 3.0 Beta