En los metadatos , la definición de un elemento de datos es una frase u oración legible por humanos asociada con un elemento de datos dentro de un diccionario de datos que describe el significado o la semántica de un elemento de datos.
Las definiciones de elementos de datos son fundamentales para los usuarios externos de cualquier sistema de datos. Las buenas definiciones pueden facilitar drásticamente el proceso de mapear un conjunto de datos en otro conjunto de datos. Esta es una característica central de la computación distribuida y el desarrollo de agentes inteligentes.
Hay varias pautas que deben seguirse al crear definiciones de elementos de datos de alta calidad.
Propiedades de definiciones claras
Una buena definición es:
- Preciso : la definición debe utilizar palabras que tengan un significado preciso. Trate de evitar palabras que tengan múltiples significados o sentidos de palabras múltiples. La definición debe utilizar la descripción más corta. La definición no debe usar el término que está tratando de definir en la definición misma. Esto se conoce como definición circular.
- Distinto : la definición debe diferenciar un elemento de datos de otros elementos de datos. Este proceso se llama desambiguación : la definición debe estar libre de fundamentos incrustados, uso funcional, registro de metadatos legales.
Las definiciones no deben referirse a términos o conceptos que puedan ser malinterpretados por otros o que tengan diferentes significados según el contexto de una situación. Las definiciones no deben contener siglas que no estén claramente definidas o vinculadas a otras definiciones precisas.
Si uno está creando una gran cantidad de elementos de datos, todas las definiciones deben ser consistentes con conceptos relacionados.
Elemento de datos críticos: no todos los elementos de datos tienen la misma importancia o valor para una organización. Una propiedad de metadatos clave de un elemento es categorizar los datos como un elemento de datos críticos ( CDE ). Esta categorización proporciona un enfoque para la gobernanza y la calidad de los datos. Una organización a menudo tiene varias subcategorías de CDE, según el uso de los datos. p.ej:
- Cobertura de seguridad: elementos de datos que se clasifican como registro de salud personal, información de salud personal o PHI merecen especial atención para la seguridad y el acceso
- Uso del departamento de marketing: el departamento de marketing podría tener un conjunto particular de CDE identificados para identificar al cliente único o para la gestión de campañas.
- Uso del departamento de finanzas: el departamento de finanzas podría tener un conjunto de CDE diferente al de marketing. Se centran en elementos de datos que proporcionan medidas y métricas para la presentación de informes fiscales.
Estándares como la especificación del Registro de metadatos ISO / IEC 11179 brindan pautas para crear definiciones precisas de elementos de datos. Específicamente el capítulo cuatro del estándar de registro de metadatos ISO / IEC 11179.
Usando palabras precisas
Palabras comunes como jugar o ejecutar documentos de base de datos con más de 57 significados distintos para la palabra "juego", pero solo una definición única para el término juego dramático . Es preferible tener menos definiciones en la entrada del diccionario de una palabra elegida. Esto minimiza las malas interpretaciones relacionadas con el contexto y los antecedentes del lector. El proceso de encontrar un buen significado de una palabra se llama desambiguación del sentido de la palabra.
Ejemplos de definiciones que podrían mejorarse
Aquí está la definición del elemento de datos "persona" como se define en la especificación www.w3c.org Friend of a Friend * :
Persona: una persona.
Aunque la mayoría de la gente tiene una comprensión intuitiva de lo que es una persona, la definición tiene mucho margen de mejora. El primer problema es que la definición es circular. Tenga en cuenta que esta definición realmente no ayuda a la mayoría de los lectores y debe aclararse.
Aquí está la definición del elemento de datos "Persona" en el modelo de datos XML de justicia global 3.0 * :
persona: Describe características inherentes y frecuentemente asociadas de una persona.
Tenga en cuenta que, una vez más, la definición sigue siendo circular. La persona no debe hacer referencia a sí misma. La definición debe utilizar términos distintos de persona para describir lo que es una persona.
Aquí hay una definición más precisa pero más corta de una persona:
Persona: un ser humano individual.
Tenga en cuenta que utiliza la palabra individuo para afirmar que se trata de una instancia de una clase de cosas llamadas ser humano. Técnicamente, podría utilizar "homo sapiens" en su definición, pero más personas están familiarizadas con el término "ser humano" que con "homo sapiens", por lo que siempre se prefieren los términos de uso común, si aún son precisos.
A veces, su sistema puede tener normas y suposiciones culturales en las definiciones. Por ejemplo, si su elemento de datos "Persona" rastreó personajes en una serie de ciencia ficción que incluía extraterrestres, es posible que necesite un término más general que no sea ser humano .
Persona: un individuo de una especie sensible.
Ver también
Referencias
Fuentes
- ISO / IEC 11179-4: 2004 Registros de metadatos (MDR) - Parte 4
- Informe técnico ISO / IEC 20943-1, primera edición, 2003-08-01 Tecnología de la información: procedimientos para lograr la coherencia del registro de metadatos