l-diversidad


l -diversity , también escrito como -diversity , es una forma de anonimización basada en grupos que se utiliza para preservar la privacidad en conjuntos de datos al reducir la granularidad de una representación de datos . Esta reducción es una compensación que da como resultado cierta pérdida de efectividad de la gestión de datos o de los algoritmos de minería para ganar algo de privacidad. El modelo de l -diversidad es una extensión del modelo de k -anonimato que reduce la granularidad de la representación de datos utilizando técnicas que incluyen la generalización y la supresión, de modo que cualquier registro dado se mapea en al menos k-1otros registros en los datos. El modelo de l -diversidad maneja algunas de las debilidades en el modelo de k -anonimato donde las identidades protegidas al nivel de k -individuos no es equivalente a proteger los valores sensibles correspondientes que fueron generalizados o suprimidos, especialmente cuando los valores sensibles dentro de un grupo exhiben homogeneidad. El modelo de l -diversidad agrega la promoción de la diversidad intragrupal para valores sensibles en el mecanismo de anonimización.

Si bien el k -anonimato es un enfoque prometedor para la anonimización basada en grupos dada su simplicidad y la amplia gama de algoritmos que lo realizan, sin embargo, es susceptible a muchos ataques. Cuando el conocimiento previo está disponible para un atacante, estos ataques se vuelven aún más efectivos. Dichos ataques incluyen:

Dada la existencia de tales ataques en los que se pueden inferir atributos sensibles para k -datos de anonimato, se creó el método de l -diversidad para promover el k -anonimato manteniendo adicionalmente la diversidad de campos sensibles. El libro Minería de datos que preserva la privacidad - Modelos y algoritmos (2008) [1] define la l -diversidad como:

Sea aq * -block un conjunto de tuplas tales que sus valores no sensibles se generalicen a q *. Un bloque q * es l -diverso si contiene l valores "bien representados" para el atributo sensible S. Una tabla es l -diversa, si cada bloque q * en ella es l -diverso.

El documento t -Closeness: Privacy beyond k -anononimity and l -diversity (2007) [2] define l -diversity como:

El principio de l -diversidad - Se dice que una clase de equivalencia tiene l -diversidad si hay al menos l valores “bien representados” para el atributo sensible. Se dice que una tabla tiene l -diversidad si cada clase de equivalencia de la tabla tiene l -diversidad.