El enfoque de conjuntos aproximados basado en dominancia ( DRSA ) es una extensión de la teoría de conjuntos aproximados para el análisis de decisiones multicriterio (MCDA), presentado por Greco, Matarazzo y Słowiński. [1] [2] [3] El cambio principal en comparación con los conjuntos aproximados clásicos es la sustitución de la relación de indiscernibilidad por una relación de dominancia, que permite tratar las inconsistencias típicas de la consideración de criterios y clases de decisión ordenadas por preferencias .
Clasificación multicriterio (ordenamiento)
La clasificación multicriterio ( ordenamiento ) es uno de los problemas considerados dentro de MCDA y se puede enunciar de la siguiente manera: dado un conjunto de objetos evaluados por un conjunto de criterios (atributos con dominios de orden de preferencia), asigne estos objetos a algunas preferencias predefinidas -clases de decisión ordenadas, de modo que cada objeto se asigna exactamente a una clase. Debido al orden de preferencia, la mejora de las evaluaciones de un objeto en los criterios no debería empeorar su asignación de clase. El problema de clasificación es muy similar al problema de clasificación , sin embargo, en este último, los objetos se evalúan por atributos regulares y las clases de decisión no están necesariamente ordenadas por preferencia. El problema de la clasificación multicriterio también se conoce como problema de clasificación ordinal con restricciones de monotonicidad y, a menudo, aparece en aplicaciones de la vida real cuando las propiedades ordinales y monótonas se derivan del conocimiento del dominio sobre el problema.
Como ejemplo ilustrativo, considere el problema de la evaluación en una escuela secundaria. El director de la escuela quiere asignar a los estudiantes ( objetos ) a tres clases: mala , media y buena (observe que la clase buena se prefiere a la media y la media a la mala ). Cada alumno es descrito por tres criterios: nivel en Física, Matemáticas y Literatura, cada uno tomando uno de los tres valores posibles malo , medio y bueno . Los criterios están ordenados por preferencia y mejorar el nivel de una de las materias no debería resultar en una peor evaluación global (clase).
Como ejemplo más serio, considere la clasificación de los clientes bancarios, desde el punto de vista del riesgo de quiebra, en clases seguras y riesgosas . Esto puede implicar características tales como " rendimiento sobre el capital (ROE)", " rendimiento sobre la inversión (ROI)" y " rendimiento sobre las ventas (ROS)". Los dominios de estos atributos no están simplemente ordenados sino que involucran un orden de preferencia ya que, desde el punto de vista de los gerentes bancarios, mayores valores de ROE, ROI o ROS son mejores para los clientes analizados por riesgo de quiebra. Por tanto, estos atributos son criterios. Descuidar esta información en el descubrimiento de conocimientos puede llevar a conclusiones erróneas.
Representación de datos
Tabla de decisiones
En DRSA, los datos a menudo se presentan utilizando una forma particular de tabla de decisiones . Formalmente, una tabla de decisiones de DRSA es una tupla de 4, dónde es un conjunto finito de objetos, es un conjunto finito de criterios, dónde es el dominio del criterio y es una función de información tal que para cada . El conjuntose divide en criterios de condición (establecer) y el criterio de decisión ( clase ). Darse cuenta de es una evaluación de objeto en criterio , tiempo es la asignación de clase (valor de decisión) del objeto. En la Tabla 1 a continuación se muestra un ejemplo de tabla de decisiones.
Relación de clasificación
Se asume que el dominio de un criterio está completamente preordenado por una relación de rango superior ; significa que es al menos tan bueno como (supera en rango) con respecto al criterio . Sin pérdida de generalidad, asumimos que el dominio dees un subconjunto de reales ,, y que la relación de rango superior es un orden simple entre números reales tal que se cumpla la siguiente relación: . Esta relación es sencilla para el criterio de tipo de ganancia ("cuanto más, mejor"), por ejemplo , el beneficio de la empresa . Para el criterio del tipo de costo ("cuanto menos, mejor"), por ejemplo , el precio del producto , esta relación puede satisfacerse negando los valores de.
Clases de decisión y uniones de clases
Dejar . El dominio del criterio de decisión, consiste en elementos (sin pérdida de generalidad asumimos ) e induce una partición de dentro clases , dónde . Cada objeto está asignado a una y solo una clase . Las clases están ordenadas por preferencia de acuerdo con un orden creciente de índices de clase, es decir, para todos tal que , los objetos de son estrictamente preferidos a los objetos de . Por esta razón, podemos considerar las uniones ascendentes y descendentes de clases , definidas respectivamente, como:
Conceptos principales
Dominio
Nosotros decimos eso domina con respecto a , denotado por , Si es mejor que en todos los criterios de , . Para cada, la relación de dominancia es reflexivo y transitivo , es decir, es un preorden parcial . Dado y , dejar
representan el conjunto P predominante y el conjunto P dominado con respecto a, respectivamente.
Aproximaciones aproximadas
La idea clave de la filosofía del conjunto aproximado es la aproximación de un conocimiento por otro conocimiento. En DRSA, el conocimiento que se aproxima es una colección de uniones ascendente y descendente de las clases de decisión y los "gránulos de conocimiento" utilizados para la aproximación se P -dominating y P dominadas por la sets.
El P -alquilo y el P -Superior aproximación de con respecto a , denotado como y , respectivamente, se definen como:
Análogamente, la P -alquilo y el P -Superior aproximación de con respecto a , denotado como y , respectivamente, se definen como:
Aproximaciones inferiores agrupan los objetos que ciertamente pertenecen a la unión de clases (respectivamente ). Esta certeza proviene del hecho de que el objeto pertenece a la aproximación inferior (respectivamente ), si no hay otro objeto en contradice esta afirmación, es decir, cada objeto que P- domina, también pertenecen al sindicato de clases (respectivamente ). Aproximaciones superiores agrupan los objetos que podrían pertenecer a (respectivamente ), ya que objeto pertenece a la aproximación superior (respectivamente ), si existe otro objeto P -dominado por de la unión de clases (respectivamente ).
El P -alquilo y P -Superior aproximaciones definido como anteriormente citados cumplen las siguientes propiedades para todos y para cualquier :
Los P- límites ( P-regiones dudosas ) de y se definen como:
Calidad de aproximación y reducciones
El radio
define la calidad de aproximación de la partición en clases mediante el conjunto de criterios . Esta relación expresa la relación entre todos los objetos P- correctamente clasificados y todos los objetos de la tabla.
Cada subconjunto mínimo tal que se llama una reducción de y se denota por . Una tabla de decisiones puede tener más de una reducción. La intersección de todos los reductos se conoce como núcleo .
Reglas de decisión
A partir de las aproximaciones obtenidas mediante las relaciones de dominancia, es posible inducir una descripción generalizada de la información preferencial contenida en la tabla de decisión, en términos de reglas de decisión . Las reglas de decisión son expresiones de la forma si [condición] luego [consecuente], que representan una forma de dependencia entre los criterios de condición y los criterios de decisión. Los procedimientos para generar reglas de decisión a partir de una tabla de decisiones utilizan un principio de aprendizaje inducivo. Podemos distinguir tres tipos de reglas: ciertas, posibles y aproximadas. Ciertas reglas se generan a partir de aproximaciones más bajas de uniones de clases; las posibles reglas se generan a partir de aproximaciones superiores de uniones de clases y las reglas aproximadas se generan a partir de regiones de límites.
Ciertas reglas tienen la siguiente forma:
Si y y luego
Si y y luego
Las posibles reglas tienen una sintaxis similar, sin embargo, la parte consiguiente de la regla tiene la forma: podría pertenecer a o la forma: podría pertenecer a .
Finalmente, las reglas aproximadas tienen la sintaxis:
Si y y y y y luego
Las reglas ciertas, posibles y aproximadas representan un conocimiento cierto, posible y ambiguo extraído de la tabla de decisiones.
Cada regla de decisión debe ser mínima. Dado que una regla de decisión es una implicación, por una regla de decisión mínima entendemos tal implicación de que no hay otra implicación con un antecedente de al menos la misma debilidad (en otras palabras, regla que usa un subconjunto de condiciones elementales o / y elementales más débiles condiciones) y un consecuente de al menos la misma fuerza (en otras palabras, regla que asigna objetos a la misma unión o sub-unión de clases).
Un conjunto de reglas de decisión está completo si puede cubrir todos los objetos de la tabla de decisión de tal manera que los objetos consistentes se reclasifiquen en sus clases originales y los objetos inconsistentes se clasifiquen en grupos de clases que se refieren a esta inconsistencia. Llamamos mínimo a cada conjunto de reglas de decisión que es completo y no redundante, es decir, la exclusión de cualquier regla de este conjunto lo hace incompleto. Se puede adoptar una de las tres estrategias de inducción para obtener un conjunto de reglas de decisión: [4]
- generación de una descripción mínima, es decir, un conjunto mínimo de reglas,
- generación de una descripción exhaustiva, es decir, todas las reglas para una matriz de datos dada,
- generación de una descripción característica, es decir, un conjunto de reglas que cubren relativamente muchos objetos cada una, sin embargo, todos juntos no necesariamente todos los objetos de la tabla de decisiones
El algoritmo de inducción de reglas más popular para el enfoque de conjunto aproximado basado en dominancia es DOMLEM, [5] que genera un conjunto mínimo de reglas.
Ejemplo
Considere el siguiente problema de las evaluaciones de los estudiantes de secundaria:
Tabla 1: Ejemplo: evaluaciones de la escuela secundaria objeto (estudiante)
(Matemáticas)
(Física)
(Literatura)
(puntuación global)medio medio malo malo bien medio malo medio medio bien malo medio malo medio bien malo malo malo medio malo malo medio medio medio bien bien malo bien bien medio medio medio medio medio bien bien bien medio bien bien
Cada objeto (estudiante) se describe mediante tres criterios , relacionados con los niveles de Matemática, Física y Literatura, respectivamente. Según el atributo de decisión, los estudiantes se dividen en tres clases ordenadas por preferencia:, y . Así, se aproximaron las siguientes uniones de clases:
- es decir, la clase de (como máximo) malos estudiantes,
- es decir, la clase de, como máximo, estudiantes de nivel medio,
- es decir, la clase de al menos estudiantes de nivel medio,
- es decir, la clase de (al menos) buenos estudiantes.
Observe que las evaluaciones de objetos y son inconsistentes, porque tiene mejores evaluaciones en los tres criterios que pero peor puntuación global.
Por lo tanto, las aproximaciones más bajas de las uniones de clases constan de los siguientes objetos:
Por lo tanto, solo las clases y no se puede aproximar con precisión. Sus aproximaciones superiores son las siguientes:
mientras que sus regiones limítrofes son:
Por supuesto, ya que y se aproximan con precisión, tenemos , y
El siguiente conjunto mínimo de 10 reglas se puede extraer de la tabla de decisiones:
- Si luego
- Si y y luego
- Si luego
- Si y luego
- Si y luego
- Si y luego
- Si y luego
- Si luego
- Si luego
- Si y luego
La última regla es aproximada, mientras que el resto son ciertas.
Extensiones
Elección de criterios múltiples y problemas de clasificación
Los otros dos problemas considerados dentro del análisis de decisiones multicriterio , la elección multicriterio y los problemas de clasificación , también pueden resolverse utilizando un enfoque de conjunto aproximado basado en dominancia. Esto se hace convirtiendo la tabla de decisiones en una tabla de comparación por pares (PCT). [1]
DRSA de consistencia variable
Las definiciones de aproximaciones aproximadas se basan en una aplicación estricta del principio de dominancia. Sin embargo, al definir objetos no ambiguos, es razonable aceptar una proporción limitada de ejemplos negativos, particularmente para tablas de decisión grandes. Esta versión extendida de DRSA se llama modelo DRSA de consistencia variable (VC-DRSA) [6]
DRSA estocástico
En los datos de la vida real, particularmente para grandes conjuntos de datos, se encontró que las nociones de aproximaciones aproximadas eran excesivamente restrictivas. Por tanto, se ha introducido una extensión de DRSA, basada en el modelo estocástico ( Stochastic DRSA ), que permite inconsistencias hasta cierto punto. [7] Habiendo establecido el modelo probabilístico para problemas de clasificación ordinal con restricciones de monotonicidad, los conceptos de aproximaciones inferiores se extienden al caso estocástico. El método se basa en estimar las probabilidades condicionales utilizando el método no paramétrico de máxima verosimilitud que conduce al problema de la regresión isotónica .
Los conjuntos aproximados basados en dominancia estocástica también se pueden considerar como una especie de modelo de consistencia variable.
Software
4eMka2 es un sistema de apoyo a la decisión para problemas de clasificación de criterios múltiples basados en conjuntos aproximados basados en dominancia (DRSA). JAMM es un sucesor mucho más avanzado de 4eMka2. Ambos sistemas están disponibles gratuitamente para fines sin fines de lucro en el sitio web del Laboratorio de Sistemas Inteligentes de Apoyo a la Decisión (IDSS) .
Ver también
Referencias
- ^ a b Greco, S., Matarazzo, B., Słowiński, R .: Teoría de conjuntos aproximados para el análisis de decisiones multicriterio. European Journal of Operational Research, 129 , 1 (2001) 1-47
- ^ Greco, S., Matarazzo, B., Słowiński, R .: Clasificación multicriterio por enfoque de conjunto aproximado basado en dominancia. En: W. Kloesgen y J. Zytkow (eds.), Handbook of Data Mining and Knowledge Discovery, Oxford University Press, Nueva York, 2002
- ^ Słowiński, R., Greco, S., Matarazzo, B .: Apoyo a la decisión basado en un conjunto aproximado. Capítulo 16 [en]: EK Burke y G. Kendall (eds.), Metodologías de búsqueda: tutoriales introductorios en técnicas de optimización y apoyo a la toma de decisiones, Springer-Verlag, Nueva York (2005) 475–527
- ^ Stefanowski, J .: Sobre el enfoque basado en conjuntos aproximados para la inducción de reglas de decisión. En Skowron, A., Polkowski, L. (eds.): Rough Set in Knowledge Discovering, Physica Verlag, Heidelberg (1998) 500-529
- ^ Greco S., Matarazzo, B., Słowiński, R., Stefanowski, J .: Un algoritmo para la inducción de reglas de decisión consistentes con el principio de dominancia. En W. Ziarko, Y. Yao (eds.): Conjuntos aproximados y tendencias actuales en informática. Notas de conferencias sobre inteligencia artificial 2005 (2001) 304--313. Springer-Verlag
- ^ Greco, S., B. Matarazzo, R. Slowinski y J. Stefanowski: modelo de consistencia variable de enfoque de conjunto aproximado basado en dominancia. En W.Ziarko, Y.Yao (eds.): Rough Sets and Current Trends in Computing. Lecture Notes in Artificial Intelligence 2005 (2001) 170–181. Springer-Verlag
- ^ Dembczyński, K., Greco, S., Kotłowski, W., Słowiński, R .: Modelo estadístico para el enfoque de conjunto aproximado para la clasificación multicriterio. En Kok, JN, Koronacki, J., de Mantaras, RL, Matwin, S., Mladenic, D., Skowron, A. (eds.): Knowledge Discovery in Databases: PKDD 2007, Varsovia, Polonia. Lecture Notes in Computer Science 4702 (2007) 164-175.
- Chakhar S., Ishizaka A., Labib A., Saad I. (2016). Enfoque de conjunto aproximado basado en dominancia para decisiones grupales, European Journal of Operational Research, 251 (1): 206-224
- Li S., Li T. Zhang Z., Chen H., Zhang J. (2015). Cálculo paralelo de aproximaciones en el enfoque de conjuntos aproximados basado en dominancia, sistemas basados en el conocimiento, 87: 102-111
- Li S., Li T. (2015). Actualización incremental de aproximaciones en el enfoque de conjuntos aproximados basado en dominancia bajo la variación de valores de atributo, Ciencias de la información, 294: 348-361
- Li S., Li T., Liu D. (2013). Mantenimiento dinámico de aproximaciones en el enfoque de conjunto aproximado basado en dominancia bajo la variación del conjunto de objetos, International Journal of Intelligent Systems, 28 (8): 729-751
enlaces externos
- La Sociedad Internacional del Rough Set
- Laboratorio de sistemas inteligentes de apoyo a la toma de decisiones (IDSS) de la Universidad Tecnológica de Poznań .
- Lista extensa de referencias DRSA en la página de inicio de Roman Słowiński .