Modelado ponderado por conglomerados

En la minería de datos , el modelado ponderado por conglomerados (CWM) es un enfoque basado en algoritmos para la predicción no lineal de salidas ( variables dependientes ) a partir de entradas ( variables independientes ) basadas en la estimación de densidad utilizando un conjunto de modelos (conglomerados) que son teóricamente apropiado en una subregión del espacio de entrada. El enfoque general funciona en un espacio de entrada y salida conjunta y Neil Gershenfeld propuso una versión inicial . ^[1]^[2]

Forma básica de modelo

El procedimiento para el modelado ponderado por conglomerados de un problema de insumo-producto puede describirse de la siguiente manera. ^[2] Para construir valores predichos para una variable de salida y a partir de una variable de entrada x , el procedimiento de modelado y calibración llega a una función de densidad de probabilidad conjunta , p ( y , x ). Aquí las "variables" pueden ser univariadas, multivariadas o series de tiempo. Por conveniencia, los parámetros del modelo no se indican en la notación aquí y son posibles varios tratamientos diferentes de estos, incluido establecerlos en valores fijos como un paso en la calibración o tratarlos mediante un análisis bayesiano . Los valores predichos requeridos se obtienen construyendo la densidad de probabilidad condicional p ( y | x ) a partir de la cual se puede obtener la predicción usando el valor esperado condicional , con la varianza condicional proporcionando una indicación de incertidumbre.

El paso importante del modelado es que se supone que p ( y | x ) toma la siguiente forma, como un modelo mixto :

{\ Displaystyle p (y, x) = \ sum _ {1} ^ {n} w_ {j} p_ {j} (y, x),}

donde n es el número de conglomerados y { w _j } son pesos que suman uno. Las funciones p _j ( y , x ) son funciones de densidad de probabilidad conjuntas que se relacionan con cada uno de los n conglomerados. Estas funciones se modelan utilizando una descomposición en una densidad condicional y una marginal :

{\ Displaystyle p_ {j} (y, x) = p_ {j} (y | x) p_ {j} (x),}

dónde:

p _j ( y | x ) es un modelo para predecir y dado x , y dado que el par entrada-salida debe asociarse con el grupo j sobre la base del valor de x . Este modelo podría ser un modelo de regresión en los casos más simples.

p _j ( x ) es formalmente una densidad para valores de x , dado que el par entrada-salida debe estar asociado con el grupo j . Los tamaños relativos de estas funciones entre los conglomerados determinan si un valor particular de x está asociado con cualquier centro de conglomerado dado. Esta densidad podría ser una función gaussiana centrada en un parámetro que representa el centro del grupo.

De la misma manera que para el análisis de regresión , será importante considerar las transformaciones de datos preliminares como parte de la estrategia general de modelado si los componentes centrales del modelo van a ser modelos de regresión simple para las densidades de condición por conglomerados y distribuciones normales para las densidades de ponderación de grupos p _j ( x ).

Versiones generales

El algoritmo básico de CWM proporciona un único grupo de salida para cada grupo de entrada. Sin embargo, CWM se puede extender a varios clústeres que todavía están asociados con el mismo clúster de entrada. ^[3] Cada grupo en CWM está localizado en una región de entrada gaussiana, y esta contiene su propio modelo local entrenable. ^[4] Se reconoce como un algoritmo de inferencia versátil que proporciona simplicidad, generalidad y flexibilidad; incluso cuando se puede preferir una red de capas de alimentación directa, a veces se utiliza como una "segunda opinión" sobre la naturaleza del problema de formación. ^[5]

La forma original propuesta por Gershenfeld describe dos innovaciones:

Permitir que CWM funcione con flujos continuos de datos
Abordar el problema de los mínimos locales encontrados por el proceso de ajuste de parámetros de CWM ^[5]

CWM se puede utilizar para clasificar medios en aplicaciones de impresora, utilizando al menos dos parámetros para generar una salida que tiene una dependencia conjunta de los parámetros de entrada. ^[6]

Referencias

^ Gershenfeld, N (1997). "Inferencia no lineal y modelado ponderado por clústeres". Anales de la Academia de Ciencias de Nueva York . 808 : 18-24. Código bibliográfico : 1997NYASA.808 ... 18G . doi : 10.1111 / j.1749-6632.1997.tb51651.x .
^ ^a ^b Gershenfeld, N .; Schoner; Metois, E. (1999). "Modelado ponderado por conglomerados para el análisis de series de tiempo". Naturaleza . 397 (6717): 329–332. Código Bibliográfico : 1999Natur.397..329G . doi : 10.1038 / 16873 .
^ Feldkamp, LA; Prokhorov, DV; Feldkamp, TM (2001). "Modelado ponderado por clústeres con multiclústeres". Conferencia conjunta internacional sobre redes neuronales . 3 (1): 1710-1714. doi : 10.1109 / IJCNN.2001.938419 .
^ Boyden, Edward S. "Modelado ponderado de clústeres basados en árboles: Hacia un Stradivarius digital en tiempo real masivamente paralelo" (PDF) . Cambridge, MA: MIT Media Lab. Cite journal requiere |journal=( ayuda )
^ ^a ^b Prokhorov, un nuevo enfoque para el modelado ponderado por conglomerados Danil V .; Lee A. Feldkamp; Timothy M. Feldkamp. "Un nuevo enfoque para el modelado ponderado por clústeres" (PDF) . Dearborn, MI: Laboratorio de Investigación Ford. Cite journal requiere |journal=( ayuda )
^ Gao, Jun; Ross R. Allen (24 de julio de 2003). "MODELADO PONDERADO POR CLÚSTER PARA CLASIFICACIÓN DE MEDIOS" . Palo Alto, CA: Organización Mundial de la Propiedad Intelectual. Archivado desde el original el 12 de diciembre de 2012. Cite journal requiere |journal=( ayuda )

[1] Gershenfeld, N (1997). "Inferencia no lineal y modelado ponderado por clústeres". Anales de la Academia de Ciencias de Nueva York . 808 : 18-24. Código bibliográfico : 1997NYASA.808 ... 18G . doi : 10.1111 / j.1749-6632.1997.tb51651.x .

[nature-2] Gershenfeld, N .; Schoner; Metois, E. (1999). "Modelado ponderado por conglomerados para el análisis de series de tiempo". Naturaleza . 397 (6717): 329–332. Código Bibliográfico : 1999Natur.397..329G . doi : 10.1038 / 16873 .

[feldkamp-3] Feldkamp, LA; Prokhorov, DV; Feldkamp, TM (2001). "Modelado ponderado por clústeres con multiclústeres". Conferencia conjunta internacional sobre redes neuronales . 3 (1): 1710-1714. doi : 10.1109 / IJCNN.2001.938419 .

[mit-4] Boyden, Edward S. "Modelado ponderado de clústeres basados en árboles: Hacia un Stradivarius digital en tiempo real masivamente paralelo" (PDF) . Cambridge, MA: MIT Media Lab. Cite journal requiere |journal=( ayuda )

[dearborn-5] Prokhorov, un nuevo enfoque para el modelado ponderado por conglomerados Danil V .; Lee A. Feldkamp; Timothy M. Feldkamp. "Un nuevo enfoque para el modelado ponderado por clústeres" (PDF) . Dearborn, MI: Laboratorio de Investigación Ford. Cite journal requiere |journal=( ayuda )

[media-6] Gao, Jun; Ross R. Allen (24 de julio de 2003). "MODELADO PONDERADO POR CLÚSTER PARA CLASIFICACIÓN DE MEDIOS" . Palo Alto, CA: Organización Mundial de la Propiedad Intelectual. Archivado desde el original el 12 de diciembre de 2012. Cite journal requiere |journal=( ayuda )

[1]