Un modelo gráfico o modelo gráfico probabilístico ( PGM ) o modelo probabilístico estructurado es un modelo probabilístico para el cual un gráfico expresa la estructura de dependencia condicional entre variables aleatorias . Se utilizan comúnmente en la teoría de la probabilidad , la estadística , en particular la estadística bayesiana, y el aprendizaje automático .
Tipos de modelos gráficos
Generalmente, los modelos gráficos probabilísticos utilizan una representación basada en gráficos como base para codificar una distribución en un espacio multidimensional y un gráfico que es una representación compacta o factorizada de un conjunto de independientes que se mantienen en la distribución específica. Se utilizan comúnmente dos ramas de representaciones gráficas de distribuciones, a saber, redes bayesianas y campos aleatorios de Markov . Ambas familias engloban las propiedades de factorización e independencia, pero se diferencian en el conjunto de independencia que pueden codificar y la factorización de la distribución que inducen. [1]
Modelo gráfico no dirigido
El gráfico no dirigido que se muestra puede tener una de varias interpretaciones; la característica común es que la presencia de un borde implica algún tipo de dependencia entre las correspondientes variables aleatorias. De este gráfico podríamos deducir que son todos mutuamente independientes, una vez es conocido, o (de manera equivalente en este caso) que
para algunas funciones no negativas .
Red bayesiana
Si la estructura de red del modelo es un gráfico acíclico dirigido , el modelo representa una factorización de la probabilidad conjunta de todas las variables aleatorias. Más precisamente, si los eventos son entonces la probabilidad conjunta satisface
dónde es el conjunto de padres del nodo (nodos con bordes dirigidos hacia ). En otras palabras, la distribución conjunta se convierte en un producto de distribuciones condicionales. Por ejemplo, en el gráfico acíclico dirigido que se muestra en la Figura, esta factorización sería
- .
Dos nodos cualesquiera son condicionalmente independientes dados los valores de sus padres. En general, cualesquiera dos conjuntos de nodos son condicionalmente independientes dado un tercer conjunto si se cumple un criterio llamado d -separación en el gráfico. Las independientes locales y las independientes globales son equivalentes en las redes bayesianas.
Este tipo de modelo gráfico se conoce como modelo gráfico dirigido, red bayesiana o red de creencias. Los modelos clásicos de aprendizaje automático como los modelos ocultos de Markov , las redes neuronales y los modelos más nuevos, como los modelos de Markov de orden variable, pueden considerarse casos especiales de redes bayesianas.
Modelos gráficos cíclicos dirigidos
La siguiente figura muestra un modelo gráfico con un ciclo. Esto puede interpretarse en términos de cada variable "dependiendo" de los valores de sus padres de alguna manera. El gráfico particular que se muestra sugiere una densidad de probabilidad conjunta que se factoriza como
- ,
pero son posibles otras interpretaciones. [2]
Otros tipos
- Clasificador Naive Bayes donde usamos un árbol con una sola raíz
- Red de dependencia donde se permiten ciclos
- Clasificador de árbol aumentado o modelo TAN
- Un gráfico de factores es un gráfico bipartito no dirigido que conecta variables y factores. Cada factor representa una función sobre las variables a las que está conectado. Esta es una representación útil para comprender e implementar la propagación de creencias .
- Un árbol de camarillas o árbol de unión es un árbol de camarillas , que se utiliza en el algoritmo del árbol de unión .
- Un gráfico de cadena es un gráfico que puede tener bordes tanto dirigidos como no dirigidos, pero sin ciclos dirigidos (es decir, si comenzamos en cualquier vértice y nos movemos a lo largo del gráfico respetando las direcciones de las flechas, no podemos regresar al vértice desde el que comenzamos si hemos pasado una flecha). Tanto los gráficos acíclicos dirigidos como los gráficos no dirigidos son casos especiales de gráficos de cadena, que por lo tanto pueden proporcionar una forma de unificar y generalizar las redes bayesianas y de Markov. [3]
- Un gráfico ancestral es una extensión adicional, que tiene bordes dirigidos, bidireccionales y no dirigidos. [4]
- Técnicas de campo aleatorio
- Un campo aleatorio de Markov , también conocido como red de Markov, es un modelo sobre un gráfico no dirigido . Un modelo gráfico con muchas subunidades repetidas se puede representar con notación de placa .
- Un campo aleatorio condicional es un modelo discriminativo especificado sobre un gráfico no dirigido.
- Una máquina de Boltzmann restringida es un modelo generativo bipartito especificado sobre un gráfico no dirigido.
Aplicaciones
El marco de los modelos, que proporciona algoritmos para descubrir y analizar la estructura en distribuciones complejas para describirlas de manera sucinta y extraer la información no estructurada, permite que se construyan y utilicen de manera efectiva. [1] Las aplicaciones de modelos gráficos incluyen inferencia causal , extracción de información , reconocimiento de voz , visión por computadora , decodificación de códigos de verificación de paridad de baja densidad , modelado de redes reguladoras de genes , búsqueda de genes y diagnóstico de enfermedades y modelos gráficos para la estructura de proteínas .
Ver también
- Propagación de la creencia
- Modelo de ecuación estructural
Notas
- ↑ a b Koller, D .; Friedman, N. (2009). Modelos gráficos probabilísticos . Massachusetts: Prensa del MIT. pag. 1208. ISBN 978-0-262-01319-2. Archivado desde el original el 27 de abril de 2014.
- ^ Richardson, Thomas (1996). "Un algoritmo de descubrimiento para gráficos cíclicos dirigidos". Parámetro desconocido
|book-title=
ignorado ( ayuda );Cite journal requiere|journal=
( ayuda ) - ^ Frydenberg, Morten (1990). "La propiedad de Markov del gráfico de cadena". Revista Escandinava de Estadística . 17 (4): 333–353. JSTOR 4616181 . Señor 1096723 .
- ^ Richardson, Thomas; Spirtes, Peter (2002). "Modelos de Markov gráfico ancestral". Annals of Statistics . 30 (4): 962–1030. CiteSeerX 10.1.1.33.4906 . doi : 10.1214 / aos / 1031689015 . Señor 1926166 . Zbl 1033.60008 .
Otras lecturas
Libros y capítulos de libros
- Barbero, David (2012). Razonamiento bayesiano y aprendizaje automático . Prensa de la Universidad de Cambridge. ISBN 978-0-521-51814-7.
- Obispo, Christopher M. (2006). "Capítulo 8. Modelos gráficos" (PDF) . Reconocimiento de patrones y aprendizaje automático . Saltador. págs. 359–422. ISBN 978-0-387-31073-2. Señor 2247587 .
- Cowell, Robert G .; Dawid, A. Philip ; Lauritzen, Steffen L .; Spiegelhalter, David J. (1999). Redes probabilísticas y sistemas expertos . Berlín: Springer. ISBN 978-0-387-98767-5. Señor 1697175 . Un libro más avanzado y con orientación estadística
- Jensen, Finn (1996). Introducción a las redes bayesianas . Berlín: Springer. ISBN 978-0-387-91502-9.
- Pearl, Judea (1988). Razonamiento probabilístico en sistemas inteligentes (2ª ed. Revisada). San Mateo, CA: Morgan Kaufmann . ISBN 978-1-55860-479-7. Señor 0965765 . Un enfoque de razonamiento computacional, donde se introdujeron formalmente las relaciones entre gráficos y probabilidades.
artículos periodísticos
- Edoardo M. Airoldi (2007). "Introducción a los modelos gráficos probabilísticos" . PLOS Biología Computacional . 3 (12): e252. doi : 10.1371 / journal.pcbi.0030252 . PMC 2134967 . PMID 18069887 .
- Jordan, MI (2004). "Modelos gráficos" . Ciencia estadística . 19 : 140-155. doi : 10.1214 / 088342304000000026 .
- Ghahramani, Zoubin (mayo de 2015). "Aprendizaje probabilístico de máquina e inteligencia artificial" . Naturaleza . 521 (7553): 452–459. doi : 10.1038 / nature14541 . PMID 26017444 . S2CID 216356 .
Otro
- Tutorial de aprendizaje de Bayes Net de Heckerman
- Una breve introducción a los modelos gráficos y las redes bayesianas
- La conferencia de Sargur Srihari se desliza sobre modelos gráficos probabilísticos
enlaces externos
- Modelos gráficos y campos aleatorios condicionales
- Modelos gráficos probabilísticos impartidos por Eric Xing en CMU