Red de dependencia relacional

Las redes de dependencia relacional (RDN) son modelos gráficos que amplían las redes de dependencia para dar cuenta de los datos relacionales. Los datos relacionales son datos organizados en una o más tablas, que se relacionan de forma cruzada a través de campos comunes. Una base de datos relacional es el ejemplo canónico de un sistema que sirve para mantener datos relacionales. Se puede utilizar una red de dependencia relacional para caracterizar el conocimiento contenido en una base de datos.

Introducción

Las redes de dependencia relacional (o RDN) tienen como objetivo obtener la distribución de probabilidad conjunta sobre las variables de un conjunto de datos representado en el dominio relacional. Se basan en redes de dependencia (o DN) y las extienden al entorno relacional. Los RDN tienen métodos de aprendizaje eficientes donde un RDN puede aprender los parámetros de forma independiente, es decir, las distribuciones de probabilidad condicionales se pueden estimar por separado. Dado que puede haber algunas inconsistencias debido al método de aprendizaje independiente, los RDN usan el muestreo de Gibbs para recuperar la distribución conjunta, como los DN.

A diferencia de las redes de dependencia, los RDN necesitan tres gráficos para representarlos por completo.

Gráfico de datos: es un gráfico cuyos nodos representan objetos del conjunto de datos y los bordes representan dependencias entre objetos. Cada uno de los objetos y aristas recibe un tipo y cada uno de los objetos tiene un conjunto de atributos.
Gráfico modelo: Es un gráfico de un nivel superior, más concretamente, a nivel de tipos. Por lo tanto, los nodos representan atributos de un tipo dado y los bordes representan dependencias entre atributos del mismo tipo o entre atributos de diferentes tipos. Cada nodo está asociado con una distribución de probabilidad condicionada a sus nodos padres. El gráfico del modelo no hace suposiciones sobre el conjunto de datos, lo que lo hace lo suficientemente general como para admitir diferentes datos representados por el gráfico de datos. Por lo tanto, es posible utilizar un conjunto de datos dado para conocer la estructura y las distribuciones de probabilidad condicionales del gráfico del modelo y luego generar el gráfico de inferencia a partir del gráfico del modelo aplicado a un gráfico de datos que representa otro conjunto de datos.
Gráfico de inferencia: corresponde a ese gráfico generado tanto por el gráfico de datos como por el gráfico de modelo en un proceso llamado despliegue. Los gráficos de inferencia son probablemente más grandes que los gráficos de datos y los gráficos de modelo debido a que cada uno de los atributos de cada uno de los objetos es una instancia en el gráfico de inferencia con las características de ese atributo correspondiente del gráfico del modelo.

En resumen, el gráfico de datos guía cómo se implementará el gráfico del modelo para generar el gráfico de inferencia.

Aprendizaje RDN

El método de aprendizaje para un RDN es similar al método utilizado por los DN, es decir, todas las distribuciones de probabilidad condicionales se pueden aprender para cada una de las variables de forma independiente. Sin embargo, solo se pueden usar aprendices relacionales condicionales durante el proceso de estimación de parámetros para RDN. Por lo tanto, los aprendices utilizados por los DN, como los árboles de decisión o la regresión logística, no funcionan para los RDN. Neville, J., & Jensen, D. (2007) ^[1] presentan algunos resultados de experimentos que comparan RDN cuando se aprende con clasificadores bayesianos relacionales y RDN cuando se aprende con árboles de probabilidad relacional. Natarajan y col. (2012) ^[2] utilizan una serie de modelos de regresión para representar distribuciones condicionales.

Este método de aprendizaje convierte al RDN en un modelo con un tiempo de aprendizaje eficiente. Sin embargo, este método también hace que los RDN sean susceptibles a algunas inconsistencias estructurales o numéricas. Si el método de estimación de distribución de probabilidad condicional utiliza la selección de características, es posible que una variable dada encuentre una dependencia entre ella y otra variable, mientras que esta última no encuentra esta dependencia. En este caso, el RDN es estructuralmente inconsistente. Además, si la distribución conjunta no suma uno debido a aproximaciones provocadas por el aprendizaje independiente, entonces decimos que hay una inconsistencia numérica. Afortunadamente, estas inconsistencias se pueden evitar durante el paso de inferencia, como veremos pronto en la sección de inferencia RDN.

Inferencia RDN

La inferencia RDN comienza con la creación de un gráfico de inferencia a través de un proceso llamado implementación. En este proceso, el gráfico del modelo se despliega sobre el gráfico de datos para formar el gráfico de inferencia. A continuación, se puede utilizar la técnica de muestreo de Gibbs para recuperar la distribución de probabilidad condicional.

Aplicaciones

Los RDN se han aplicado en muchos dominios del mundo real. Las principales ventajas de los RDN son su capacidad para utilizar información de relaciones para mejorar el rendimiento del modelo. El diagnóstico, la previsión, la visión automatizada, la fusión de sensores y el control de fabricación son algunos ejemplos de problemas en los que se aplicaron RDN.

Implementaciones

Algunas sugerencias de implementaciones de RDN:

BoostSRL: ^[3] Un sistema especializado en el aprendizaje de enfoques de impulso basado en gradientes para diferentes tipos de modelos de aprendizaje relacional estadístico, incluidas las redes de dependencia relacional. Para obtener más detalles y anotaciones, consulte Natarajan et al. (2011). ^[2]

Referencias

^ Neville, Jennifer; Jensen, David (2007). "Redes de dependencia relacional" (PDF) . Revista de investigación sobre aprendizaje automático . 8 : 653–692 . Consultado el 9 de febrero de 2020 .
^ ^a ^b Natarajan, Sriraam; Khot, Tushar; Kersting, Kristian; Gutmann, Bernd; Shavlik, Jude (10 de mayo de 2011). "Impulso basado en gradientes para el aprendizaje relacional estadístico: el caso de la red de dependencia relacional" (PDF) . Aprendizaje automático . 86 (1): 25–56. doi : 10.1007 / s10994-011-5244-9 . Consultado el 9 de febrero de 2020 .
^ Lab, StARLinG. "Wiki de BoostSRL" . EMPEZANDO . Consultado el 9 de febrero de 2020 .

[Neville-1] Neville, Jennifer; Jensen, David (2007). "Redes de dependencia relacional" (PDF) . Revista de investigación sobre aprendizaje automático . 8 : 653–692 . Consultado el 9 de febrero de 2020 .

[Natarajan-2] Natarajan, Sriraam; Khot, Tushar; Kersting, Kristian; Gutmann, Bernd; Shavlik, Jude (10 de mayo de 2011). "Impulso basado en gradientes para el aprendizaje relacional estadístico: el caso de la red de dependencia relacional" (PDF) . Aprendizaje automático . 86 (1): 25–56. doi : 10.1007 / s10994-011-5244-9 . Consultado el 9 de febrero de 2020 .

[BoostSRL-3] Lab, StARLinG. "Wiki de BoostSRL" . EMPEZANDO . Consultado el 9 de febrero de 2020 .

[1]