Los campos juegan un papel importante en la ciencia, la tecnología y la economía. Describen las variaciones espaciales de una cantidad, como la temperatura del aire, en función de la posición. Conocer la configuración de un campo puede ser de gran valor. Sin embargo, las mediciones de campos nunca pueden proporcionar la configuración precisa del campo con certeza. Los campos físicos tienen un número infinito de grados de libertad, pero los datos generados por cualquier dispositivo de medición son siempre finitos, proporcionando solo un número finito de restricciones en el campo. Por lo tanto, una deducción inequívoca de tal campo a partir de los datos de medición solo es imposible y solo queda la inferencia probabilística como un medio para hacer declaraciones sobre el campo. Afortunadamente, los campos físicos exhiben correlaciones y a menudo siguen leyes físicas conocidas. Esta información se fusiona mejor en la inferencia de campo para superar la falta de coincidencia de los grados de libertad de campo con los puntos de medición. Para manejar esto, se necesita una teoría de la información para los campos, y eso es lo que es la teoría de los campos de la información.
Conceptos
Inferencia bayesiana
es un valor de campo en una ubicación en un espacio . El conocimiento previo sobre el campo de señal desconocido. está codificado en la distribución de probabilidad . Los datos proporciona información adicional sobre a través de la probabilidad que se incorpora a la probabilidad posterior
Como los campos tienen un número infinito de grados de libertad, la definición de probabilidades sobre espacios de configuraciones de campo tiene sutilezas. La identificación de campos físicos como elementos de espacios funcionales plantea el problema de que ninguna medida de Lebesgue se define sobre estos últimos y, por lo tanto, no se pueden definir densidades de probabilidad allí. Sin embargo, los campos físicos tienen mucha más regularidad que la mayoría de los elementos de los espacios funcionales, ya que son continuos y uniformes en la mayoría de sus ubicaciones. Por lo tanto, se pueden usar construcciones menos generales, pero suficientemente flexibles para manejar el número infinito de grados de libertad de un campo.
Un enfoque pragmático es considerar el campo discretizado en términos de píxeles. Cada píxel lleva un valor de campo único que se supone que es constante dentro del volumen de píxeles. Todos los enunciados sobre el campo continuo deben luego incorporarse a su representación de píxeles. De esta manera, se trata con espacios de campo de dimensión finita, sobre los cuales las densidades de probabilidad son bien definibles.
Para que esta descripción sea una teoría de campo adecuada, se requiere además que la resolución de píxeles siempre se puede refinar, mientras que los valores esperados del campo discretizado convergen a valores finitos:
Integrales de ruta
Si existe este límite, se puede hablar de la integral de espacio de configuración de campo o integral de ruta
independientemente de la resolución, podría evaluarse numéricamente.
El determinante en el denominador podría estar mal definido en el límite del continuo , sin embargo, todo lo que se necesita para que IFT sea consistente es que este determinante se puede estimar para cualquier representación de campo de resolución finita con y que esto permite el cálculo de valores esperados convergentes.
Una distribución de probabilidad gaussiana requiere la especificación de la función de correlación de dos puntos de campo con coeficientes
y un producto escalar para campos continuos
con respecto al cual la covarianza del campo de señal inverso está construido, es decir
La información previa correspondiente que lee Hamiltonian
Ecuación de medida
Los datos de medición fue generado con la probabilidad . En caso de que el instrumento fuera lineal, una ecuación de medición de la forma
se puede dar, en el que es la respuesta del instrumento, que describe cómo los datos en promedio reaccionan a la señal, y es el ruido, simplemente la diferencia entre los datos y respuesta de señal lineal . Es esencial tener en cuenta que la respuesta traduce el vector de señal de dimensión infinita en el espacio de datos de dimensión finita. En componentes esto dice
donde también se introdujo una notación de componentes vectoriales para vectores de señales y datos.
Si el ruido sigue una señal independiente de cero, media estadística gaussiana con covarianza , entonces la probabilidad también es gaussiana,
y la información de probabilidad hamiltoniana es
Una medición lineal de una señal gaussiana, sujeta a ruido gaussiano e independiente de la señal, conduce a un IFT libre.
Teoría libre
Hamiltoniano libre
La información conjunta hamiltoniana del escenario gaussiano descrito anteriormente es
dónde denota igualdad hasta constantes irrelevantes, que, en este caso, significa expresiones que son independientes de . De esto se desprende claramente que el posterior debe ser un gaussiano con media y varianza ,
donde se mantiene la igualdad entre los lados derecho e izquierdo ya que ambas distribuciones están normalizadas, .
Filtro de Wiener generalizado
La media posterior
también se conoce como la solución de filtro de Wiener generalizada y la covarianza de incertidumbre
como la variación de Wiener.
En IFT, se llama fuente de información, ya que actúa como un término fuente para excitar el campo (conocimiento), y el propagador de información, ya que propaga información de un lugar a otro en
Teoría interactiva
Hamiltoniano interactivo
Si se viola cualquiera de los supuestos que conducen a la teoría libre, IFT se convierte en una teoría interactiva, con términos que son de orden superior al cuadrático en el campo de la señal. Esto sucede cuando la señal o el ruido no siguen las estadísticas gaussianas, cuando la respuesta no es lineal, cuando el ruido depende de la señal o cuando la respuesta o las covarianzas son inciertas.
En este caso, la información hamiltoniana podría ampliarse en una serie Taylor - Fréchet ,
dónde es el hamiltoniano libre, que solo conduciría a un posterior gaussiano, y es el hamiltoniano que interactúa, que codifica correcciones no gaussianas. Los coeficientes de Taylor de primer y segundo orden a menudo se identifican con la fuente de información (negativa) y propagador de información , respectivamente. Los coeficientes más altos están asociados con auto-interacciones no lineales.
Campo clásico
El campo clásico minimiza la información hamiltoniana,
y por tanto maximiza la parte posterior:
El campo clásico es por tanto el estimador máximo a posteriori del problema de inferencia de campo.
Filtro crítico
El problema del filtro de Wiener requiere la correlación de dos puntos de un campo por conocer. Si es desconocido, debe inferirse junto con el campo en sí. Esto requiere la especificación de un hiperprior . A menudo, se puede suponer una homogeneidad estadística (invariancia de traducción), lo que implica quees diagonal en el espacio de Fourier (para ser un espacio cartesiano dimensional ). En este caso, solo el espectro de potencia espacial de Fouriernecesita ser inferido. Dada una suposición adicional de isotropía estadística, este espectro depende solo de la longitud del vector de Fourier y solo un espectro unidimensional tiene que ser determinado. La covarianza del campo anterior se lee luego en coordenadas espaciales de Fourier.
Si el anterior en es plana, la probabilidad conjunta de datos y espectro es
donde la notación del propagador de información y fuente del problema del filtro de Wiener se utilizó de nuevo. La información correspondiente hamiltoniana es
dónde denota igualdad hasta constantes irrelevantes (aquí: constante con respecto a ). Minimizando esto con respecto a , para obtener su máximo estimador de espectro de potencia a posteriori, produce
donde significa el filtro Wiener y el proyector de banda espectral fueron introducidos. Este último conmuta con , desde es diagonal en el espacio de Fourier. Por tanto, el estimador máximo a posteriori para el espectro de potencia es
Tiene que calcularse iterativamente, como y Dependen ambos de ellos mismos. En un enfoque empírico de Bayes , la estimación se tomaría como dado. Como consecuencia, la estimación media posterior del campo de señal es la correspondiente y su incertidumbre la correspondiente en la aproximación empírica de Bayes.
El filtro no lineal resultante se denomina filtro crítico . [4] La generalización de la fórmula de estimación del espectro de potencia como
exhibe unos umbrales de percepción para , lo que significa que la variación de los datos en una banda de Fourier tiene que superar el nivel de ruido esperado en un cierto umbral antes de la reconstrucción de la señal. se vuelve distinto de cero para esta banda. Siempre que la varianza de los datos excede este umbral ligeramente, la reconstrucción de la señal salta a un nivel de excitación finito, similar a una transición de fase de primer orden en sistemas termodinámicos. Para filtrar con La percepción de la señal comienza de forma continua tan pronto como la variación de los datos supera el nivel de ruido. La desaparición de la percepción discontinua en es similar a un sistema termodinámico que atraviesa un punto crítico . De ahí el nombre de filtro crítico.
El filtro crítico, las extensiones del mismo a las mediciones no lineales y la inclusión de espectros previos no planos, permitió la aplicación de IFT a problemas de inferencia de señales del mundo real, para los cuales la covarianza de la señal generalmente se desconoce a priori.
Ejemplos de aplicación de IFT
Imagen radiointerferométrica de radiogalaxias en el cúmulo de galaxias Abell 2219. Las imágenes fueron construidas por retroproyección de datos (arriba), el algoritmo CLEAN (medio) y el algoritmo RESOLVE (abajo). Los flujos negativos y, por lo tanto, no físicos se muestran en blanco.
El filtro de Wiener generalizado, que surge en IFT libre, se usa ampliamente en el procesamiento de señales. Se derivaron algoritmos basados explícitamente en IFT para varias aplicaciones. Muchos de ellos se implementan utilizando la biblioteca de teoría de campos de información numérica (NIFTy).
D³PO es un código para la reducción de ruido , la descomposición y la descomposición de las observaciones de fotones . Reconstruye imágenes de eventos de conteo de fotones individuales teniendo en cuenta las estadísticas de Poisson de los conteos y una función de respuesta del instrumento. Divide la emisión del cielo en una imagen de emisión difusa y una de fuentes puntuales, explotando las diferentes estructuras de correlación y estadísticas de los dos componentes para su separación. D³PO se ha aplicado a los datos de los satélites Fermi y RXTE .
RESOLVE es un algoritmo bayesiano para imágenes de síntesis de apertura en radioastronomía. RESOLVE es similar a D³PO, pero asume una verosimilitud gaussiana y una función de respuesta espacial de Fourier. Se ha aplicado a datos de Very Large Array .
PySESA es un marco de Python para el análisis espectral espacialmente explícito para el análisis espectral espacialmente explícito de nubes de puntos y datos geoespaciales.
Teoría avanzada
Se pueden utilizar muchas técnicas de la teoría cuántica de campos para abordar problemas de IFT, como los diagramas de Feynman, las acciones efectivas y el formalismo del operador de campo.
Diagramas de Feynman
Los primeros tres diagramas de Feynman contribuyen a la estimación media posterior de un campo. Una línea expresa un propagador de información, un punto al final de una línea a una fuente de información y un vértice a un término de interacción. El primer diagrama codifica el filtro de Wiener, el segundo una corrección no lineal y el tercero una corrección de incertidumbre del filtro de Wiener.
En caso de que los coeficientes de interacción en una expansión Taylor - Fréchet de la información hamiltoniana
son pequeños, la función de partición de registros o la energía libre de Helmholtz ,
se puede expandir asintóticamente en términos de estos coeficientes. El hamiltoniano libre especifica la media y varianza de la distribución gaussiana sobre el que se integra la expansión. Esto conduce a una suma sobre el conjunto de todos los diagramas de Feynman conectados . A partir de la energía libre de Helmholtz, cualquier momento conectado del campo se puede calcular mediante
Las situaciones en las que existen pequeños parámetros de expansión que son necesarios para que dicha expansión diagramática converja están dadas por campos de señal casi gaussianos, donde la no gaussianidad de las estadísticas de campo conduce a pequeños coeficientes de interacción . Por ejemplo, las estadísticas del Fondo de microondas cósmico son casi gaussianas, con pequeñas cantidades de no gaussianidades que se cree que se sembraron durante la época inflacionaria en el Universo Temprano .
Acción eficaz
Para tener cifras estables para los problemas de IFT, se necesita un campo funcional que, si se minimiza, proporcione el campo medio posterior. Tal se da por la acción efectiva o energía libre de Gibbs de un campo. La energía libre de Gibbsse puede construir a partir de la energía libre de Helmholtz mediante una transformación de Legendre . En IFT, está dado por la diferencia de la energía de información interna
y la entropía de Shannon
para la temperatura , donde una aproximación posterior gaussiana se utiliza con los datos aproximados que contiene la media y la dispersión del campo. [5]
La energía libre de Gibbs es entonces
la divergencia Kullback-Leiblerentre aproximada y posterior exacta más la energía libre de Helmholtz. Como este último no depende de los datos aproximados , minimizar la energía libre de Gibbs equivale a minimizar la divergencia de Kullback-Leibler entre posterior aproximada y exacta. Por lo tanto, el enfoque de acción efectiva de IFT es equivalente a los métodos bayesianos variacionales , que también minimizan la divergencia de Kullback-Leibler entre posteriores aproximados y exactos.
Minimizar la energía libre de Gibbs proporciona aproximadamente el campo medio posterior
mientras que minimizar la información hamiltoniana proporciona el máximo campo a posteriori. Como se sabe que el último sobreajusta el ruido, el primero suele ser un mejor estimador de campo.
Formalismo del operador
El cálculo de la energía libre de Gibbs requiere el cálculo de integrales gaussianas sobre un hamiltoniano de información, ya que la energía de información interna es
Dichas integrales se pueden calcular mediante un formalismo de operador de campo, [6] en el que
es el operador de campo. Esto genera la expresión de campo dentro de la integral si se aplica a la función de distribución gaussiana,
y cualquier potencia superior del campo si se aplica varias veces,
Si la información hamiltoniana es analítica, todos sus términos se pueden generar a través del operador de campo
Como el operador de campo no depende del campo en sí mismo, se puede sacar de la ruta integral de la construcción de energía de información interna,
dónde debe considerarse como un funcional que siempre devuelve el valor independientemente del valor de su entrada . La expresión resultante se puede calcular conmutando el aniquilador de campo medio a la derecha de la expresión, donde desaparecen desde . El aniquilador de campo medio conmuta con el campo medio como
Mediante el uso del formalismo del operador de campo, se puede calcular la energía libre de Gibbs, lo que permite la inferencia (aproximada) del campo medio posterior mediante una minimización funcional numérica robusta.
Historia
El libro de Norbert Wiener [7] podría considerarse como uno de los primeros trabajos sobre inferencia de campo. El uso de integrales de ruta para la inferencia de campo fue propuesto por varios autores, por ejemplo, Edmund Bertschinger [8] o William Bialek y A. Zee. [9] Jörg Lemm hizo explícita la conexión de la teoría de campos y el razonamiento bayesiano. [10] El término teoría del campo de información fue acuñado por Torsten Enßlin. [11] Consulte la última referencia para obtener más información sobre la historia de IFT.
Ver también
Inferencia bayesiana
Modelado jerárquico bayesiano
Proceso gaussiano
Inferencia estadística
Referencias
^ Enßlin, Torsten (2013). "Teoría del campo de información". Actas de la conferencia AIP . 1553 (1): 184-191. arXiv : 1301.2556 . Código Bibliográfico : 2013AIPC.1553..184E . doi : 10.1063 / 1.4819999 .
^Enßlin, Torsten A. (2019). "Teoría de la información por campos". Annalen der Physik . 531 (3): 1800127. arXiv : 1804.03350 . Código bibliográfico : 2019AnP ... 53100127E . doi : 10.1002 / yp.201800127 .
^"Teoría del campo de información" . Sociedad Max Planck . Consultado el 13 de noviembre de 2014 .
^Enßlin, Torsten A .; Frommert, Mona (19 de mayo de 2011). "Reconstrucción de señales con espectros desconocidos en teoría de campos de información con incertidumbre de parámetros". Physical Review D . 83 (10): 105014. arXiv : 1002.2928 . Código Bibliográfico : 2011PhRvD..83j5014E . doi : 10.1103 / PhysRevD.83.105014 .
^Enßlin, Torsten A. (2010). "Inferencia con mínima energía libre de Gibbs en la teoría del campo de información". Revisión E física . 82 (5): 051112. arXiv : 1004.2868 . Código Bibliográfico : 2010PhRvE..82e1112E . doi : 10.1103 / physreve.82.051112 . PMID 21230442 .
^Leike, Reimar H .; Enßlin, Torsten A. (16 de noviembre de 2016). "Cálculo de operadores para la teoría de campos de información". Revisión E física . 94 (5): 053306. arXiv : 1605.00660 . Código bibliográfico : 2016PhRvE..94e3306L . doi : 10.1103 / PhysRevE.94.053306 . PMID 27967173 .
^(1894-1964), Wiener, Norbert (1964). Extrapolación, interpolación y suavizado de series de tiempo estacionarias con aplicaciones de ingeniería (Quinta edición de la imprenta). Cambridge, Mass .: Technology Press del Instituto de Tecnología de Massachusetts. ISBN 0262730057. OCLC 489911338 .CS1 maint: nombres numéricos: lista de autores ( enlace )
^Bertschinger, Edmund (diciembre de 1987). "Métodos de ruta integral para perturbaciones de densidad primordial - Muestreo de campos aleatorios gaussianos restringidos". El diario astrofísico . 323 : L103 – L106. Código Bibliográfico : 1987ApJ ... 323L.103B . doi : 10.1086 / 185066 . ISSN 0004-637X .
^Bialek, William; Zee, A. (26 de septiembre de 1988). "Comprensión de la eficiencia de la percepción humana". Cartas de revisión física . 61 (13): 1512-1515. Código Bibliográfico : 1988PhRvL..61.1512B . doi : 10.1103 / PhysRevLett.61.1512 . PMID 10038817 .
^C., Lemm, Jörg (2003). Teoría del campo bayesiano . Baltimore, Maryland: Prensa de la Universidad Johns Hopkins. ISBN 9780801872204. OCLC 52762436 .
^Enßlin, Torsten A .; Frommert, Mona; Kitaura, Francisco S. (9 de noviembre de 2009). "Teoría del campo de información para la reconstrucción de perturbaciones cosmológicas y análisis de señales no lineales". Physical Review D . 80 (10): 105005. arXiv : 0806.3474 . Código Bibliográfico : 2009PhRvD..80j5005E . doi : 10.1103 / PhysRevD.80.105005 .