La desigualdad de Gibbs

En teoría de la información , la desigualdad de Gibbs es una declaración sobre la entropía de información de una distribución de probabilidad discreta . Varios otros límites en la entropía de las distribuciones de probabilidad se derivan de la desigualdad de Gibbs, incluida la desigualdad de Fano . Fue presentado por primera vez por J. Willard Gibbs en el siglo XIX.

Josiah Willard Gibbs

La desigualdad de Gibbs

Suponer que

{\ Displaystyle P = \ {p_ {1}, \ ldots, p_ {n} \}}

es una distribución de probabilidad . Luego, para cualquier otra distribución de probabilidad

{\ Displaystyle Q = \ {q_ {1}, \ ldots, q_ {n} \}}

la siguiente desigualdad entre cantidades positivas (ya que p _i y q _i están entre cero y uno) se cumple: ^[1]^{: 68}

{\ Displaystyle - \ sum _ {i = 1} ^ {n} p_ {i} \ log p_ {i} \ leq - \ sum _ {i = 1} ^ {n} p_ {i} \ log q_ {i }}

con igualdad si y solo si

{\ Displaystyle p_ {i} = q_ {i}}

por todo i . Dicho en palabras, la entropía de información de una distribución P es menor o igual que su entropía cruzada con cualquier otra distribución Q.

La diferencia entre las dos cantidades es la divergencia o entropía relativa de Kullback-Leibler , por lo que la desigualdad también se puede escribir: ^[2]^{: 34}

{\ Displaystyle D _ {\ mathrm {KL}} (P \ | Q) \ equiv \ sum _ {i = 1} ^ {n} p_ {i} \ log {\ frac {p_ {i}} {q_ {i }}} \ geq 0.}

Tenga en cuenta que el uso de logaritmos en base 2 es opcional y permite referirse a la cantidad en cada lado de la desigualdad como una " sorpresa promedio " medida en bits .

Prueba

Para simplificar, probamos el enunciado usando el logaritmo natural (ln), ya que

{\ Displaystyle \ log a = {\ frac {\ ln a} {\ ln 2}},}

el logaritmo particular que elegimos solo escala la relación.

Dejar ${\ Displaystyle I}$ denotar el conjunto de todos ${\ Displaystyle i}$ para el cual p _i es distinto de cero. Entonces, desde ${\ Displaystyle \ ln x \ leq x-1}$ para todo x> 0 , con igualdad si y solo si x = 1 , tenemos:

{\ Displaystyle - \ sum _ {i \ in I} p_ {i} \ ln {\ frac {q_ {i}} {p_ {i}}} \ geq - \ sum _ {i \ in I} p_ {i } \ left ({\ frac {q_ {i}} {p_ {i}}} - 1 \ right)}

{\ Displaystyle = - \ sum _ {i \ in I} q_ {i} + \ sum _ {i \ in I} p_ {i} = - \ sum _ {i \ in I} q_ {i} +1 \ geq 0}

La última desigualdad es una consecuencia de que p _i y q _i son parte de una distribución de probabilidad. Específicamente, la suma de todos los valores distintos de cero es 1. Sin embargo, algunos q _i distintos de cero pueden haber sido excluidos ya que la elección de índices está condicionada a que p _i sea distinto de cero. Por tanto, la suma de q _i puede ser menor que 1.

Hasta ahora, sobre el conjunto de índices ${\ Displaystyle I}$ , tenemos:

{\ Displaystyle - \ sum _ {i \ in I} p_ {i} \ ln {\ frac {q_ {i}} {p_ {i}}} \ geq 0}

,

o equivalente

{\ Displaystyle - \ sum _ {i \ in I} p_ {i} \ ln q_ {i} \ geq - \ sum _ {i \ in I} p_ {i} \ ln p_ {i}}

.

Ambas sumas se pueden extender a todos ${\ Displaystyle i = 1, \ ldots, n}$ , es decir, incluyendo ${\ Displaystyle p_ {i} = 0}$ , recordando que la expresión ${\ Displaystyle p \ ln p}$ tiende a 0 como ${\ Displaystyle p}$ tiende a 0, y ${\ Displaystyle (- \ ln q)}$ tiende a ${\ Displaystyle \ infty}$ como ${\ Displaystyle q}$ tiende a 0. Llegamos a

{\ Displaystyle - \ sum _ {i = 1} ^ {n} p_ {i} \ ln q_ {i} \ geq - \ sum _ {i = 1} ^ {n} p_ {i} \ ln p_ {i }}

Para que la igualdad se mantenga, necesitamos

${\ Displaystyle {\ frac {q_ {i}} {p_ {i}}} = 1}$ para todos ${\ Displaystyle i \ in I}$ para que la igualdad ${\ Displaystyle \ ln {\ frac {q_ {i}} {p_ {i}}} = {\ frac {q_ {i}} {p_ {i}}} - 1}$ sostiene,
y ${\ Displaystyle \ sum _ {i \ in I} q_ {i} = 1}$ lo que significa ${\ Displaystyle q_ {i} = 0}$ Si ${\ Displaystyle i \ notin I}$ , es decir, ${\ Displaystyle q_ {i} = 0}$ Si ${\ Displaystyle p_ {i} = 0}$ .

Esto puede suceder si y solo si ${\ Displaystyle p_ {i} = q_ {i}}$ por ${\ Displaystyle i = 1, \ ldots, n}$ .

Pruebas alternativas

El resultado se puede probar alternativamente utilizando la desigualdad de Jensen , la desigualdad de suma logarítmica o el hecho de que la divergencia de Kullback-Leibler es una forma de divergencia de Bregman . A continuación damos una prueba basada en la desigualdad de Jensen:

Debido a que log es una función cóncava, tenemos que:

{\ Displaystyle \ sum _ {i} p_ {i} \ log {\ frac {q_ {i}} {p_ {i}}} \ leq \ log \ sum _ {i} p_ {i} {\ frac {q_ {i}} {p_ {i}}} = \ log \ sum _ {i} q_ {i} \ leq 0}

Donde la primera desigualdad se debe a la desigualdad de Jensen, y la última igualdad se debe a la misma razón dada en la prueba anterior.

Además, dado que ${\ Displaystyle \ log}$ es estrictamente cóncava, por la condición de igualdad de la desigualdad de Jensen obtenemos igualdad cuando

{\ Displaystyle {\ frac {q_ {1}} {p_ {1}}} = {\ frac {q_ {2}} {p_ {2}}} = \ cdots = {\ frac {q_ {n}} { p_ {n}}}}

y

{\ Displaystyle \ sum _ {i} q_ {i} = 1}

Suponga que esta razón es ${\ Displaystyle \ sigma}$ , entonces tenemos eso

{\ Displaystyle 1 = \ sum _ {i} q_ {i} = \ sum _ {i} \ sigma p_ {i} = \ sigma}

Donde usamos el hecho de que ${\ Displaystyle p, q}$ son distribuciones de probabilidad. Por tanto, la igualdad ocurre cuando ${\ Displaystyle p = q}$ .

Corolario

La entropía de ${\ Displaystyle P}$ está delimitado por: ^[1]^{: 68}

{\ Displaystyle H (p_ {1}, \ ldots, p_ {n}) \ leq \ log n.}

La prueba es trivial, simplemente establezca ${\ Displaystyle q_ {i} = 1 / n}$ por todo i .

Ver también

Referencias

↑ ^a ^b Pierre Bremaud (6 de diciembre de 2012). Introducción al modelado probabilístico . Springer Science & Business Media. ISBN 978-1-4612-1046-7.
^ David JC MacKay. Teoría de la información, Inferencia y Algoritmos de aprendizaje . Prensa de la Universidad de Cambridge. ISBN 978-0-521-64298-9.

[Bremaud2012-1] Pierre Bremaud (6 de diciembre de 2012). Introducción al modelado probabilístico . Springer Science & Business Media. ISBN 978-1-4612-1046-7.

[MacKay2003-2] David JC MacKay. Teoría de la información, Inferencia y Algoritmos de aprendizaje . Prensa de la Universidad de Cambridge. ISBN 978-0-521-64298-9.

[1]