Valor esperado

Teoría de probabilidad
Parte de una serie de estadísticas

Probabilidad Axiomas Determinismo Sistema Indeterminismo Aleatoriedad
Espacio de probabilidad Espacio muestral Evento Eventos colectivamente exhaustivos Evento elemental Exclusividad mutua Salir único Experimentar Juicio de Bernoulli Distribución de probabilidad Distribución de Bernoulli Distribución binomial Distribución normal Medida de probabilidad Variable aleatoria Proceso de Bernoulli Continuo o discreto Valor esperado Cadena de Markov Valor observado Caminata aleatoria Proceso estocástico
Evento complementario Probabilidad conjunta Probabilidad marginal La probabilidad condicional
Independencia Independencia condicional Ley de probabilidad total Ley de los grandes números Teorema de Bayes La desigualdad de Boole
diagrama de Venn Diagrama de árbol
v t mi

En la teoría de la probabilidad , el valor esperado de una variable aleatoria ${\ Displaystyle X}$ , a menudo denotado ${\ Displaystyle \ operatorname {E} (X)}$ , ${\ Displaystyle \ operatorname {E} [X]}$ , o ${\ displaystyle EX}$ , es una generalización del promedio ponderado , e intuitivamente es la media aritmética de un gran número de realizaciones independientes de ${\ Displaystyle X}$ . El operador de la expectativa ${\ Displaystyle \ operatorname {E}}$ también se estiliza comúnmente como ${\ Displaystyle E}$ o ${\ Displaystyle \ mathbb {E}}$ . ^[1]^[2]^[3]^[4] El valor esperado también se conoce como expectativa , expectativa matemática , media , promedio o primer momento . El valor esperado es un concepto clave en economía , finanzas y muchas otras materias.

Por definición, el valor esperado de una variable aleatoria constante ${\ Displaystyle X = c}$ es ${\ Displaystyle c}$ . ^[5] El valor esperado de una variable aleatoria ${\ Displaystyle X}$ con resultados equiprobables ${\ Displaystyle \ {c_ {1}, \ ldots, c_ {n} \}}$ se define como la media aritmética de los términos ${\ Displaystyle c_ {i}.}$ Si algunas de las probabilidades ${\ Displaystyle \ Pr \, (X = c_ {i})}$ de un resultado individual ${\ Displaystyle c_ {i}}$ son desiguales, entonces el valor esperado se define como el promedio ponderado por probabilidad de la ${\ Displaystyle c_ {i}}$ s, es decir, la suma de los ${\ Displaystyle n}$ productos ${\ Displaystyle c_ {i} \ cdot \ Pr \, (X = c_ {i})}$ . ^[6] El valor esperado de una variable aleatoria general implica la integración en el sentido de Lebesgue .

Historia

La idea del valor esperado se originó a mediados del siglo XVII a partir del estudio del llamado problema de los puntos , que busca dividir las apuestas de manera justa entre dos jugadores, que tienen que terminar su juego antes de que sea adecuadamente. terminado. ^[7] Este problema se había debatido durante siglos, y se habían sugerido muchas propuestas y soluciones contradictorias a lo largo de los años, cuando se lo planteó a Blaise Pascal el escritor y matemático aficionado francés Chevalier de Méré.en 1654. Méré afirmó que este problema no podía resolverse y que mostraba cuán defectuosas eran las matemáticas cuando se trataba de su aplicación al mundo real. Pascal, siendo matemático, estaba provocado y decidido a resolver el problema de una vez por todas.

Comenzó a discutir el problema en la famosa serie de cartas a Pierre de Fermat . Muy pronto, ambos encontraron una solución de forma independiente. Resolvieron el problema de diferentes formas computacionales, pero sus resultados fueron idénticos porque sus cálculos se basaron en el mismo principio fundamental. El principio es que el valor de una ganancia futura debe ser directamente proporcional a la posibilidad de obtenerla. Este principio parecía haber sido algo natural para ambos. Estaban muy complacidos por el hecho de que habían encontrado esencialmente la misma solución, y esto a su vez los hizo absolutamente convencidos de que habían resuelto el problema de manera concluyente; sin embargo, no publicaron sus hallazgos. Solo informaron al respecto a un pequeño círculo de amigos científicos mutuos en París. ^[8]

Tres años más tarde, en 1657, un matemático holandés Christiaan Huygens , que acababa de visitar París, publicó un tratado (véase Huygens (1657) ) " De ratiociniis in ludo aleæ " sobre teoría de la probabilidad. En este libro, consideró el problema de los puntos y presentó una solución basada en el mismo principio que las soluciones de Pascal y Fermat. Huygens también amplió el concepto de expectativa al agregar reglas sobre cómo calcular las expectativas en situaciones más complicadas que el problema original (por ejemplo, para tres o más jugadores). En este sentido, este libro puede verse como el primer intento exitoso de sentar las bases de la teoría de la probabilidad .

En el prólogo de su libro, Huygens escribió:

También hay que decir que desde hace algún tiempo algunos de los mejores matemáticos de Francia se han ocupado de este tipo de cálculo para que nadie me atribuya el honor de la primera invención. Esto no me pertenece. Pero estos sabios, aunque se pusieron a prueba proponiéndose entre sí muchas cuestiones difíciles de resolver, han ocultado sus métodos. Por lo tanto, he tenido que examinar y profundizar en este asunto comenzando por los elementos, y por eso me es imposible afirmar que incluso he comenzado por el mismo principio. Pero finalmente he descubierto que mis respuestas en muchos casos no difieren de las de ellos.
- Edwards (2002)

Así, Huygens se enteró del Problema de Méré en 1655 durante su visita a Francia; más tarde, en 1656, a partir de su correspondencia con Carcavi, se enteró de que su método era esencialmente el mismo que el de Pascal; de modo que antes de que su libro saliera a la imprenta en 1657, conocía la prioridad de Pascal en este tema.

A mediados del siglo XIX, Pafnuty Chebyshev se convirtió en la primera persona en pensar sistemáticamente en términos de las expectativas de las variables aleatorias . ^[9]

Etimología

Ni Pascal ni Huygens utilizaron el término "expectativa" en su sentido moderno. En particular, Huygens escribe: ^[10]

Que cualquier Oportunidad o Expectativa de ganar cualquier cosa vale tal Suma, como se obtendría en la misma Oportunidad y Expectativa en un momento justo. ... Si espero a o b, y tengo la misma probabilidad de obtenerlos, mi Expectativa vale (a + b) / 2.

Más de cien años después, en 1814, Pierre-Simon Laplace publicó su tratado " Théorie analytique des probabilités ", donde se definía explícitamente el concepto de valor esperado: ^[11]

… Esta ventaja en la teoría del azar es producto de la suma esperada por la probabilidad de obtenerla; es la suma parcial que debe resultar cuando no deseamos correr los riesgos del evento al suponer que la división se hace proporcional a las probabilidades. Esta división es la única equitativa cuando se eliminan todas las circunstancias extrañas; porque un grado igual de probabilidad da igual derecho a la suma esperada. A esta ventaja la llamaremos esperanza matemática .

Anotaciones

El uso de la letra ${\ Displaystyle \ mathop {\ hbox {E}}}$ para denotar el valor esperado se remonta a WA Whitworth en 1901. ^[12] El símbolo se ha vuelto popular desde entonces para los escritores ingleses. En alemán, ${\ Displaystyle \ mathop {\ hbox {E}}}$ significa "Erwartungswert", en español para "Esperanza matemática", y en francés para "Espérance mathématique". ^[13]

Cuando se usa E para denotar el valor esperado, los autores usan una variedad de notación: el operador de expectativa se puede esterilizar como ${\ Displaystyle \ operatorname {E}}$ (vertical), ${\ Displaystyle E}$ (cursiva), o ${\ Displaystyle \ mathbb {E}}$ (en negrita ), mientras que los corchetes ( ${\ Displaystyle E (X)}$ ), corchetes ( ${\ Displaystyle E [X]}$ ), o sin corchetes ( ${\ displaystyle EX}$ ) se utilizan todos.

Otra notación popular es ${\ Displaystyle \ mu _ {X}}$ , mientras que ${\ Displaystyle \ langle X \ rangle}$ se usa comúnmente en física, y ${\ Displaystyle \ mathop {\ hbox {M}} (X)}$ en la literatura en lengua rusa.

Definición

Caso finito

Dejar ${\ Displaystyle X}$ ser una variable aleatoria con un número finito de resultados finitos ${\ Displaystyle x_ {1}, x_ {2}, \ ldots, x_ {k}}$ ocurriendo con probabilidades ${\ Displaystyle p_ {1}, p_ {2}, \ ldots, p_ {k},}$ respectivamente. La expectativa de ${\ Displaystyle X}$ se define como ^[6]

{\ Displaystyle \ operatorname {E} [X] = \ sum _ {i = 1} ^ {k} x_ {i} \, p_ {i} = x_ {1} p_ {1} + x_ {2} p_ { 2} + \ cdots + x_ {k} p_ {k}.}

Ya que ${\ Displaystyle p_ {1} + p_ {2} + \ cdots + p_ {k} = 1,}$ el valor esperado es la suma ponderada de la ${\ Displaystyle x_ {i}}$ valores, con las probabilidades ${\ Displaystyle p_ {i}}$ como los pesos.

Si todos los resultados ${\ Displaystyle x_ {i}}$ son equiprobables (es decir, ${\ Displaystyle p_ {1} = p_ {2} = \ cdots = p_ {k}}$ ), entonces el promedio ponderado se convierte en el promedio simple . Por otro lado, si los resultados ${\ Displaystyle x_ {i}}$ no son equiprobables, entonces el promedio simple debe ser reemplazado por el promedio ponderado, que toma en cuenta el hecho de que algunos resultados son más probables que otros.

Una ilustración de la convergencia de los promedios de secuencia de lanzamientos de un dado al valor esperado de 3.5 a medida que aumenta el número de lanzamientos (ensayos).

Ejemplos

Dejar ${\ Displaystyle X}$ representan el resultado de una tirada de un dado de seis caras . Más específicamente, ${\ Displaystyle X}$ será el número de pepitas que se muestran en la cara superior del dado después del lanzamiento. Los posibles valores para ${\ Displaystyle X}$ son 1, 2, 3, 4, 5 y 6, todos los cuales son igualmente probables con una probabilidad de 1/6. La expectativa de ${\ Displaystyle X}$ es

{\ Displaystyle \ operatorname {E} [X] = 1 \ cdot {\ frac {1} {6}} + 2 \ cdot {\ frac {1} {6}} + 3 \ cdot {\ frac {1} { 6}} + 4 \ cdot {\ frac {1} {6}} + 5 \ cdot {\ frac {1} {6}} + 6 \ cdot {\ frac {1} {6}} = 3.5.}

Si uno lanza el dado

{\ Displaystyle n}

veces y calcula el promedio (media aritmética ) de los resultados, luego como

{\ Displaystyle n}

crece, el promedio casi seguramente convergerá al valor esperado, un hecho conocido como la ley fuerte de los grandes números .

El juego de la ruleta consiste en una pequeña bola y una rueda con 38 bolsillos numerados alrededor del borde. A medida que se hace girar la rueda, la bola rebota aleatoriamente hasta que se asienta en uno de los bolsillos. Suponga una variable aleatoria ${\ Displaystyle X}$ representa el resultado (monetario) de una apuesta de $ 1 en un solo número (apuesta "directa"). Si la apuesta gana (lo que ocurre con probabilidad1/38en la ruleta americana), la recompensa es de $ 35; de lo contrario, el jugador pierde la apuesta. El beneficio esperado de tal apuesta será

{\ Displaystyle \ operatorname {E} [\, {\ text {ganancia de}} \ $ 1 {\ text {bet}} \,] = - \ $ 1 \ cdot {\ frac {37} {38}} + \ $ 35 \ cdot {\ frac {1} {38}} = - \ $ {\ frac {1} {19}}.}

Es decir, la apuesta de $ 1 se puede perder.

{\ Displaystyle - \ $ {\ frac {1} {19}}}

, por lo que su valor esperado es

{\ Displaystyle - \ $ {\ frac {1} {19}}.}

Caso contablemente infinito

Intuitivamente, la expectativa de una variable aleatoria que toma valores en un conjunto contable de resultados se define de manera análoga como la suma ponderada de los valores de los resultados, donde los pesos corresponden a las probabilidades de realizar ese valor. Sin embargo, los problemas de convergencia asociados con la suma infinita requieren una definición más cuidadosa. Una definición rigurosa primero define la expectativa de una variable aleatoria no negativa y luego la adapta a las variables aleatorias generales.

Dejar ${\ Displaystyle X}$ ser una variable aleatoria no negativa con un conjunto contable de resultados ${\ Displaystyle x_ {1}, x_ {2}, \ ldots,}$ ocurriendo con probabilidades ${\ Displaystyle p_ {1}, p_ {2}, \ ldots,}$ respectivamente. De manera análoga al caso discreto, el valor esperado de ${\ Displaystyle X}$ entonces se define como la serie

{\ Displaystyle \ operatorname {E} [X] = \ sum _ {i = 1} ^ {\ infty} x_ {i} \, p_ {i}.}

Tenga en cuenta que desde ${\ Displaystyle x_ {i} p_ {i} \ geq 0}$ , la suma infinita está bien definida y no depende del orden en que se calcula. A diferencia del caso finito, la expectativa aquí puede ser igual al infinito, si la suma infinita anterior aumenta sin límite.

Para una variable aleatoria general (no necesariamente no negativa) ${\ Displaystyle X}$ con un número contable de resultados, establezca ${\ Displaystyle X ^ {+} (\ omega) = \ max (X (\ omega), 0)}$ y ${\ Displaystyle X ^ {-} (\ omega) = - \ min (X (\ omega), 0)}$ . Por definición,

{\ Displaystyle \ operatorname {E} [X] = \ operatorname {E} [X ^ {+}] - \ operatorname {E} [X ^ {-}].}

Al igual que con las variables aleatorias no negativas, ${\ Displaystyle \ operatorname {E} [X]}$ puede, una vez más, ser finito o infinito. La tercera opción aquí es que ${\ Displaystyle \ operatorname {E} [X]}$ ya no se garantiza que esté bien definido. Esto último sucede siempre que ${\ Displaystyle \ operatorname {E} [X ^ {+}] = \ operatorname {E} [X ^ {-}] = \ infty}$ .

Ejemplos

Suponer ${\ Displaystyle x_ {i} = i}$ y ${\ Displaystyle p_ {i} = {\ frac {k} {i2 ^ {i}}},}$ por ${\ Displaystyle i = 1,2,3, \ ldots}$ , donde ${\ Displaystyle k = {\ frac {1} {\ ln 2}}}$ (con ${\ Displaystyle \ ln}$ siendo el logaritmo natural ) es el factor de escala tal que las probabilidades suman 1. Luego, usando la definición directa para variables aleatorias no negativas, tenemos

{\ Displaystyle \ operatorname {E} [X] = \ sum _ {i} x_ {i} p_ {i} = 1 \ left ({\ frac {k} {2}} \ right) +2 \ left ({ \ frac {k} {8}} \ right) +3 \ left ({\ frac {k} {24}} \ right) + \ dots = {\ frac {k} {2}} + {\ frac {k } {4}} + {\ frac {k} {8}} + \ dots = k.}

Un ejemplo en el que la expectativa es infinita surge en el contexto de la paradoja de San Petersburgo . Dejar ${\ Displaystyle x_ {i} = 2 ^ {i}}$ y ${\ Displaystyle p_ {i} = {\ frac {1} {2 ^ {i}}}}$ por ${\ Displaystyle i = 1,2,3, \ ldots}$ . Una vez más, dado que la variable aleatoria no es negativa, el cálculo del valor esperado da

{\ Displaystyle \ operatorname {E} [X] = \ sum _ {i = 1} ^ {\ infty} x_ {i} \, p_ {i} = 2 \ cdot {\ frac {1} {2}} + 4 \ cdot {\ frac {1} {4}} + 8 \ cdot {\ frac {1} {8}} + 16 \ cdot {\ frac {1} {16}} + \ cdots = 1 + 1 + 1 +1+ \ cdots \, = \ infty.}

Para un ejemplo donde la expectativa no está bien definida, suponga que la variable aleatoria ${\ Displaystyle X}$ toma valores ${\ Displaystyle k = 1, -2,3, -4, \ cdots}$ con probabilidades respectivas ${\ Displaystyle {\ frac {c} {1 ^ {2}}}, {\ frac {c} {2 ^ {2}}}, {\ frac {c} {3 ^ {2}}}, {\ frac {c} {4 ^ {2}}}}$ , ..., donde ${\ Displaystyle c = {\ frac {6} {\ pi ^ {2}}}}$ es una constante de normalización que asegura que las probabilidades sumen uno.

Entonces sigue que

{\ Displaystyle X ^ {+}}

toma valor

{\ Displaystyle (2k-1)}

con probabilidad

{\ Displaystyle c / (2k-1) ^ {2}}

por

{\ Displaystyle k = 1,2,3, \ cdots}

y toma valor

{\ Displaystyle 0}

con probabilidad restante. Similar,

{\ Displaystyle X ^ {-}}

toma valor

{\ displaystyle 2k}

con probabilidad

{\ Displaystyle c / (2k) ^ {2}}

por

{\ Displaystyle k = 1,2,3, \ cdots}

y toma valor

{\ Displaystyle 0}

con probabilidad restante. Usando la definición de variables aleatorias no negativas, se puede demostrar que tanto

{\ Displaystyle \ operatorname {E} [X ^ {+}] = \ infty}

y

{\ Displaystyle \ operatorname {E} [X ^ {-}] = \ infty}

(ver serie Armónica ). Por tanto, la expectativa de

{\ Displaystyle X}

no está bien definido.

Caso absolutamente continuo

Si ${\ Displaystyle X}$ es una variable aleatoria con una función de densidad de probabilidad de ${\ Displaystyle f (x)}$ , entonces el valor esperado se define como la integral de Lebesgue

{\ Displaystyle \ operatorname {E} [X] = \ int _ {\ mathbb {R}} xf (x) \, dx,}

donde los valores en ambos lados están bien definidos o no están bien definidos simultáneamente.

Ejemplo. Una variable aleatoria que tiene la distribución de Cauchy ^[14] tiene una función de densidad, pero el valor esperado no está definido ya que la distribución tiene grandes "colas" .

Caso general

En general, si ${\ Displaystyle X}$ es una variable aleatoria definida en un espacio de probabilidad ${\ Displaystyle (\ Omega, \ Sigma, \ operatorname {P})}$ , entonces el valor esperado de ${\ Displaystyle X}$ , denotado por ${\ Displaystyle \ operatorname {E} [X]}$ , se define como la integral de Lebesgue

{\ Displaystyle \ operatorname {E} [X] = \ int _ {\ Omega} X (\ omega) \, d \ operatorname {P} (\ omega).}

Para las variables aleatorias multidimensionales, su valor esperado se define por componente. Eso es,

{\ Displaystyle \ operatorname {E} [(X_ {1}, \ ldots, X_ {n})] = (\ operatorname {E} [X_ {1}], \ ldots, \ operatorname {E} [X_ {n }])}

y, para una matriz aleatoria ${\ Displaystyle X}$ con elementos ${\ Displaystyle X_ {ij}}$ , ${\ Displaystyle (\ operatorname {E} [X]) _ {ij} = \ operatorname {E} [X_ {ij}].}$

Propiedades básicas

Las propiedades básicas a continuación (y sus nombres en negrita) replican o siguen inmediatamente a las de la integral de Lebesgue . Tenga en cuenta que las letras "as" representan " casi con seguridad ", una propiedad central de la integral de Lebesgue. Básicamente, se dice que una desigualdad como ${\ Displaystyle X \ geq 0}$ es cierto casi con seguridad, cuando la medida de probabilidad atribuye masa cero al evento complementario ${\ Displaystyle \ left \ {X <0 \ right \}}$ .

Para una variable aleatoria general ${\ Displaystyle X}$ , define como antes ${\ Displaystyle X ^ {+} (\ omega) = \ max (X (\ omega), 0)}$ y ${\ Displaystyle X ^ {-} (\ omega) = - \ min (X (\ omega), 0)}$ , y tenga en cuenta que ${\ Displaystyle X = X ^ {+} - X ^ {-}}$ , con ambos ${\ Displaystyle X ^ {+}}$ y ${\ Displaystyle X ^ {-}}$ no negativo, entonces:

{\ Displaystyle \ operatorname {E} [X] = {\ begin {cases} \ operatorname {E} [X ^ {+}] - \ operatorname {E} [X ^ {-}] & {\ text {if} } \ operatorname {E} [X ^ {+}] <\ infty {\ text {y}} \ operatorname {E} [X ^ {-}] <\ infty; \\\ infty & {\ text {if} } \ operatorname {E} [X ^ {+}] = \ infty {\ text {y}} \ operatorname {E} [X ^ {-}] <\ infty; \\ - \ infty & {\ text {if }} \ operatorname {E} [X ^ {+}] <\ infty {\ text {y}} \ operatorname {E} [X ^ {-}] = \ infty; \\ {\ text {undefined}} & {\ text {if}} \ operatorname {E} [X ^ {+}] = \ infty {\ text {y}} \ operatorname {E} [X ^ {-}] = \ infty. \ end {cases} }}

Dejar ${\ Displaystyle {\ mathbf {1}} _ {A}}$ denotar la función indicadora de un evento ${\ Displaystyle A}$ , luego ${\ Displaystyle \ operatorname {E} [{\ mathbf {1}} _ {A}] = 1 \ cdot \ operatorname {P} (A) +0 \ cdot \ operatorname {P} (\ Omega \ setminus A) = \ nombre de operador {P} (A).}$
Fórmulas en términos de CDF: Si ${\ Displaystyle F (x)}$ es la función de distribución acumulativa de la medida de probabilidad ${\ Displaystyle \ operatorname {P},}$ y ${\ Displaystyle X}$ es una variable aleatoria, entonces

{\ Displaystyle \ operatorname {E} [X] = \ int _ {\ overline {\ mathbb {R}}} x \, dF (x),}

donde los valores en ambos lados están bien definidos o no bien definidos simultáneamente, y la integral se toma en el sentido de Lebesgue-Stieltjes . Aquí,

{\ Displaystyle {\ overline {\ mathbb {R}}} = [- \ infty, + \ infty]}

es la línea real extendida.

Adicionalmente,

{\ Displaystyle \ Displaystyle \ operatorname {E} [X] = \ int \ limits _ {0} ^ {\ infty} (1-F (x)) \, dx- \ int \ limits _ {- \ infty} ^ {0} F (x) \, dx,}

con las integrales tomadas en el sentido de Lebesgue.

Sigue la demostración de la segunda fórmula.

Prueba.

For an arbitrary $\omega \in \Omega ,$

$\displaystyle X^{-}(\omega )=\int \limits _{-X^{-}(\omega )}^{0}dx=\int \limits _{-\infty }^{0}{\mathbf {1} }{\{x\mid X^{-}(\omega )\geq -x\}}\,dx=\int \limits _{-\infty }^{0}{\mathbf {1} }{\{(\omega ,x)\mid X(\omega )\leq x\}}\,dx.$

The last equality holds because the fact that $X^{-}(\omega )\geq -x,$ where $x\leq 0,$ implies that $X^{+}(\omega )=0$ and hence $X(\omega )\leq x.$ Conversely, if $X(\omega )\leq x,$ where $x\leq 0,$ then $X^{+}(\omega )=0$ and $X^{-}(\omega )\geq -x.$

The integrand in the above expression for $X^{-}(\omega )$ is non-negative, so Tonelli's theorem applies, and the order of integration may be switched without altering the result. We have

${\begin{aligned}\operatorname {E} (X^{-})&=\int \limits _{\Omega }\left(\int \limits _{-\infty }^{0}{\mathbf {1} }{\{(\omega ,x)\mid X(\omega )\leq x\}}\,dx\right)d\operatorname {P} \\&=\int \limits _{-\infty }^{0}\left(\int \limits _{\Omega }{\mathbf {1} }{\{\omega \mid X(\omega )\leq x\}}\,d\operatorname {P} \right)dx\\&=\int \limits _{-\infty }^{0}\operatorname {P} (X\leq x)\,dx=\int \limits _{-\infty }^{0}F(x)\,dx.\end{aligned}}$

Arguing as above,

$\displaystyle X^{+}(\omega )=\int \limits _{0}^{\infty }{\mathbf {1} }{\{(\omega ,x)\mid X(\omega )>x\}}\,dx,$

and

$\displaystyle \operatorname {E} (X^{+})=\int \limits _{0}^{\infty }\operatorname {P} (X>x)\,dx=\int \limits _{0}^{\infty }(1-F(x))\,dx.$

Recalling that $\operatorname {E} (X)=\operatorname {E} (X^{+})-\operatorname {E} (X^{-})$ completes the proof.

No negatividad: si ${\ Displaystyle X \ geq 0}$ (como entonces ${\ Displaystyle \ operatorname {E} [X] \ geq 0}$ .
Linealidad de la expectativa: ^[5] El operador de valor esperado (u operador de expectativa ) ${\ Displaystyle \ operatorname {E} [\ cdot]}$ es lineal en el sentido de que, para cualquier variable aleatoria ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ y una constante ${\ Displaystyle a}$ ,

{\ displaystyle {\ begin {alineado} \ operatorname {E} [X + Y] & = \ operatorname {E} [X] + \ operatorname {E} [Y], \\\ operatorname {E} [aX] & = un \ nombre de operador {E} [X], \ end {alineado}}}

siempre que el lado derecho esté bien definido. Esto significa que el valor esperado de la suma de cualquier número finito de variables aleatorias es la suma de los valores esperados de las variables aleatorias individuales, y el valor esperado se escala linealmente con una constante multiplicativa. Simbólicamente, para

{\ Displaystyle N}

variables aleatorias

{\ Displaystyle X_ {i}}

y constantes

{\ Displaystyle a_ {i} (1 \ leq i \ leq N)}

, tenemos

{\ Displaystyle \ operatorname {E} [\ sum _ {i = 1} ^ {N} a_ {i} X_ {i}] = \ sum _ {i = 1} ^ {N} a_ {i} \ operatorname { E} [X_ {i}]}

.

Monotonicidad: Si ${\ Displaystyle X \ leq Y}$ (como) , y ambos ${\ Displaystyle \ operatorname {E} [X]}$ y ${\ Displaystyle \ operatorname {E} [Y]}$ existir, entonces ${\ Displaystyle \ operatorname {E} [X] \ leq \ operatorname {E} [Y]}$ .

La prueba se deriva de la propiedad de linealidad y no negatividad para

{\ Displaystyle Z = YX}

, ya que

{\ Displaystyle Z \ geq 0}

(como).

No multiplicatividad: en general, el valor esperado no es multiplicativo, es decir ${\ Displaystyle \ operatorname {E} [XY]}$ no es necesariamente igual a ${\ Displaystyle \ operatorname {E} [X] \ cdot \ operatorname {E} [Y]}$ . Si ${\ Displaystyle X}$ y ${\ Displaystyle Y}$ son independientes , entonces se puede demostrar que ${\ Displaystyle \ operatorname {E} [XY] = \ operatorname {E} [X] \ operatorname {E} [Y]}$ . Si las variables aleatorias son dependientes , generalmente ${\ Displaystyle \ operatorname {E} [XY] \ neq \ operatorname {E} [X] \ operatorname {E} [Y]}$ , aunque en casos especiales de dependencia puede darse la igualdad.
Ley del estadístico inconsciente : el valor esperado de una función medible de ${\ Displaystyle X}$ , ${\ Displaystyle g (X)}$ , Dado que ${\ Displaystyle X}$ tiene una función de densidad de probabilidad ${\ Displaystyle f (x)}$ , viene dado por el producto interno de ${\ Displaystyle f}$ y ${\ Displaystyle g}$ :

{\ Displaystyle \ operatorname {E} [g (X)] = \ int _ {\ mathbb {R}} g (x) f (x) \, dx.}

^[5]

Esta fórmula también es válida en caso multidimensional, cuando

{\ Displaystyle g}

es una función de varias variables aleatorias, y

{\ Displaystyle f}

es su densidad articular . ^[5]^[15]

No degeneración: si ${\ Displaystyle \ operatorname {E} [| X |] = 0}$ , luego ${\ Displaystyle X = 0}$ (como).
Para una variable aleatoria ${\ Displaystyle X}$ con expectativa bien definida: ${\ Displaystyle | \ operatorname {E} [X] | \ leq \ operatorname {E} | X |}$ .
Las siguientes declaraciones con respecto a una variable aleatoria ${\ Displaystyle X}$ son equivalentes:
- ${\ Displaystyle \ operatorname {E} [X]}$ existe y es finito.
- Ambas cosas ${\ Displaystyle \ operatorname {E} [X ^ {+}]}$ y ${\ Displaystyle \ operatorname {E} [X ^ {-}]}$ son finitos.
- ${\ Displaystyle \ operatorname {E} [| X |]}$ es finito.

Por las razones anteriores, las expresiones "

{\ Displaystyle X}

es integrable "y" el valor esperado de

{\ Displaystyle X}

es finito "se utilizan indistintamente a lo largo de este artículo.

Si ${\ Displaystyle \ operatorname {E} [X] <+ \ infty}$ luego ${\ Displaystyle X <+ \ infty}$ (como) . Del mismo modo, si ${\ Displaystyle \ operatorname {E} [X]> - \ infty}$ luego ${\ Displaystyle X> - \ infty}$ (como) .
Si ${\ Displaystyle \ operatorname {E} | X ^ {\ beta} | <\ infty}$ y ${\ Displaystyle 0 <\ alpha <\ beta,}$ luego ${\ Displaystyle \ operatorname {E} | X ^ {\ alpha} | <\ infty.}$
Si ${\ Displaystyle X = Y}$ (como) , entonces ${\ Displaystyle \ operatorname {E} [X] = \ operatorname {E} [Y]}$ . En otras palabras, si X e Y son variables aleatorias que toman valores diferentes con probabilidad cero, entonces la expectativa de X será igual a la expectativa de Y.
Si ${\ Displaystyle X = c}$ (como) para alguna constante ${\ Displaystyle c \ in [- \ infty, + \ infty]}$ , luego ${\ Displaystyle \ operatorname {E} [X] = c}$ . En particular, para una variable aleatoria ${\ Displaystyle X}$ con expectativas bien definidas, ${\ Displaystyle \ operatorname {E} [\ operatorname {E} [X]] = \ operatorname {E} [X]}$ . Una expectativa bien definida implica que hay un número, o más bien, una constante que define el valor esperado. Por lo tanto, se deduce que la expectativa de esta constante es solo el valor esperado original.
Para una variable aleatoria de valor entero no negativo ${\ Displaystyle X: \ Omega \ to \ {0,1,2,3, \ ldots, + \ infty \},}$

{\ Displaystyle \ operatorname {E} [X] = \ sum _ {n = 0} ^ {\ infty} \ operatorname {P} (X> n).}

Prueba.

If $\operatorname {P} (X=+\infty )>0,$ then $\operatorname {E} [X]=+\infty .$ On the other hand,

\operatorname {P} (X>n)\geq \operatorname {P} (X=+\infty )>0,

so the series on the right diverges to $+\infty ,$ and the equality holds.

If $\operatorname {P} (X=+\infty )=0,$ then

\sum _{n=0}^{\infty }\operatorname {P} (X>n)=\sum _{n=0}^{\infty }\sum _{j=n+1}^{\infty }\operatorname {P} (X=j).

Define the infinite upper-triangular matrix

M={\begin{bmatrix}\operatorname {P} (X=1)&\operatorname {P} (X=2)&\operatorname {P} (X=3)&\cdots &\operatorname {P} (X=n)&\cdots \\&\operatorname {P} (X=2)&\operatorname {P} (X=3)&\cdots &\operatorname {P} (X=n)&\cdots \\&&\operatorname {P} (X=3)&\cdots &\operatorname {P} (X=n)&\cdots \\&&&\ddots &\vdots &\\&&&&\operatorname {P} (X=n)&\cdots \\&&&&&\ddots \end{bmatrix}}.

The double series $\textstyle \sum _{i=1}^{\infty }\sum _{j=i}^{\infty }\operatorname {P} (X=j)$ is the sum of $M$ 's elements if summation is done row by row. Since every summand is non-negative, the series either converges absolutely or diverges to $+\infty .$ In both cases, changing summation order does not affect the sum. Changing summation order, from row-by-row to column-by-column, gives us

{\begin{aligned}\sum _{n=0}^{\infty }\sum _{j=n+1}^{\infty }\operatorname {P} (X=j)&=\sum _{j=1}^{\infty }\sum _{n=0}^{j-1}\operatorname {P} (X=j)\\&=\sum _{j=1}^{\infty }j\operatorname {P} (X=j)\\&=\sum _{j=0}^{\infty }j\operatorname {P} (X=j)\\&=\operatorname {E} [X].\end{aligned}}

Usos y aplicaciones

La expectativa de una variable aleatoria juega un papel importante en una variedad de contextos. Por ejemplo, en la teoría de la decisión , a menudo se supone que un agente que hace una elección óptima en el contexto de información incompleta maximiza el valor esperado de su función de utilidad . Para un ejemplo diferente, en estadística , donde se buscan estimaciones de parámetros desconocidos con base en los datos disponibles, la estimación en sí es una variable aleatoria. En tales situaciones, un criterio deseable para un estimador "bueno" es que sea insesgado ; es decir, el valor esperado de la estimación es igual al valor real del parámetro subyacente.

Es posible construir un valor esperado igual a la probabilidad de un evento, tomando la expectativa de una función indicadora que es uno si el evento ha ocurrido y cero en caso contrario. Esta relación se puede utilizar para traducir las propiedades de los valores esperados en propiedades de probabilidades, por ejemplo, utilizando la ley de los grandes números para justificar la estimación de probabilidades por frecuencias .

Los valores esperados de las potencias de X se denominan momentos de X ; los momentos alrededor de la media de X son valores esperados de potencias de X - E [ X ]. Los momentos de algunas variables aleatorias se pueden utilizar para especificar sus distribuciones, a través de sus funciones generadoras de momentos .

Para estimar empíricamente el valor esperado de una variable aleatoria, se miden repetidamente las observaciones de la variable y se calcula la media aritmética de los resultados. Si existe el valor esperado, este procedimiento estima el verdadero valor esperado de manera insesgada y tiene la propiedad de minimizar la suma de los cuadrados de los residuos (la suma de las diferencias al cuadrado entre las observaciones y la estimación ). La ley de los números grandes demuestra (en condiciones bastante suaves) que, a medida que aumenta el tamaño de la muestra , la varianza de esta estimación se reduce.

Esta propiedad a menudo se explota en una amplia variedad de aplicaciones, incluidos problemas generales de estimación estadística y aprendizaje automático , para estimar cantidades (probabilísticas) de interés a través de métodos de Monte Carlo , ya que la mayoría de las cantidades de interés se pueden escribir en términos de expectativa, p. ${\ Displaystyle \ operatorname {P} ({X \ in {\ mathcal {A}}}) = \ operatorname {E} [{\ mathbf {1}} _ {\ mathcal {A}}]}$ , donde ${\ Displaystyle {\ mathbf {1}} _ {\ mathcal {A}}}$ es la función indicadora del conjunto ${\ Displaystyle {\ mathcal {A}}}$ .

La masa de la distribución de probabilidad se equilibra en el valor esperado, aquí una distribución Beta (α, β) con el valor esperado α / (α + β).

En la mecánica clásica , el centro de masa es un concepto análogo a la expectativa. Por ejemplo, suponga que X es una variable aleatoria discreta con valores x _i y sus correspondientes probabilidades p _i . Ahora considere una varilla ingrávida sobre la que se colocan pesos, en las ubicaciones x _{i a lo} largo de la varilla y que tiene masas p _i (cuya suma es uno). El punto en el que la varilla se equilibra es E [ X ].

Los valores esperados también se pueden usar para calcular la varianza , por medio de la fórmula computacional para la varianza

{\ Displaystyle \ operatorname {Var} (X) = \ operatorname {E} [X ^ {2}] - (\ operatorname {E} [X]) ^ {2}.}

Una aplicación muy importante del valor esperado se encuentra en el campo de la mecánica cuántica . El valor esperado de un operador de mecánica cuántica ${\ Displaystyle {\ hat {A}}}$ operando en un vector de estado cuántico ${\ Displaystyle | \ psi \ rangle}$ está escrito como ${\ Displaystyle \ langle {\ hat {A}} \ rangle = \ langle \ psi | A | \ psi \ rangle}$ . La incertidumbre en ${\ Displaystyle {\ hat {A}}}$ se puede calcular usando la fórmula ${\ displaystyle (\ Delta A) ^ {2} = \ langle {\ hat {A}} ^ {2} \ rangle - \ langle {\ hat {A}} \ rangle ^ {2}}$ .

Intercambiando límites y expectativas

En general, no es el caso que ${\ Displaystyle \ operatorname {E} [X_ {n}] \ to \ operatorname {E} [X]}$ A pesar de ${\ Displaystyle X_ {n} \ a X}$ puntual. Por tanto, no se pueden intercambiar límites y expectativas sin condiciones adicionales sobre las variables aleatorias. Para ver esto, deja ${\ Displaystyle U}$ ser una variable aleatoria distribuida uniformemente en ${\ Displaystyle [0,1]}$ . Para ${\ Displaystyle n \ geq 1,}$ definir una secuencia de variables aleatorias

{\ Displaystyle X_ {n} = n \ cdot \ mathbf {1} \ left \ {U \ in \ left [0, {\ tfrac {1} {n}} \ right] \ right \},}

con ${\ Displaystyle {\ mathbf {1}} \ {A \}}$ siendo la función indicadora del evento ${\ Displaystyle A}$ . Entonces, se sigue que ${\ Displaystyle X_ {n} \ to 0}$ (como). Pero, ${\ Displaystyle \ operatorname {E} [X_ {n}] = n \ cdot \ operatorname {P} \ left (U \ in \ left [0, {\ tfrac {1} {n}} \ right] \ right) = n \ cdot {\ tfrac {1} {n}} = 1}$ para cada ${\ Displaystyle n}$ . Por eso, ${\ Displaystyle \ lim _ {n \ to \ infty} \ operatorname {E} [X_ {n}] = 1 \ neq 0 = \ operatorname {E} \ left [\ lim _ {n \ to \ infty} X_ { n} \ derecha].}$

De manera análoga, para la secuencia general de variables aleatorias ${\ Displaystyle \ {Y_ {n}: n \ geq 0 \}}$ , el operador de valor esperado no es ${\ Displaystyle \ sigma}$ -aditivo, es decir

{\ Displaystyle \ operatorname {E} \ left [\ sum _ {n = 0} ^ {\ infty} Y_ {n} \ right] \ neq \ sum _ {n = 0} ^ {\ infty} \ operatorname {E } [Y_ {n}].}

Un ejemplo se obtiene fácilmente configurando ${\ Displaystyle Y_ {0} = X_ {1}}$ y ${\ Displaystyle Y_ {n} = X_ {n + 1} -X_ {n}}$ por ${\ Displaystyle n \ geq 1}$ , donde ${\ Displaystyle X_ {n}}$ es como en el ejemplo anterior.

Varios resultados de convergencia especifican condiciones exactas que permiten intercambiar límites y expectativas, como se especifica a continuación.

Teorema de la convergencia monótona : Sea ${\ Displaystyle \ {X_ {n}: n \ geq 0 \}}$ ser una secuencia de variables aleatorias, con ${\ Displaystyle 0 \ leq X_ {n} \ leq X_ {n + 1}}$ (como) para cada ${\ Displaystyle n \ geq 0}$ . Además, deja ${\ Displaystyle X_ {n} \ a X}$ puntual. Entonces, el teorema de la convergencia monótona establece que ${\ Displaystyle \ lim _ {n} \ operatorname {E} [X_ {n}] = \ operatorname {E} [X].}$

Usando el teorema de la convergencia monótona, se puede demostrar que la expectativa de hecho satisface la aditividad contable para las variables aleatorias no negativas. En particular, dejemos

{\ Displaystyle \ {X_ {i} \} _ {i = 0} ^ {\ infty}}

Ser variables aleatorias no negativas. Se deduce del teorema de la convergencia monótona que

{\ Displaystyle \ operatorname {E} \ left [\ sum _ {i = 0} ^ {\ infty} X_ {i} \ right] = \ sum _ {i = 0} ^ {\ infty} \ operatorname {E} [X_ {i}].}

Lema de Fatou : Let ${\ Displaystyle \ {X_ {n} \ geq 0: n \ geq 0 \}}$ ser una secuencia de variables aleatorias no negativas. El lema de Fatou dice que

{\ Displaystyle \ operatorname {E} [\ liminf _ {n} X_ {n}] \ leq \ liminf _ {n} \ operatorname {E} [X_ {n}].}

Corolario. Dejar

{\ Displaystyle X_ {n} \ geq 0}

con

{\ Displaystyle \ operatorname {E} [X_ {n}] \ leq C}

para todos

{\ Displaystyle n \ geq 0}

. Si

{\ Displaystyle X_ {n} \ a X}

(como entonces

{\ Displaystyle \ operatorname {E} [X] \ leq C.}

La prueba es observando que

{\ Displaystyle \ textstyle X = \ liminf _ {n} X_ {n}}

(as) y aplicando el lema de Fatou.

Teorema de convergencia dominado : Sea ${\ Displaystyle \ {X_ {n}: n \ geq 0 \}}$ ser una secuencia de variables aleatorias. Si ${\ Displaystyle X_ {n} \ a X}$ puntiagudo (como), ${\ Displaystyle | X_ {n} | \ leq Y \ leq + \ infty}$ (como y ${\ Displaystyle \ operatorname {E} [Y] <\ infty}$ . Entonces, de acuerdo con el teorema de convergencia dominado,
- ${\ Displaystyle \ operatorname {E} | X | \ leq \ operatorname {E} [Y] <\ infty}$ ;
- ${\ Displaystyle \ lim _ {n} \ operatorname {E} [X_ {n}] = \ operatorname {E} [X]}$
- ${\ Displaystyle \ lim _ {n} \ operatorname {E} | X_ {n} -X | = 0.}$
Integrabilidad uniforme : en algunos casos, la igualdad ${\ Displaystyle \ Displaystyle \ lim _ {n} \ operatorname {E} [X_ {n}] = \ operatorname {E} [\ lim _ {n} X_ {n}]}$ se mantiene cuando la secuencia ${\ Displaystyle \ {X_ {n} \}}$ es uniformemente integrable .

Desigualdades

Hay una serie de desigualdades que involucran los valores esperados de funciones de variables aleatorias. La siguiente lista incluye algunos de los más básicos.

Desigualdad de Markov : para una variable aleatoria no negativa ${\ Displaystyle X}$ y ${\ Displaystyle a> 0}$ , La desigualdad de Markov establece que

{\ Displaystyle \ operatorname {P} (X \ geq a) \ leq {\ frac {\ operatorname {E} [X]} {a}}.}

Desigualdad de Bienaymé-Chebyshev : Sea ${\ Displaystyle X}$ ser una variable aleatoria arbitraria con un valor esperado finito ${\ Displaystyle \ operatorname {E} [X]}$ y varianza finita ${\ Displaystyle \ operatorname {Var} [X] \ neq 0}$ . La desigualdad de Bienaymé-Chebyshev establece que, para cualquier número real ${\ Displaystyle k> 0}$ ,

{\ Displaystyle \ operatorname {P} {\ Bigl (} {\ Bigl |} X- \ operatorname {E} [X] {\ Bigr |} \ geq k {\ sqrt {\ operatorname {Var} [X]}} {\ Bigr)} \ leq {\ frac {1} {k ^ {2}}}.}

Desigualdad de Jensen : Sea ${\ Displaystyle f: {\ mathbb {R}} \ to {\ mathbb {R}}}$ ser una función convexa de Borel y ${\ Displaystyle X}$ una variable aleatoria tal que ${\ Displaystyle \ operatorname {E} | X | <\ infty}$ . Luego

{\ Displaystyle f (\ operatorname {E} (X)) \ leq \ operatorname {E} (f (X)).}

El lado derecho está bien definido incluso si

{\ Displaystyle X}

asume valores no finitos. De hecho, como se señaló anteriormente, la finitud de

{\ Displaystyle \ operatorname {E} | X |}

implica que

{\ Displaystyle X}

es finito como; por lo tanto

{\ Displaystyle f (X)}

Se define como.

Desigualdad de Lyapunov: ^[16] Sea ${\ Displaystyle 0 <s <t}$ . La desigualdad de Lyapunov establece que

{\ Displaystyle \ left (\ operatorname {E} | X | ^ {s} \ right) ^ {1 / s} \ leq \ left (\ operatorname {E} | X | ^ {t} \ right) ^ {1 / t}.}

Prueba. Aplicando la desigualdad de Jensen a

{\ Displaystyle | X | ^ {s}}

y

{\ Displaystyle g (x) = | x | ^ {t / s}}

, obtener

{\ Displaystyle {\ Bigl |} \ operatorname {E} | X ^ {s} | {\ Bigr |} ^ {t / s} \ leq \ operatorname {E} | X ^ {s} | ^ {t / s } = \ operatorname {E} | X | ^ {t}}

. Tomando el

{\ Displaystyle t ^ {th}}

la raíz de cada lado completa la prueba.

Desigualdad de Cauchy-Bunyakovsky-Schwarz : La desigualdad de Cauchy-Bunyakovsky-Schwarz establece que

{\ displaystyle (\ operatorname {E} [XY]) ^ {2} \ leq \ operatorname {E} [X ^ {2}] \ cdot \ operatorname {E} [Y ^ {2}].}

Desigualdad de Hölder : Sea ${\ Displaystyle p}$ y ${\ Displaystyle q}$ satisfacer ${\ Displaystyle 1 \ leq p \ leq \ infty}$ , ${\ Displaystyle 1 \ leq q \ leq \ infty}$ , y ${\ Displaystyle 1 / p + 1 / q = 1}$ . La desigualdad de Hölder establece que

{\ Displaystyle \ operatorname {E} | XY | \ leq (\ operatorname {E} | X | ^ {p}) ^ {1 / p} (\ operatorname {E} | Y | ^ {q}) ^ {1 / q}.}

Desigualdad de Minkowski : Sea ${\ Displaystyle p}$ ser un número real positivo satisfactorio ${\ Displaystyle 1 \ leq p \ leq \ infty}$ . Dejemos, además, ${\ Displaystyle \ operatorname {E} | X | ^ {p} <\ infty}$ y ${\ Displaystyle \ operatorname {E} | Y | ^ {p} <\ infty}$ . Entonces, de acuerdo con la desigualdad de Minkowski, ${\ Displaystyle \ operatorname {E} | X + Y | ^ {p} <\ infty}$ y

{\ Displaystyle {\ Bigl (} \ operatorname {E} | X + Y | ^ {p} {\ Bigr)} ^ {1 / p} \ leq {\ Bigl (} \ operatorname {E} | X | ^ { p} {\ Bigr)} ^ {1 / p} + {\ Bigl (} \ operatorname {E} | Y | ^ {p} {\ Bigr)} ^ {1 / p}.}

Valores esperados de distribuciones comunes

Distribución	Notación	Media E (X)
Bernoulli	${\ Displaystyle X \ sim ~ b (1, p)}$	${\ Displaystyle p}$
Binomio	${\ Displaystyle X \ sim B (n, p)}$	${\ displaystyle np}$
Poisson	${\ Displaystyle X \ sim Po (\ lambda)}$	${\ Displaystyle \ lambda}$
Geométrico	${\ Displaystyle X \ sim Geometric (p)}$	${\ Displaystyle 1 / p}$
Uniforme	${\ Displaystyle X \ sim U (a, b)}$	${\ Displaystyle (a + b) / 2}$
Exponencial	${\ Displaystyle X \ sim \ exp (\ lambda)}$	${\ Displaystyle 1 / \ lambda}$
Normal	${\ Displaystyle X \ sim N (\ mu, \ sigma ^ {2})}$	${\ Displaystyle \ mu}$
Estándar Normal	${\ Displaystyle X \ sim N (0,1)}$	${\ Displaystyle 0}$
Pareto	${\ Displaystyle X \ sim Par (\ alpha)}$	${\ Displaystyle \ alpha / (\ alpha +1)}$ Si ${\ Displaystyle \ alpha> 1}$
Cauchy	${\ Displaystyle X \ sim Cauchy (x_ {0}, \ gamma)}$	indefinido

Relación con la función característica

La función de densidad de probabilidad ${\ Displaystyle f_ {X}}$ de una variable aleatoria escalar ${\ Displaystyle X}$ está relacionado con su función característica ${\ Displaystyle \ varphi _ {X}}$ por la fórmula de inversión:

{\ Displaystyle f_ {X} (x) = {\ frac {1} {2 \ pi}} \ int _ {\ mathbb {R}} e ^ {- itx} \ varphi _ {X} (t) \, \ mathrm {d} t.}

Para el valor esperado de ${\ Displaystyle g (X)}$ (donde ${\ Displaystyle g: {\ mathbb {R}} \ to {\ mathbb {R}}}$ es una función de Borel ), podemos usar esta fórmula de inversión para obtener

{\ Displaystyle \ operatorname {E} [g (X)] = {\ frac {1} {2 \ pi}} \ int _ {\ mathbb {R}} g (x) \ left [\ int _ {\ mathbb {R}} e ^ {- itx} \ varphi _ {X} (t) \, \ mathrm {d} t \ right] \, \ mathrm {d} x.}

Si ${\ Displaystyle \ operatorname {E} [g (X)]}$ es finito, cambiando el orden de integración, obtenemos, de acuerdo con el teorema de Fubini-Tonelli ,

{\ Displaystyle \ operatorname {E} [g (X)] = {\ frac {1} {2 \ pi}} \ int _ {\ mathbb {R}} G (t) \ varphi _ {X} (t) \, \ mathrm {d} t,}

donde

{\ Displaystyle G (t) = \ int _ {\ mathbb {R}} g (x) e ^ {- itx} \, \ mathrm {d} x}

es la transformada de Fourier de ${\ Displaystyle g (x).}$ La expresión para ${\ Displaystyle \ operatorname {E} [g (X)]}$ también se sigue directamente del teorema de Plancherel .

Ver también

Centro de masa
Tendencia central
La desigualdad de Chebyshev (una desigualdad en la ubicación y los parámetros de escala)
Expectativa condicional
Expectativa (el término general)
Valor esperado (mecánica cuántica)
Ley de expectativa total de -el valor esperado del valor esperado condicional de X dado Y es el mismo que el valor esperado de X .
Momento (matemáticas)
Expectativa no lineal (una generalización del valor esperado)
Ecuación de Wald: una ecuación para calcular el valor esperado de un número aleatorio de variables aleatorias

Referencias

^ "Lista de símbolos de probabilidad y estadística" . Bóveda de matemáticas . 2020-04-26 . Consultado el 11 de septiembre de 2020 .
^ "Expectativa | Media | Promedio" . www.probabilitycourse.com . Consultado el 11 de septiembre de 2020 .
^ Hansen, Bruce. "PROBABILIDAD Y ESTADÍSTICAS PARA ECONOMISTAS" (PDF) . Consultado el 20 de julio de 2021 .
^ Wasserman, Larry. Toda la estadística: un curso conciso de inferencia estadística . Springer textos en estadística. pag. 47. ISBN 9781441923226.
^ a b c d Weisstein, Eric W. "Valor esperado" . mathworld.wolfram.com . Consultado el 11 de septiembre de 2020 .
^ a b "Valor esperado | Wiki brillante de matemáticas y ciencia" . shiny.org . Consultado el 21 de agosto de 2020 .
^ Historia de la probabilidad y la estadística y sus aplicaciones antes de 1750 . Serie de Wiley en Probabilidad y Estadística. 1990. doi : 10.1002 / 0471725161 . ISBN 9780471725169.
^ Mineral, Oystein (1960). "Ore, Pascal y la invención de la teoría de la probabilidad". The American Mathematical Monthly . 67 (5): 409–419. doi : 10.2307 / 2309286 . JSTOR 2309286 .
^ George Mackey (julio de 1980). "EL ANÁLISIS ARMÓNICO COMO EXPLOTACIÓN DE LA SIMETRÍA - UNA REVISIÓN HISTÓRICA". Boletín de la American Mathematical Society . Series nuevas. 3 (1): 549.
^ Huygens, cristiano. "El valor de las oportunidades en los juegos de la fortuna. Traducción al inglés" (PDF) .
^ Laplace, Pierre Simon, marqués de, 1749-1827. (1952) [1951]. Un ensayo filosófico sobre probabilidades . Publicaciones de Dover. OCLC 475539 . CS1 maint: multiple names: authors list (link)
^ Whitworth, WA (1901) Elección y oportunidad con mil ejercicios . Quinta edición. Deighton Bell, Cambridge. [Reimpreso por Hafner Publishing Co., Nueva York, 1959.]
^ "Los primeros usos de los símbolos en probabilidad y estadística" .
^ Richard W Hamming (1991). "Ejemplo 8.7-1 La distribución de Cauchy". El arte de la probabilidad para científicos e ingenieros . Addison-Wesley. pag. 290 y sigs . ISBN 0-201-40686-1. El muestreo de la distribución de Cauchy y el promedio no lo lleva a ninguna parte: ¡una muestra tiene la misma distribución que el promedio de 1000 muestras!
^ Papoulis, A. (1984), probabilidad, variables aleatorias y procesos estocásticos , Nueva York: McGraw-Hill, págs. 139-152
^ Agahi, Hamzeh; Mohammadpour, Adel; Mesiar, Radko (noviembre de 2015). "Generalizaciones de algunas desigualdades de probabilidad y convergencia $ L ^ {p} $ de variables aleatorias para cualquier medida monótona" . Revista Brasileña de Probabilidad y Estadística . 29 (4): 878–896. doi : 10.1214 / 14-BJPS251 . ISSN 0103-0752 .

Literatura

Edwards, AWF (2002). Triángulo aritmético de Pascal: la historia de una idea matemática (2ª ed.). Prensa JHU. ISBN 0-8018-6946-3.
Huygens, Christiaan (1657). De ratiociniis in ludo aleæ (traducción al inglés, publicada en 1714) .

[1] "Lista de símbolos de probabilidad y estadística" . Bóveda de matemáticas . 2020-04-26 . Consultado el 11 de septiembre de 2020 .

[2] "Expectativa | Media | Promedio" . www.probabilitycourse.com . Consultado el 11 de septiembre de 2020 .

[3] Hansen, Bruce. "PROBABILIDAD Y ESTADÍSTICAS PARA ECONOMISTAS" (PDF) . Consultado el 20 de julio de 2021 .

[4] Wasserman, Larry. Toda la estadística: un curso conciso de inferencia estadística . Springer textos en estadística. pag. 47. ISBN 9781441923226.

[:1-5] Weisstein, Eric W. "Valor esperado" . mathworld.wolfram.com . Consultado el 11 de septiembre de 2020 .

[:0-6] "Valor esperado | Wiki brillante de matemáticas y ciencia" . shiny.org . Consultado el 21 de agosto de 2020 .

[7] Historia de la probabilidad y la estadística y sus aplicaciones antes de 1750 . Serie de Wiley en Probabilidad y Estadística. 1990. doi : 10.1002 / 0471725161 . ISBN 9780471725169.

[8] Mineral, Oystein (1960). "Ore, Pascal y la invención de la teoría de la probabilidad". The American Mathematical Monthly . 67 (5): 409–419. doi : 10.2307 / 2309286 . JSTOR 2309286 .

[9] George Mackey (julio de 1980). "EL ANÁLISIS ARMÓNICO COMO EXPLOTACIÓN DE LA SIMETRÍA - UNA REVISIÓN HISTÓRICA". Boletín de la American Mathematical Society . Series nuevas. 3 (1): 549.

[10] Huygens, cristiano. "El valor de las oportunidades en los juegos de la fortuna. Traducción al inglés" (PDF) .

[11] Laplace, Pierre Simon, marqués de, 1749-1827. (1952) [1951]. Un ensayo filosófico sobre probabilidades . Publicaciones de Dover. OCLC 475539 . CS1 maint: multiple names: authors list (link)

[12] Whitworth, WA (1901) Elección y oportunidad con mil ejercicios . Quinta edición. Deighton Bell, Cambridge. [Reimpreso por Hafner Publishing Co., Nueva York, 1959.]

[13] "Los primeros usos de los símbolos en probabilidad y estadística" .

[Hamming2-14] Richard W Hamming (1991). "Ejemplo 8.7-1 La distribución de Cauchy". El arte de la probabilidad para científicos e ingenieros . Addison-Wesley. pag. 290 y sigs . ISBN 0-201-40686-1. El muestreo de la distribución de Cauchy y el promedio no lo lleva a ninguna parte: ¡una muestra tiene la misma distribución que el promedio de 1000 muestras!

[Pap84-15] Papoulis, A. (1984), probabilidad, variables aleatorias y procesos estocásticos , Nueva York: McGraw-Hill, págs. 139-152

[16] Agahi, Hamzeh; Mohammadpour, Adel; Mesiar, Radko (noviembre de 2015). "Generalizaciones de algunas desigualdades de probabilidad y convergencia $ L ^ {p} $ de variables aleatorias para cualquier medida monótona" . Revista Brasileña de Probabilidad y Estadística . 29 (4): 878–896. doi : 10.1214 / 14-BJPS251 . ISSN 0103-0752 .

vtmiTeoría de distribuciones de probabilidad
función de masa de probabilidad (pmf) función de densidad de probabilidad (pdf) función de distribución acumulativa (cdf) función cuantil
momento crudo momento central significar diferencia Desviación Estándar oblicuidad curtosis Momento L
función generadora de momento (mgf) función característica función generadora de probabilidad (pgf) acumulativo combinante

Control de autoridad
General	Archivo de autoridad integrado (Alemania)
Otro	Microsoft académico