En la teoría de la probabilidad , la expectativa condicional , el valor esperado condicional o la media condicional de una variable aleatoria es su valor esperado , el valor que tomaría "en promedio" sobre un número arbitrariamente grande de ocurrencias, dado que un cierto conjunto de "condiciones" se sabe que ocurre. Si la variable aleatoria puede tomar solo un número finito de valores, las "condiciones" son que la variable solo puede tomar un subconjunto de esos valores. Más formalmente, en el caso de que la variable aleatoria se defina sobre un espacio de probabilidad discreto , las "condiciones" son una partición de este espacio de probabilidad.
Dependiendo del contexto, la expectativa condicional puede ser una variable aleatoria o una función. La variable aleatoria se denotaanálogamente a la probabilidad condicional . La forma de la función se denota o un símbolo de función independiente como se introduce con el significado .
Ejemplos de
Ejemplo 1: Lanzamiento de dados
Considere la tirada de un dado justo y sea A = 1 si el número es par (es decir, 2, 4 o 6) y A = 0 en caso contrario. Además, sea B = 1 si el número es primo (es decir, 2, 3 o 5) y B = 0 en caso contrario.
1 | 2 | 3 | 4 | 5 | 6 | |
---|---|---|---|---|---|---|
A | 0 | 1 | 0 | 1 | 0 | 1 |
B | 0 | 1 | 1 | 0 | 1 | 0 |
La expectativa incondicional de A es , pero la expectativa de A condicional a B = 1 (es decir, condicional a que la tirada del dado sea 2, 3 o 5) es, y la expectativa de A condicional a B = 0 (es decir, condicional a que la tirada del dado sea 1, 4 o 6) es . Asimismo, la expectativa de B condicionada a A = 1 es, y la expectativa de B condicionada a A = 0 es .
Ejemplo 2: datos de precipitaciones
Suponga que tenemos datos de lluvia diaria (mm de lluvia por día) recopilados por una estación meteorológica todos los días del período de diez años (3652 días) desde el 1 de enero de 1990 al 31 de diciembre de 1999. La expectativa incondicional de lluvia para un día no especificado es el promedio de las cantidades de lluvia para esos 3652 días. La expectativa condicional de lluvia para un día no especificado que se sabe (condicional de ser) en el mes de marzo, es el promedio de lluvia diaria durante los 310 días del período de diez años que cae en marzo. Y la expectativa condicional de lluvia condicionada a los días con fecha 2 de marzo es el promedio de las cantidades de lluvia que ocurrieron en los diez días con esa fecha específica.
Historia
El concepto relacionado de probabilidad condicional se remonta al menos a Laplace , quien calculó distribuciones condicionales. Fue Andrey Kolmogorov quien, en 1933, lo formalizó utilizando el teorema Radon-Nikodym . [1] En las obras de Paul Halmos [2] y Joseph L. Doob [3] de 1953, la expectativa condicional se generalizó a su definición moderna utilizando sub-σ-álgebras . [4]
Definiciones
Acondicionamiento en un evento
Si A es un evento encon probabilidad distinta de cero, y X es una variable aleatoria discreta , la expectativa condicional de X dada A es
donde la suma se toma sobre todos los posibles resultados de X .
Tenga en cuenta que si , la expectativa condicional no está definida debido a la división por cero.
Variables aleatorias discretas
Si X e Y son variables aleatorias discretas , la expectativa condicional de X dada Y es
dónde es la función de masa de probabilidad conjunta de X y Y . La suma se toma sobre todos los posibles resultados de X .
Tenga en cuenta que el condicionamiento en una variable aleatoria discreta es lo mismo que el condicionamiento en el evento correspondiente:
donde A es el conjunto.
Variables aleatorias continuas
Dejar y Ser variables aleatorias continuas con densidad conjunta. densidad de y densidad condicional de dado el evento La expectativa condicional de dado es
Cuando el denominador es cero, la expresión no está definida.
Tenga en cuenta que condicionar sobre una variable aleatoria continua no es lo mismo que condicionar sobre el evento como fue en el caso discreto. Para una discusión, vea Condicionamiento de un evento de probabilidad cero . No respetar esta distinción puede llevar a conclusiones contradictorias, como lo ilustra la paradoja de Borel-Kolmogorov .
L 2 variables aleatorias
Se supone que todas las variables aleatorias en esta sección están en , que es cuadrado integrable . En su total generalidad, la expectativa condicional se desarrolla sin esta suposición, ver más adelante en Expectativa condicional con respecto a una sub-σ-álgebra . LaLa teoría, sin embargo, se considera más intuitiva [5] y admite generalizaciones importantes . En el contexto deVariables aleatorias, la expectativa condicional también se llama regresión .
En lo que sigue, dejemos ser un espacio de probabilidad, y en con media y varianza . La expectativaminimiza el error cuadrático medio :
- .
La expectativa condicional de X se define de manera análoga, excepto en lugar de un solo número, el resultado será una función . Dejarser un vector aleatorio también en. La expectativa condicional es una función medible tal que
- .
Tenga en cuenta que a diferencia de , la expectativa condicional generalmente no es único: puede haber múltiples minimizadores del error cuadrático medio.
Unicidad
Ejemplo 1 : Considere el caso en el que Y es la variable aleatoria constante que siempre es 1. Entonces, el error cuadrático medio se minimiza mediante cualquier función de la forma
Ejemplo 2 : considere el caso en el que Y es el vector aleatorio bidimensional. Entonces claramente
pero en términos de funciones se puede expresar como o o infinitas otras formas. En el contexto de la regresión lineal , esta falta de unicidad se llama multicolinealidad .
La expectativa condicional es única hasta un conjunto de medidas cero en . La medida utilizada es la medida pushforward inducida por Y .
En el primer ejemplo, la medida de avance es una distribución de Dirac en 1. En el segundo, se concentra en la "diagonal", de modo que cualquier conjunto que no lo cruce tenga medida 0.
Existencia
La existencia de un minimizador para no es trivial. Se puede demostrar que
es un subespacio cerrado del espacio de Hilbert . [6] Según el teorema de la proyección de Hilbert , la condición necesaria y suficiente para ser minimizador es que para todos en M tenemos
- .
En palabras, esta ecuación dice que el residuo es ortogonal al espacio M de todas las funciones de Y . Esta condición de ortogonalidad, aplicada a las funciones del indicador , se utiliza a continuación para extender la expectativa condicional al caso de que X e Y no estén necesariamente en.
Conexiones a la regresión
La expectativa condicional a menudo se aproxima en matemáticas aplicadas y estadística debido a las dificultades para calcularla analíticamente y para la interpolación. [7]
El subespacio de Hilbert
definido anteriormente se reemplaza con subconjuntos de los mismos al restringir la forma funcional de g , en lugar de permitir cualquier función medible. Ejemplos de esto son la regresión del árbol de decisión cuando se requiere que g sea una función simple , la regresión lineal cuando se requiere que g sea afín , etc.
Estas generalizaciones de la expectativa condicional se producen a costa de que muchas de sus propiedades ya no se mantengan. Por ejemplo, sea M el espacio de todas las funciones lineales de Y y sea denotar esta expectativa condicional generalizada /proyección. Sino contiene las funciones constantes , la propiedad de la torre no aguantará.
Un caso especial importante es cuando X e Y se distribuyen normalmente de forma conjunta. En este caso se puede demostrar que la expectativa condicional es equivalente a la regresión lineal:
para coeficientes descrito en Distribución normal multivariante # Distribuciones condicionales .
Expectativa condicional con respecto a una sub-σ-álgebra
Considera lo siguiente:
- es un espacio de probabilidad .
- es una variable aleatoria en ese espacio de probabilidad con expectativa finita.
- es una sub -σ-álgebra de.
Desde es un sub -álgebra de , la función por lo general no es -medible, de ahí la existencia de las integrales de la forma , dónde y es la restricción de a , no se puede establecer en general. Sin embargo, los promedios locales se puede recuperar en con la ayuda de la expectativa condicional. Una expectativa condicional de X dada, denotado como , es cualquier - función medible que satisface:
para cada . [8]
Como se señaló en el discusión, esta es una condición equivalente a decir que el residuo ser ortogonal a las funciones del indicador :
Existencia
La existencia de puede establecerse observando que por es una medida finita en que es absolutamente continuo con respecto a. Sies la inyección natural de a , luego es la restricción de a y es la restricción de a . Además, es absolutamente continuo con respecto a , porque la condición
implica
Por lo tanto, tenemos
donde las derivadas son derivadas de medidas Radon-Nikodym .
Expectativa condicional con respecto a una variable aleatoria
Considere, además de lo anterior,
- Un espacio medible , y
- Una variable aleatoria .
La expectativa condicional de X dada Y se define aplicando la construcción anterior en el σ-álgebra generada por Y :
- .
Según el lema de Doob-Dynkin , existe una función tal que
- .
Discusión
- Ésta no es una definición constructiva; simplemente se nos da la propiedad requerida que debe satisfacer una expectativa condicional.
- La definición de puede parecerse al de para un evento pero estos son objetos muy diferentes. El primero es un-función medible , mientras que este último es un elemento de y por .
- Se puede demostrar que la unicidad es casi segura : es decir, las versiones de la misma expectativa condicional solo diferirán en un conjunto de probabilidad cero .
- El σ-álgebra controla la "granularidad" del acondicionamiento. Una expectativa condicional sobre una σ-álgebra más fina (más grande) retiene información sobre las probabilidades de una clase más amplia de eventos. Una expectativa condicional sobre un σ-álgebra más grueso (más pequeño) promedia sobre más eventos.
La probabilidad condicional
Para un subconjunto B de Borel en, se puede considerar la colección de variables aleatorias
- .
Se puede demostrar que forman un núcleo de Markov , es decir, para casi todos, es una medida de probabilidad. [9]
La Ley del estadístico inconsciente es entonces
- .
Esto muestra que las expectativas condicionales son, como sus contrapartes incondicionales, integraciones, frente a una medida condicional.
Propiedades básicas
Todas las fórmulas siguientes deben entenderse en un sentido casi seguro. El σ-álgebra podría ser reemplazado por una variable aleatoria , es decir .
- Sacando factores independientes:
- Si es independiente de, luego .
Dejar . Luego es independiente de , entonces lo conseguimos
Por lo tanto, la definición de expectativa condicional se satisface mediante la variable aleatoria constante , como se desee.
- Si es independiente de , luego . Tenga en cuenta que este no es necesariamente el caso si es solo independiente de y de .
- Si son independientes, son independientes, es independiente de y es independiente de , luego .
- Estabilidad:
- Si es -medible, entonces .
- Si Z es una variable aleatoria, entonces. En su forma más simple, esto dice.
- Sacando factores conocidos:
- Si es -medible, entonces .
- Si Z es una variable aleatoria, entonces.
- Ley de la expectativa total :. [10]
- Propiedad de la torre:
- Para sub-σ-álgebras tenemos , por 'estabilidad' arriba.
- Un caso especial es cuando Z es un-Variable aleatoria medible. Luego y por lo tanto .
- Propiedad Doob martingala : lo anterior con (cual es -medible), y usando también , da .
- Para variables aleatorias tenemos .
- Para variables aleatorias tenemos .
- Para sub-σ-álgebras tenemos , por 'estabilidad' arriba.
- Linealidad: tenemos y por .
- Positividad: Si luego .
- Monotonicidad: Si luego .
- Convergencia monótona : si luego .
- Convergencia dominada : si y con , luego .
- Lema de Fatou : Si luego .
- Desigualdad de Jensen : Sies una función convexa , entonces.
- Varianza condicional : Usando la expectativa condicional podemos definir, por analogía con la definición de la varianza como la desviación cuadrática media del promedio, la varianza condicional
- Definición:
- Fórmula algebraica para la varianza:
- Ley de varianza total :.
- Convergencia martingala : para una variable aleatoria, que tiene una expectativa finita, tenemos , si alguno es una serie creciente de sub-σ-álgebras y o si es una serie decreciente de sub-σ-álgebras y .
- Expectativa condicional como -proyección: Si están en el espacio de Hilbert de variables aleatorias reales integrables al cuadrado (variables aleatorias reales con segundo momento finito) entonces
- por -mensurable , tenemos , es decir, la expectativa condicional es en el sentido del producto escalar L 2 ( P ) la proyección ortogonal deal subespacio lineal de-Funciones medibles. (Esto permite definir y probar la existencia de la expectativa condicional basada en el teorema de la proyección de Hilbert ).
- el mapeo es autoadjunto :
- El condicionamiento es una proyección contractiva de L p espacios. Es decir,para cualquier p ≥ 1.
- Propiedad de independencia condicional de Doob: [11] Sison condicionalmente independientes dado, luego (equivalentemente, ).
Ver también
- Acondicionamiento (probabilidad)
- Teorema de desintegración
- Lema de Doob-Dynkin
- Lema de factorización
- Distribución de probabilidad conjunta
- Expectativa condicional no conmutativa
Leyes de probabilidad
- Ley de la acumulación total (generaliza los otros tres)
- Ley de la expectativa total
- Ley de probabilidad total
- Ley de la varianza total
Notas
- ^ Kolmogorov, Andrey (1933). Grundbegriffe der Wahrscheinlichkeitsrechnung (en alemán). Berlín: Julius Springer. pag. 46.
- Traducción: Kolmogorov, Andrey (1956). Fundamentos de la teoría de la probabilidad (2ª ed.). Nueva York: Chelsea. pag. 53. ISBN 0-8284-0023-7. Archivado desde el original el 14 de septiembre de 2018 . Consultado el 14 de marzo de 2009 .
- ^ Oxtoby, JC (1953). "Revisión: teoría de la medida , por PR Halmos" (PDF) . Toro. Amer. Matemáticas. Soc . 59 (1): 89–91. doi : 10.1090 / s0002-9904-1953-09662-8 .
- ^ JL Doob (1953). Procesos estocásticos . John Wiley e hijos . ISBN 0-471-52369-0.
- ^ Olav Kallenberg: Fundamentos de la probabilidad moderna. 2. edición. Springer, Nueva York 2002, ISBN 0-387-95313-2 , pág. 573.
- ^ "probabilidad - intuición detrás de la expectativa condicional" . Intercambio de pila de matemáticas .
- ^ Brockwell, Peter J. (1991). Series temporales: teoría y métodos (2ª ed.). Nueva York: Springer-Verlag. ISBN 978-1-4419-0320-4.
- ^ Hastie, Trevor. Los elementos del aprendizaje estadístico: minería de datos, inferencia y predicción (PDF) (Segunda edición, séptima edición corregida). Nueva York. ISBN 978-0-387-84858-7.
- ^ Billingsley, Patrick (1995). "Artículo 34. Expectativa condicional". Probabilidad y medida (3ª ed.). John Wiley e hijos. pag. 445. ISBN 0-471-00710-2.
- ^ Klenke, Achim. Teoría de la probabilidad: un curso integral (Segunda ed.). Londres. ISBN 978-1-4471-5361-0.
- ^ "Expectativa condicional" . www.statlect.com . Consultado el 11 de septiembre de 2020 .
- ^ Kallenberg, Olav (2001). Fundamentos de la probabilidad moderna (2ª ed.). York, Pensilvania, EE.UU .: Springer. pag. 110. ISBN 0-387-95313-2.
Referencias
- William Feller , Introducción a la teoría de la probabilidad y sus aplicaciones , vol 1, 1950, página 223
- Paul A. Meyer, Probabilidad y potenciales , Blaisdell Publishing Co., 1966, página 28
- Grimmett, Geoffrey ; Stirzaker, David (2001). Probabilidad y procesos aleatorios (3ª ed.). Prensa de la Universidad de Oxford. ISBN 0-19-857222-0., páginas 67–69
enlaces externos
- Ushakov, NG (2001) [1994], "Expectativa matemática condicional" , Enciclopedia de matemáticas , EMS Press