En la teoría de la probabilidad , un espacio de probabilidad estándar , también llamado espacio de probabilidad de Lebesgue-Rokhlin o simplemente espacio de Lebesgue (el último término es ambiguo) es un espacio de probabilidad que satisface ciertos supuestos introducidos por Vladimir Rokhlin en 1940. Informalmente, es un espacio de probabilidad que consta de un intervalo y / o un número finito o contable de átomos .
La teoría de los espacios de probabilidad estándar fue iniciada por von Neumann en 1932 y moldeada por Vladimir Rokhlin en 1940. Rokhlin demostró que el intervalo unitario dotado de la medida de Lebesgue tiene importantes ventajas sobre los espacios de probabilidad generales, pero puede ser sustituido efectivamente por muchos de estos en teoría de probabilidad. La dimensión del intervalo unitario no es un obstáculo, como ya lo tenía claro Norbert Wiener . Construyó el proceso de Wiener (también llamado movimiento browniano ) en forma de un mapa medible desde el intervalo unitario hasta el espacio de funciones continuas .
Historia corta
La teoría de los espacios de probabilidad estándar fue iniciada por von Neumann en 1932 [1] y moldeada por Vladimir Rokhlin en 1940. [2] Para presentaciones modernizadas, ver ( Haezendonck 1973 ), ( de la Rue 1993 ), ( Itô 1984 , Sect. 2.4 ) y ( Rudolf 1990 , Capítulo 2) .
En la actualidad, los espacios de probabilidad estándar pueden tratarse (y a menudo se tratan) en el marco de la teoría descriptiva de conjuntos , a través de espacios de Borel estándar , véase, por ejemplo ( Kechris 1995 , Sect. 17). Este enfoque se basa en el teorema del isomorfismo para espacios de Borel estándar ( Kechris 1995 , Teorema (15.6)). Un enfoque alternativo de Rokhlin, basado en la teoría de la medida , ignora los conjuntos nulos , en contraste con la teoría descriptiva de conjuntos. Los espacios de probabilidad estándar se utilizan de forma rutinaria en la teoría ergódica , [3] [4]
Definición
Una de varias definiciones equivalentes bien conocidas de la estandarización se da a continuación, después de algunas preparaciones. Se supone que todos los espacios de probabilidad están completos .
Isomorfismo
Un isomorfismo entre dos espacios de probabilidad, es un mapa invertible tal que y ambos son mapas (medibles y) de preservación de medidas .
Dos espacios de probabilidad son isomorfos, si existe un isomorfismo entre ellos.
Isomorfismo módulo cero
Dos espacios de probabilidad , son isomorfos , si existen conjuntos nulos , tal que los espacios de probabilidad , son isomorfos (dotados naturalmente de campos sigma y medidas de probabilidad).
Espacio de probabilidad estándar
Un espacio de probabilidad es estándar , si es isomorfo a un intervalo con medida de Lebesgue, un conjunto finito o contable de átomos, o una combinación (unión disjunta) de ambos.
Ver ( Rokhlin 1952 , Sect. 2.4 (p. 20)), ( Haezendonck 1973 , Proposition 6 (p. 249) y Observación 2 (p. 250)) y ( de la Rue 1993 , Theorem 4-3). Ver también ( Kechris 1995 , Sect. 17.F), y ( Itô 1984 , especialmente Sect. 2.4 y Ejercicio 3.1 (v)). En ( Petersen 1983 , Definición 4.5 en la página 16) la medida se supone finita, no necesariamente probabilística. En ( Sinai 1994 , Definición 1 en la página 16) los átomos no están permitidos.
Ejemplos de espacios de probabilidad no estándar
Un ruido blanco ingenuo
El espacio de todas las funciones puede ser considerado como el producto de un continuo de copias de la línea real . Uno puede dotarcon una medida de probabilidad, digamos, la distribución normal estándar y tratar el espacio de funciones como el producto de un continuo de espacios de probabilidad idénticos . La medida del producto es una medida de probabilidad en . Muchos no expertos se inclinan a creer quedescribe el llamado ruido blanco .
Sin embargo, no es así. Para el ruido blanco, su integral de 0 a 1 debe ser una variable aleatoria distribuida N (0, 1). Por el contrario, la integral (de 0 a 1) dees indefinido. Peor aún, ƒ no es casi seguro que se pueda medir. Peor aún, la probabilidad de que f sea medible no está definida. Y lo peor: si X es una variable aleatoria distribuida (digamos) uniformemente en (0, 1) e independiente de ƒ , ¡entonces ƒ ( X ) no es una variable aleatoria en absoluto! (Carece de mensurabilidad).
Un intervalo perforado
Dejar ser un conjunto cuya medida de Lebesgue interna es igual a 0, pero la medida de Lebesgue externa es igual a 1 (por lo tanto,es inconmensurable al extremo). Existe una medida de probabilidad en tal que por cada Lebesgue medible . (Aquí es la medida de Lebesgue.) Eventos y variables aleatorias en el espacio de probabilidad (tratado ) están en una correspondencia uno a uno natural con eventos y variables aleatorias en el espacio de probabilidad . Muchos no expertos se inclinan a concluir que el espacio de probabilidad es tan bueno como .
Sin embargo, no lo es. Una variable aleatoria definido por se distribuye uniformemente en . La medida condicional, dada, es solo un átomo (en ), siempre que es el espacio de probabilidad subyacente. Sin embargo, si se utiliza en su lugar, la medida condicional no existe cuando .
Un círculo perforado se construye de manera similar. Sus eventos y variables aleatorias son los mismos que en el círculo habitual. El grupo de rotaciones actúa sobre ellos de forma natural. Sin embargo, no actúa sobre el círculo perforado.
Véase también ( Rudolph 1990 , página 17).
Un conjunto medible superfluo
Dejar sea como en el ejemplo anterior. Conjuntos de la forma dónde y son conjuntos mensurables de Lebesgue arbitrarios, son un σ-álgebra contiene el σ-álgebra de Lebesgue y La formula
da la forma general de una medida de probabilidad en que amplía la medida de Lebesgue; aquíes un parámetro. Para ser específicos, elegimos Muchos no expertos se inclinan a creer que tal extensión de la medida de Lebesgue es al menos inofensiva.
Sin embargo, es el intervalo perforado disfrazado. El mapa
es un isomorfismo entre y el intervalo perforado correspondiente al conjunto
otro conjunto de medida interior de Lebesgue 0 pero exterior medida de Lebesgue 1.
Véase también ( Rudolph 1990 , Ejercicio 2.11 en la página 18).
Un criterio de estandarización
Estandaridad de un espacio de probabilidad dado es equivalente a cierta propiedad de un mapa medible de a un espacio medible La respuesta (estándar o no) no depende de la elección de y . Este hecho es bastante útil; uno puede adaptar la elección de y a lo dado No es necesario examinar todos los casos. Puede ser conveniente examinar una variable aleatoria un vector aleatorio una secuencia aleatoria o una secuencia de eventos tratada como una secuencia de variables aleatorias de dos valores,
Se impondrán dos condiciones a (ser inyectivo y generador). A continuación se supone que tales dado. La cuestión de su existencia se abordará posteriormente.
El espacio de probabilidad se supone que está completo (de lo contrario, no puede ser estándar).
Una sola variable aleatoria
Una función medible induce una medida de avance , - la medida de probabilidad en definido por
- para conjuntos Borel
es decir, la distribución de la variable aleatoria. La imagen es siempre un conjunto de medidas exteriores completas,
pero su medida interna puede diferir (ver un intervalo perforado ). En otras palabras,no necesita ser un conjunto de medidas completas
Una función medible se llama generar sies la finalización con respecto a de la σ-álgebra de imágenes inversas dónde recorre todos los conjuntos de Borel.
Precaución. La siguiente condición no es suficiente para estar generando: para cada existe un conjunto de Borel tal que (significa diferencia simétrica ).
Teorema. Sea una función medible sea inyectable y generador, entonces las siguientes dos condiciones son equivalentes:
- (es decir, la medida interior también tiene medida completa, y la imagen es medible con respecto a la terminación);
- es un espacio de probabilidad estándar.
Véase también ( Itô 1984 , Sect. 3.1).
Un vector aleatorio
El mismo teorema es válido para cualquier (en lugar de ). Una función medible puede pensarse como una secuencia finita de variables aleatorias y está generando si y solo si es la finalización de la σ-álgebra generada por
Una secuencia aleatoria
El teorema sigue siendo válido para el espacio de secuencias infinitas. Una función medible puede pensarse como una secuencia infinita de variables aleatorias y está generando si y solo si es la finalización de la σ-álgebra generada por
Una secuencia de eventos
En particular, si las variables aleatorias asumimos solo dos valores 0 y 1, nos ocupamos de una función medible y una secuencia de conjuntos La función está generando si y solo si es la finalización de la σ-álgebra generada por
En las secuencias del trabajo pionero ( Rokhlin 1952 ) que corresponden a inyectables, generando se llaman bases del espacio de probabilidad(ver Rokhlin 1952 , secc. 2.1). Una base se llama mod 0 completo, si es de plena medida ver ( Rokhlin 1952 , secc. 2.2). En la misma sección, Rokhlin demostró que si un espacio de probabilidad es completo mod 0 con respecto a alguna base, entonces es completo mod 0 con respecto a cualquier otra base, y define los espacios de Lebesgue por esta propiedad de completitud. Ver también ( Haezendonck 1973 , Prop. 4 y Def. 7) y ( Rudolph 1990 , Sect. 2.3, especialmente el Teorema 2.2).
Observaciones adicionales
Los cuatro casos tratados anteriormente son mutuamente equivalentes y pueden unirse, ya que los espacios medibles y son mutuamente isomorfos; todos son espacios medibles estándar (en otras palabras, espacios Borel estándar).
Existencia de una función inyectable mensurable de a un espacio medible estándar no depende de la elección de Tomando obtenemos la propiedad bien conocida como separada contablemente (pero llamada separable en Itô 1984 ).
Existencia de una función generadora medible a partir de a un espacio medible estándar tampoco depende de la elección de Tomando obtenemos la propiedad bien conocida como generada contablemente (mod 0), ver ( Durrett 1996 , Ejerc. I.5).
Espacio de probabilidad | Contablemente separados | Generado contablemente | Estándar |
---|---|---|---|
Intervalo con medida de Lebesgue | sí | sí | sí |
Ruido blanco ingenuo | No | No | No |
Intervalo perforado | sí | sí | No |
Cada función inyectable mensurable desde un espacio de probabilidad estándar a un espacio estándar mensurable está generando. Ver ( Rokhlin 1952 , Sect. 2.5), ( Haezendonck 1973 , Corolario 2 en la página 253), ( de la Rue 1993 , Teoremas 3-4 y 3-5). Esta propiedad no es válida para el espacio de probabilidad no estándar tratado en la subsección "Un conjunto medible superfluo" anterior.
Precaución. La propiedad de ser generado contablemente es invariante bajo isomorfismos mod 0, pero la propiedad de estar separado contablemente no lo es. De hecho, un espacio de probabilidad estándarse separa contablemente si y solo si la cardinalidad deno excede el continuo (ver Itô 1984 , Ejercicio 3.1 (v)). Un espacio de probabilidad estándar puede contener un conjunto nulo de cualquier cardinalidad, por lo tanto, no es necesario que se separe contablemente. Sin embargo, siempre contiene un subconjunto numerable separado de compás completo.
Definiciones equivalentes
Dejar ser un espacio de probabilidad completo tal que la cardinalidad de no excede el continuo (el caso general se reduce a este caso especial, consulte la advertencia anterior).
A través de la mensurabilidad absoluta
Definición. es estándar si se separa de forma contable, se genera de forma contable y es absolutamente mensurable.
Ver ( Rokhlin 1952 , el final de la Sección 2.3) y ( Haezendonck 1973 , Observación 2 en la página 248). "Absolutamente mensurable" significa: mensurable en cada espacio de probabilidad generado numerablemente separado que lo contiene.
A través de la perfección
Definición. es estándar si está contablemente separado y es perfecto.
Ver ( Itô 1984 , secc. 3.1). "Perfecto" significa que para cada función medible de a la medida de la imagen es regular . (Aquí la medida de la imagen se define en todos los conjuntos cuyas imágenes inversas pertenecen a, independientemente de la estructura Borel de ).
Vía topología
Definición. es estándar si existe una topología en tal que
- el espacio topológico es metrizable ;
- es la finalización de la σ-álgebra generada por (es decir, por todos los conjuntos abiertos);
- para cada existe un conjunto compacto en tal que
Ver ( de la Rue 1993 , secc. 1).
Verificando la estandarización
Cada distribución de probabilidad en el espacio lo convierte en un espacio de probabilidad estándar. (Aquí, una distribución de probabilidad significa una medida de probabilidad definida inicialmente en el álgebra-sigma de Borel y completada).
Lo mismo se aplica a todos los espacios polacos , ver ( Rokhlin 1952 , Sect. 2.7 (p. 24)), ( Haezendonck 1973 , Example 1 (p. 248)), ( de la Rue 1993 , Theorem 2-3) y ( Itô 1984 , Teorema 2.4.1).
Por ejemplo, la medida de Wiener convierte el espacio polaco (de todas las funciones continuas dotado de la topología de convergencia uniforme local ) en un espacio de probabilidad estándar.
Otro ejemplo: para cada secuencia de variables aleatorias, su distribución conjunta convierte el espacio polaco (de secuencias; dotado de la topología del producto ) en un espacio de probabilidad estándar.
(Por lo tanto, la idea de dimensión , muy natural para los espacios topológicos , es totalmente inapropiada para los espacios de probabilidad estándar).
El producto de dos espacios de probabilidad estándar es un espacio de probabilidad estándar.
Lo mismo vale para el producto de innumerables espacios, ver ( Rokhlin 1952 , Sect. 3.4), ( Haezendonck 1973 , Proposition 12) y ( Itô 1984 , Theorem 2.4.3).
Un subconjunto medible de un espacio de probabilidad estándar es un espacio de probabilidad estándar. Se supone que el conjunto no es un conjunto nulo y está dotado de la medida condicional. Ver ( Rokhlin 1952 , Sect. 2.3 (p. 14)) y ( Haezendonck 1973 , Proposition 5).
Cada medida de probabilidad en un espacio Borel estándar lo convierte en un espacio de probabilidad estándar.
Usando la estandarización
Probabilidades condicionales regulares
En la configuración discreta, la probabilidad condicional es otra medida de probabilidad, y la expectativa condicional puede tratarse como la expectativa (habitual) con respecto a la medida condicional, ver expectativa condicional . En la configuración no discreta, el condicionamiento a menudo se trata de manera indirecta, ya que la condición puede tener una probabilidad 0, ver expectativa condicional . Como resultado, una serie de hechos bien conocidos tienen contrapartes "condicionales" especiales. Por ejemplo: linealidad de la expectativa; La desigualdad de Jensen (ver expectativa condicional ); La desigualdad de Hölder ; el teorema de la convergencia monótona , etc.
Dada una variable aleatoria en un espacio de probabilidad , es natural intentar construir una medida condicional , es decir, la distribución condicional de dado . En general, esto es imposible (ver Durrett 1996 , Sect. 4.1 (c)). Sin embargo, para un espacio de probabilidad estándaresto es posible, y bien conocido como sistema canónico de medidas (ver Rokhlin 1952 , Sección 3.1), que es básicamente lo mismo que las medidas de probabilidad condicional (ver Itô 1984 , Sección 3.5), desintegración de medida (ver Kechris 1995 , Ejercicio (17.35)) y probabilidades condicionales regulares (ver Durrett 1996 , Sect. 4.1 (c)).
La desigualdad condicional de Jensen es solo la (habitual) desigualdad de Jensen aplicada a la medida condicional. Lo mismo vale para muchos otros hechos.
Medir conservando transformaciones
Dados dos espacios de probabilidad , y un mapa de preservación de medidas , la imagen no es necesario cubrir todo , puede perder un conjunto nulo. Puede parecer quetiene que ser igual a 1, pero no es así. La medida exterior dees igual a 1, pero la medida interna puede diferir. Sin embargo, si los espacios de probabilidad, son estándar entonces, ver ( de la Rue 1993 , Teorema 3-2). Si también es uno a uno, entonces cada satisface , . Por lo tanto,es medible (y preserva la medida). Ver ( Rokhlin 1952 , Sect. 2.5 (p. 20)) y ( de la Rue 1993 , Theorem 3-5). Véase también ( Haezendonck 1973 , Proposición 9 (y Observación posterior)).
"Hay una forma coherente de ignorar los conjuntos de medida 0 en un espacio de medida" ( Petersen 1983 , página 15). Al esforzarse por deshacerse de los conjuntos nulos, los matemáticos suelen utilizar clases de equivalencia de conjuntos o funciones medibles. Las clases de equivalencia de subconjuntos medibles de un espacio de probabilidad forman un álgebra booleana normalizada completa llamada álgebra de medidas (o estructura métrica). Cada medida preservando el mapa conduce a un homomorfismo de álgebras de medida; básicamente, por .
Puede parecer que todo homomorfismo de álgebras de medida tiene que corresponder a algún mapa de preservación de medida, pero no es así. Sin embargo, para los espacios de probabilidad estándar cada corresponde a algunos . Ver ( Rokhlin 1952 , Sect. 2.6 (p. 23) y 3.2), ( Kechris 1995 , Sect. 17.F), ( Petersen 1983 , Theorem 4.7 en la página 17).
Ver también
* (2001) [1994], "Espacio de probabilidad estándar" , Encyclopedia of Mathematics , EMS PressCS1 maint: nombres numéricos: lista de autores ( enlace )
Notas
- ↑ ( von Neumann 1932 ) y ( Halmos & von Neumann 1942 ) se citan en ( Rokhlin 1952 , página 2) y ( Petersen 1983 , página 17).
- ↑ Publicado brevemente en 1947, en detalle en 1949 en ruso y en 1952 ( Rokhlin 1952 ) en inglés. En ( Rokhlin 1952 , página 2)se menciona un texto inédito de 1940. "La teoría de los espacios de Lebesgue en su forma actual fue construida por VA Rokhlin" ( Sinai 1994 , página 16).
- ^ "En este libro nos ocuparemos exclusivamente de los espacios de Lebesgue" ( Petersen 1983 , página 17).
- ^ "Teoría ergódica de los espacios de Lebesgue" es el subtítulo del libro ( Rudolph 1990 ).
Referencias
- Rokhlin, VA (1952), Sobre las ideas fundamentales de la teoría de la medida (PDF) , Traducciones, 71 , American Mathematical Society, págs. 1-54. Traducido del ruso: Рохлин, В. А. (1949), "Об основных понятиях теории меры", Математический Сборник (Новая Серия) , 25 (67): 107–150.
- von Neumann, J. (1932), "Einige Sätze über messbare Abbildungen", Annals of Mathematics , Second Series, 33 : 574–586, doi : 10.2307 / 1968536.
- Halmos, PR ; von Neumann, J. (1942), "Métodos de operador en mecánica clásica, II", Annals of Mathematics , Second Series, Annals of Mathematics, 43 (2): 332–350, doi : 10.2307 / 1968872 , JSTOR 1968872.
- Haezendonck, J. (1973), "Espacios abstractos de Lebesgue-Rohlin", Bulletin de la Société Mathématique de Belgique , 25 : 243-258.
- de la Rue, T. (1993), "Espaces de Lebesgue", Séminaire de Probabilités XXVII , Lecture Notes in Mathematics, 1557 , Springer, Berlín, págs. 15-21.
- Petersen, K. (1983), Teoría ergódica , Cambridge Univ. prensa.
- Itô, K. (1984), Introducción a la teoría de la probabilidad , Cambridge Univ. prensa.
- Rudolph, DJ (1990), Fundamentos de la dinámica mensurable: teoría ergódica de los espacios de Lebesgue , Oxford: Clarendon Press.
- Sinaí, Ya. G. (1994), Temas de teoría ergódica , Princeton Univ. prensa.
- Kechris, AS (1995), Teoría de conjuntos descriptiva clásica , Springer.
- Durrett, R. (1996), Probabilidad: teoría y ejemplos (Segunda ed.).
- Wiener, N. (1958), Problemas no lineales en teoría aleatoria , MIT Press.
.