En teoría de probabilidad y estadística , la función de distribución acumulativa ( CDF ) de una variable aleatoria de valor real , o simplemente función de distribución de, evaluado en , es la probabilidad de que tomará un valor menor o igual a . [1]
Cada distribución de probabilidad apoyada en los números reales, discreta o "mixta" así como continua, se identifica de forma única por una función de distribución acumulativa creciente continua hacia arriba [2] monótona satisfactorio y .
En el caso de una distribución continua escalar , da el área bajo la función de densidad de probabilidad de menos infinito a. Las funciones de distribución acumulativa también se utilizan para especificar la distribución de variables aleatorias multivariadas .
Definición
La función de distribución acumulativa de una variable aleatoria de valor real es la función dada por [3] : p. 77
| ( Ecuación 1 ) |
donde el lado derecho representa la probabilidad de que la variable aleatoria toma un valor menor o igual a . La probabilidad de quese encuentra en el intervalo semicerrado , dónde , es por tanto [3] : p. 84
| ( Ecuación 2 ) |
En la definición anterior, el signo "menor o igual a", "≤", es una convención, no una de uso universal (por ejemplo, la literatura húngara usa "<"), pero la distinción es importante para distribuciones discretas. El uso adecuado de las tablas de las distribuciones binomial y de Poisson depende de esta convención. Además, fórmulas importantes como la fórmula de inversión de Paul Lévy para la función característica también se basan en la formulación "menor o igual que".
Si se tratan varias variables aleatorias etc., las letras correspondientes se usan como subíndices, mientras que, si se trata solo una, generalmente se omite el subíndice. Es convencional utilizar mayúsculas para una función de distribución acumulativa, en contraste con la minúscula utilizado para funciones de densidad de probabilidad y funciones de masa de probabilidad . Esto se aplica cuando se habla de distribuciones generales: algunas distribuciones específicas tienen su propia notación convencional, por ejemplo, la distribución normal usa y en vez de y , respectivamente.
La función de densidad de probabilidad de una variable aleatoria continua se puede determinar a partir de la función de distribución acumulativa diferenciando [4] utilizando el Teorema fundamental del cálculo ; es decir, dado,
siempre que exista la derivada.
El CDF de una variable aleatoria continua se puede expresar como la integral de su función de densidad de probabilidad como sigue: [3] : pág. 86
En el caso de una variable aleatoria que tiene una distribución que tiene un componente discreto a un valor ,
Si es continuo en , esto es igual a cero y no hay ningún componente discreto en .
Propiedades
Cada función de distribución acumulativa no es decreciente [3] : pág. 78 y continuo a la derecha , [3] : pág. 79 lo que lo convierte en una función càdlàg . Además,
Cada función con estas cuatro propiedades es un CDF, es decir, para cada función de este tipo, se puede definir una variable aleatoria de modo que la función sea la función de distribución acumulativa de esa variable aleatoria.
Si es una variable aleatoria puramente discreta , entonces alcanza valores con probabilidad , y el CDF de será discontinuo en los puntos:
Si la CDF de una variable aleatoria de valor real es continuo , entonceses una variable aleatoria continua ; si ademases absolutamente continua , entonces existe una función integrable de Lebesgue tal que
para todos los números reales y . La funciónes igual a la derivada de casi en todas partes , y se denomina función de densidad de probabilidad de la distribución de.
Ejemplos de
Como ejemplo, suponga se distribuye uniformemente en el intervalo unitario.
Entonces el CDF de es dado por
Supongamos en cambio que toma solo los valores discretos 0 y 1, con igual probabilidad.
Entonces el CDF de es dado por
Suponer se distribuye exponencialmente . Entonces el CDF de es dado por
Aquí λ> 0 es el parámetro de la distribución, a menudo llamado parámetro de tasa.
Suponer se distribuye normalmente . Entonces el CDF de es dado por
Aquí el parámetro es la media o expectativa de la distribución; y es su desviación estándar.
Suponer es binomial distribuido . Entonces el CDF de es dado por
Aquí es la probabilidad de éxito y la función denota la distribución de probabilidad discreta del número de éxitos en una secuencia de experimentos independientes, y es el "piso" debajo , es decir, el mayor número entero menor o igual que.
Funciones derivadas
Función de distribución acumulativa complementaria (distribución de cola)
A veces, es útil estudiar la pregunta opuesta y preguntar con qué frecuencia la variable aleatoria está por encima de un nivel en particular. Esto se denomina función de distribución acumulativa complementaria ( ccdf ) o simplemente distribución de cola o excedencia , y se define como
Esto tiene aplicaciones en la prueba de hipótesis estadísticas , por ejemplo, porque el valor p unilateral es la probabilidad de observar una estadística de prueba al menos tan extrema como la observada. Por lo tanto, siempre que el estadístico de prueba , T , tenga una distribución continua, el valor p unilateral viene dado simplemente por la ccdf: para un valor observado de la estadística de prueba
En el análisis de supervivencia ,se llama función de supervivencia y se denota, mientras que el término función de confiabilidad es común en ingeniería .
Mesa Z:
Una de las aplicaciones más populares de la función de distribución acumulativa es la tabla normal estándar , también llamada tabla normal unitaria o tabla Z , [5] es el valor de la función de distribución acumulada de la distribución normal. Es muy útil usar la tabla Z no solo para probabilidades por debajo de un valor que es la aplicación original de la función de distribución acumulativa, sino también por encima y / o entre valores en la distribución normal estándar, y se extendió aún más a cualquier distribución normal.
- Propiedades
- Para una variable aleatoria continua no negativa que tiene una expectativa, la desigualdad de Markov establece que [6]
- Como , y de hecho siempre que es finito.
- Prueba: [ cita requerida ] Suponiendo tiene una función de densidad , para cualquier
- Luego, al reconocer y reordenando términos,
- como se afirma.
Distribución acumulativa plegada
Mientras que la gráfica de una distribución acumulativa a menudo tiene una forma de S, una ilustración alternativa es la distribución acumulativa plegada o la gráfica de montaña , que dobla la mitad superior de la gráfica, [7] [8] por lo tanto usando dos escalas, una para ladera ascendente y otra para la pendiente descendente. Esta forma de ilustración enfatiza la mediana y la dispersión (específicamente, la desviación absoluta media de la mediana [9] ) de la distribución o de los resultados empíricos.
Función de distribución inversa (función de cuantiles)
Si el CDF F es estrictamente creciente y continuo, entonces es el número real único tal que . En tal caso, esto define la función de distribución inversa o función cuantil .
Algunas distribuciones no tienen un inverso único (por ejemplo, en el caso en que para todos , causando ser constante). Este problema puede resolverse definiendo, por, la función de distribución inversa generalizada :
- Ejemplo 1: la mediana es .
- Ejemplo 2: Poner . Entonces llamamos el percentil 95.
Algunas propiedades útiles de la CDF inversa (que también se conservan en la definición de la función de distribución inversa generalizada) son:
- no es decreciente
- si y solo si
- Si tiene un distribución entonces se distribuye como . Esto se usa en la generación de números aleatorios usando el método de muestreo por transformada inversa .
- Si es una colección de independientes -variables aleatorias distribuidas definidas en el mismo espacio muestral, entonces existen variables aleatorias tal que se distribuye como y con probabilidad 1 para todos . [ cita requerida ]
La inversa de la CDF se puede utilizar para traducir los resultados obtenidos para la distribución uniforme a otras distribuciones.
Función de distribución empírica
La función de distribución empírica es una estimación de la función de distribución acumulada que generó los puntos en la muestra. Converge con probabilidad 1 a esa distribución subyacente. Existen varios resultados para cuantificar la tasa de convergencia de la función de distribución empírica a la función de distribución acumulativa subyacente [ cita requerida ] .
Caso multivariado
Definición de dos variables aleatorias
Cuando se trabaja simultáneamente con más de una variable aleatoria, también se puede definir la función de distribución acumulativa conjunta . Por ejemplo, para un par de variables aleatorias, el CDF conjunto viene dado por [3] : p. 89
| ( Ecuación 3 ) |
donde el lado derecho representa la probabilidad de que la variable aleatoria toma un valor menor o igual a y eso toma un valor menor o igual a .
Ejemplo de función de distribución acumulativa conjunta:
Para dos variables continuas X e Y :;
Para dos variables aleatorias discretas, es beneficioso generar una tabla de probabilidades y abordar la probabilidad acumulada para cada rango potencial de X e Y , y aquí está el ejemplo: [10]
dada la función de densidad de probabilidad conjunta en forma tabular, determine la función de distribución acumulativa conjunta.
Y = 2 | Y = 4 | Y = 6 | Y = 8 | |
X = 1 | 0 | 0,1 | 0 | 0,1 |
X = 3 | 0 | 0 | 0,2 | 0 |
X = 5 | 0,3 | 0 | 0 | 0,15 |
X = 7 | 0 | 0 | 0,15 | 0 |
Solución: utilizando la tabla de probabilidades dada para cada rango potencial de X e Y , la función de distribución acumulativa conjunta se puede construir en forma tabular:
Y <2 | 2 ≤ Y <4 | 4 ≤ Y <6 | 6 ≤ Y <8 | Y ≤ 8 | |
X <1 | 0 | 0 | 0 | 0 | 0 |
1 ≤ X <3 | 0 | 0 | 0,1 | 0,1 | 0,2 |
3 ≤ X <5 | 0 | 0 | 0,1 | 0,3 | 0.4 |
5 ≤ X <7 | 0 | 0,3 | 0.4 | 0,6 | 0,85 |
X ≤ 7 | 0 | 0,3 | 0.4 | 0,75 | 1 |
Definición de más de dos variables aleatorias
Para variables aleatorias , el CDF conjunto es dado por
| ( Ecuación 4 ) |
Interpretando el variables aleatorias como vector aleatorio produce una notación más corta:
Propiedades
Cada CDF multivariado es:
- Monótonamente no decreciente para cada una de sus variables,
- Derecha-continua en cada una de sus variables,
La probabilidad de que un punto pertenezca a un hiperrectángulo es análoga al caso unidimensional: [11]
Caso complejo
Variable aleatoria compleja
La generalización de la función de distribución acumulativa de variables aleatorias reales a complejas no es obvia porque las expresiones de la formano tiene sentido. Sin embargo, las expresiones de la formatener sentido. Por lo tanto, definimos la distribución acumulada de variables aleatorias complejas mediante la distribución conjunta de sus partes real e imaginaria:
- .
Vector aleatorio complejo
Generalización de los rendimientos de la ecuación 4
como definición para el CDS de un vector aleatorio complejo .
Uso en análisis estadístico
El concepto de función de distribución acumulativa aparece explícitamente en el análisis estadístico de dos formas (similares). El análisis de frecuencia acumulada es el análisis de la frecuencia de aparición de valores de un fenómeno inferiores a un valor de referencia. La función de distribución empírica es una estimación directa formal de la función de distribución acumulativa para la cual se pueden derivar propiedades estadísticas simples y que puede formar la base de varias pruebas de hipótesis estadísticas . Tales pruebas pueden evaluar si hay evidencia en contra de una muestra de datos que ha surgido de una distribución dada, o evidencia en contra de dos muestras de datos que han surgido de la misma distribución de población (desconocida).
Pruebas de Kolmogorov – Smirnov y Kuiper
La prueba de Kolmogorov-Smirnov se basa en funciones de distribución acumulativas y se puede utilizar para comprobar si dos distribuciones empíricas son diferentes o si una distribución empírica es diferente de una distribución ideal. La prueba de Kuiper estrechamente relacionada es útil si el dominio de la distribución es cíclico como en el día de la semana. Por ejemplo, la prueba de Kuiper podría usarse para ver si la cantidad de tornados varía durante el año o si las ventas de un producto varían según el día de la semana o el día del mes.
Ver también
- Estadísticas descriptivas
- Accesorio de distribución
- Ojiva (estadísticas)
Referencias
- ^ Deisenroth, Marc Peter; Faisal, A. Aldo; Ong, Cheng Soon (2020). Matemáticas para el aprendizaje automático . Prensa de la Universidad de Cambridge. pag. 181. ISBN 9781108455145.
- ^ Hüseyin Çakallı (2015). "Continuidades estadísticas ascendentes y descendentes" . Filomat . 29 (10): 2265–2273. doi : 10.2298 / FIL1510265C . JSTOR 24898386 . S2CID 58907979 .
- ^ a b c d e f Park, Kun Il (2018). Fundamentos de Probabilidad y Procesos Estocásticos con Aplicaciones a las Comunicaciones . Saltador. ISBN 978-3-319-68074-3.
- ^ Montgomery, Douglas C .; Runger, George C. (2003). Estadística aplicada y probabilidad para ingenieros (PDF) . John Wiley & Sons, Inc. pág. 104. ISBN 0-471-20454-4.
- ^ "Tabla Z" . Tabla Z . Consultado el 11 de diciembre de 2019 .
- ^ Zwillinger, Daniel; Kokoska, Stephen (2010). Tablas y fórmulas estándar de probabilidad y estadística de CRC . Prensa CRC. pag. 49. ISBN 978-1-58488-059-2.
- ^ Suave, JE (2009). Estadística computacional . Springer . ISBN 978-0-387-98145-1. Consultado el 6 de agosto de 2010 .[ página necesaria ]
- ^ Monti, KL (1995). "Curvas de función de distribución empírica plegada (gráficos de montaña)". El estadístico estadounidense . 49 (4): 342–345. doi : 10.2307 / 2684570 . JSTOR 2684570 .
- ^ Xue, JH; Titterington, DM (2011). "La función de distribución acumulativa plegada p y la desviación absoluta media del cuantil p" (PDF) . Estadísticas y letras de probabilidad . 81 (8): 1179-1182. doi : 10.1016 / j.spl.2011.03.014 .
- ^ "Función de distribución acumulativa conjunta (CDF)" . math.info . Consultado el 11 de diciembre de 2019 .
- ^ [1]
enlaces externos
- Medios relacionados con las funciones de distribución acumulativa en Wikimedia Commons