Probabilidad empírica

La probabilidad empírica , frecuencia relativa o probabilidad experimental de un evento es la relación entre el número de resultados en los que ocurre un evento específico y el número total de ensayos, ^[1] no en un espacio muestral teórico sino en un experimento real. En un sentido más general, la probabilidad empírica estima las probabilidades a partir de la experiencia y la observación . ^[2]

Dado un evento A en un espacio muestral, la frecuencia relativa de A es la razón m / n , siendo m el número de resultados en los que ocurre el evento A y n el número total de resultados del experimento. ^[3]

En términos estadísticos, la probabilidad empírica es una estimación o estimador de una probabilidad. En casos simples, donde el resultado de un ensayo solo determina si el evento especificado ha ocurrido o no, el modelado usando una distribución binomial podría ser apropiado y luego la estimación empírica es la estimación de máxima verosimilitud . Es la estimación bayesiana para el mismo caso si se hacen ciertos supuestos para la distribución previa de la probabilidad. Si un ensayo arroja más información, la probabilidad empírica se puede mejorar adoptando supuestos adicionales en la forma de un modelo estadístico : si dicho modelo se ajusta, se puede usar para derivar una estimación de la probabilidad del evento especificado.

Ventajas y desventajas

Ventajas

Una ventaja de estimar probabilidades usando probabilidades empíricas es que este procedimiento está relativamente libre de suposiciones.

Por ejemplo, considere estimar la probabilidad entre una población de hombres de que satisfagan dos condiciones:

que miden más de 6 pies de altura.
que prefieren la mermelada de fresa a la de frambuesa.

Se puede obtener una estimación directa contando el número de hombres que satisfacen ambas condiciones para obtener la probabilidad empírica de la condición combinada. Se podría encontrar una estimación alternativa multiplicando la proporción de hombres que miden más de 6 pies de altura por la proporción de hombres que prefieren la mermelada de fresa a la de frambuesa, pero esta estimación se basa en el supuesto de que las dos condiciones son estadísticamente independientes .

Desventajas

Una desventaja en el uso de probabilidades empíricas surge al estimar probabilidades que son muy cercanas a cero o muy cercanas a uno. En estos casos, se necesitarían tamaños de muestra muy grandes para estimar tales probabilidades con un buen estándar de precisión relativa. En este caso, los modelos estadísticos pueden ayudar, según el contexto, y en general se puede esperar que dichos modelos proporcionen mejoras en la precisión en comparación con las probabilidades empíricas, siempre que los supuestos involucrados realmente se mantengan.

Por ejemplo, considere estimar la probabilidad de que la más baja de las temperaturas máximas diarias en un sitio en febrero en cualquier año sea inferior a cero grados Celsius. Se podría usar un registro de tales temperaturas en años pasados para estimar esta probabilidad. Una alternativa basada en modelos sería seleccionar una familia de distribuciones de probabilidad y ajustarla al conjunto de datos que contiene los valores de años anteriores. La distribución ajustada proporcionaría una estimación alternativa de la probabilidad deseada. Este método alternativo puede proporcionar una estimación de la probabilidad incluso si todos los valores del registro son mayores que cero.

Nomenclatura mixta

La frase probabilidad a posteriori también se utiliza como alternativa a la probabilidad empírica o frecuencia relativa. ^[1] El uso de la frase "a posteriori" recuerda los términos de la estadística bayesiana , pero no está directamente relacionado con la inferencia bayesiana , donde la probabilidad a posteriori se usa ocasionalmente para referirse a la probabilidad posterior , que es diferente a pesar de que tiene un nombre confusamente similar.

El término probabilidad a posteriori , en su significado como equivalente a probabilidad empírica , puede usarse junto con la probabilidad a priori que representa una estimación de una probabilidad no basada en ninguna observación, sino basada en el razonamiento deductivo . ^[4]

Ver también

Referencias

^ ^a ^{b Estado de} ánimo, AM; Graybill, FA; Boes, DC (1974). "Sección 2.3". Introducción a la Teoría de la Estadística (3ª ed.). McGraw-Hill. ISBN 0070428646.
^ "Probabilidades empíricas en tpub.com" . Archivado desde el original el 10 de mayo de 2007 . Consultado el 31 de marzo de 2007 .
^ Gujarati, Damodar N. (2003). "Apéndice A". Econometría básica (4ª ed.). McGraw-Hill. ISBN 978-0-07-233542-2.
^ Estado de ánimo, AM; Graybill, FA; Boes, DC (1974). "Sección 2.2". Introducción a la Teoría de la Estadística (3ª ed.). McGraw-Hill. ISBN 0070428646.( disponible en línea Archivado el 15 de mayo de 2012 en Wayback Machine )

[Mood-1] {b Estado de} ánimo, AM; Graybill, FA; Boes, DC (1974). "Sección 2.3". Introducción a la Teoría de la Estadística (3ª ed.). McGraw-Hill. ISBN 0070428646.

[2] "Probabilidades empíricas en tpub.com" . Archivado desde el original el 10 de mayo de 2007 . Consultado el 31 de marzo de 2007 .

[3] Gujarati, Damodar N. (2003). "Apéndice A". Econometría básica (4ª ed.). McGraw-Hill. ISBN 978-0-07-233542-2.

[4] Estado de ánimo, AM; Graybill, FA; Boes, DC (1974). "Sección 2.2". Introducción a la Teoría de la Estadística (3ª ed.). McGraw-Hill. ISBN 0070428646.( disponible en línea Archivado el 15 de mayo de 2012 en Wayback Machine )

[1]