Población estadística


En estadística, una población es un conjunto de elementos o eventos similares que son de interés para alguna pregunta o experimento.[1]​ Una población estadística puede ser un grupo de objetos existentes (por ejemplo, el conjunto de todas las estrellas dentro de la Vía Láctea) o una hipotética y potencialmente infinita grupo de objetos concebidos como una generalización de la experiencia (por ejemplo, el conjunto de todas las manos posibles en un juego de póquer).[2]​ Un objetivo común del análisis estadístico es producir información sobre alguna población elegida.[3]

En la inferencia estadística, se elige un subconjunto de la población (una muestra estadística) para representar la población en un análisis estadístico.[4]​ La relación entre el tamaño de esta muestra estadística y el tamaño de la población se denomina fracción de muestreo. Entonces es posible estimar los parámetros de la población utilizando las estadísticas de muestra adecuadas.

La media poblacional, o valor esperado de la población, es una medida de tendencia central bien de una distribución de probabilidad o de una variable aleatoria caracterizada por la distribución.[5]​En una distribución de probabilidad discreta de una variable aleatoria X, la media es igual a la suma sobre cada valor posible ponderada por la probabilidad de ese valor; es decir, se calcula tomando el producto de cada valor posible x de X y su probabilidad p(x), y luego sumando todos estos productos, dando .[6][7]​ Una fórmula análoga se aplica al caso de una distribución de probabilidad continua. No toda distribución de probabilidad tiene una media definida (véase la distribución de Cauchy como ejemplo). Además, la media puede ser infinita para algunas distribuciones.

Para una población finita, la media poblacional de una propiedad es igual a la media aritmética de la propiedad dada, considerando cada miembro de la población. Por ejemplo, la media poblacional de la altura es igual a la suma de las alturas de cada individuo dividida por el número total de individuos. La media de la muestra puede diferir de la media de la población, especialmente en el caso de muestras pequeñas. La ley de los grandes números establece que cuanto mayor sea el tamaño de la muestra, más probable será que la media de la muestra se acerque a la media de la población.[8]

Un subconjunto de una población que comparte una o más propiedades adicionales se denomina subpoblación. Por ejemplo, si la población es toda egipcia, una subpoblación son todos hombres egipcios; si la población son todas las farmacias del mundo, una subpoblación son todas las farmacias de Egipto. Por el contrario, una muestra es un subconjunto de una población que no se elige para compartir ninguna propiedad adicional.