Inferencia estadística


La inferencia estadística es el proceso de utilizar el análisis de datos para inferir propiedades de una distribución de probabilidad subyacente . [1] El análisis estadístico inferencial infiere propiedades de una población , por ejemplo, al probar hipótesis y derivar estimaciones. Se supone que el conjunto de datos observados se muestrea de una población más grande.

Las estadísticas inferenciales se pueden contrastar con las estadísticas descriptivas . La estadística descriptiva se ocupa únicamente de las propiedades de los datos observados y no se basa en la suposición de que los datos provienen de una población más grande. En el aprendizaje automático , el término inferencia a veces se usa para significar "hacer una predicción, evaluando un modelo ya entrenado"; [2] en este contexto, inferir las propiedades del modelo se denomina entrenamiento o aprendizaje (en lugar de inferencia ), y usar un modelo para la predicción se denomina inferencia (en lugar de predicción ); ver tambiéninferencia predictiva .

La inferencia estadística hace proposiciones sobre una población, utilizando datos extraídos de la población con alguna forma de muestreo . Dada una hipótesis sobre una población, para la cual deseamos sacar inferencias, la inferencia estadística consiste en (primero) seleccionar un modelo estadístico del proceso que genera los datos y (segundo) deducir proposiciones del modelo. [ cita requerida ]

Konishi & Kitagawa afirman: "La mayoría de los problemas de inferencia estadística pueden considerarse problemas relacionados con el modelado estadístico". [3] De manera similar, Sir David Cox ha dicho: "La forma en que [la] traducción del problema de la materia en cuestión se realiza a un modelo estadístico es a menudo la parte más crítica de un análisis". [4]

La conclusión de una inferencia estadística es una proposición estadística . [5] Algunas formas comunes de proposición estadística son las siguientes:

Cualquier inferencia estadística requiere algunas suposiciones. Un modelo estadístico es un conjunto de suposiciones relativas a la generación de los datos observados y datos similares. Las descripciones de los modelos estadísticos generalmente enfatizan el papel de las cantidades de población de interés, sobre las cuales deseamos hacer inferencias. [6] Las estadísticas descriptivas generalmente se usan como un paso preliminar antes de que se extraigan inferencias más formales. [7]