Estadísticas multivariadas


La estadística multivariante es una subdivisión de la estadística que abarca la observación y el análisis simultáneos de más de una variable de resultado . La estadística multivariante se ocupa de comprender los diferentes objetivos y antecedentes de cada una de las diferentes formas de análisis multivariante y cómo se relacionan entre sí. La aplicación práctica de las estadísticas multivariadas a un problema en particular puede implicar varios tipos de análisis univariados y multivariados para comprender las relaciones entre las variables y su relevancia para el problema que se estudia.

Además, las estadísticas multivariadas se ocupan de las distribuciones de probabilidad multivariadas , en términos de

Ciertos tipos de problemas que involucran datos multivariados, por ejemplo, la regresión lineal simple y la regresión múltiple , generalmente no se consideran casos especiales de estadísticas multivariadas porque el análisis se trata considerando la distribución condicional (univariada) de una sola variable de resultado dada la otra. variables

El análisis multivariante ( MVA ) se basa en los principios de la estadística multivariante. Por lo general, MVA se usa para abordar las situaciones en las que se realizan múltiples mediciones en cada unidad experimental y las relaciones entre estas mediciones y sus estructuras son importantes. [1] Una categorización moderna y superpuesta de MVA incluye: [1]

El análisis multivariante puede complicarse por el deseo de incluir análisis basados ​​en la física para calcular los efectos de las variables para un "sistema de sistemas" jerárquico. A menudo, los estudios que desean utilizar el análisis multivariado se estancan por la dimensionalidad del problema. Estas preocupaciones a menudo se alivian mediante el uso de modelos sustitutos , aproximaciones altamente precisas del código basado en la física. Dado que los modelos sustitutos toman la forma de una ecuación, pueden evaluarse muy rápidamente. Esto se convierte en un habilitador para estudios MVA a gran escala: mientras que una simulación de Monte Carlo en el espacio de diseño es difícil con códigos basados ​​en la física, se vuelve trivial cuando se evalúan modelos sustitutos, que a menudo toman la forma de ecuaciones de superficie de respuesta .

Existe un conjunto de distribuciones de probabilidad que se utilizan en los análisis multivariados que desempeñan un papel similar al correspondiente conjunto de distribuciones que se utilizan en los análisis univariados cuando la distribución normal es apropiada para un conjunto de datos. Estas distribuciones multivariadas son: