En estadística , los datos bivariados son datos sobre cada una de las dos variables , donde cada valor de una de las variables se empareja con un valor de la otra variable. [1] Normalmente, sería interesante investigar la posible asociación entre las dos variables. [2] La asociación se puede estudiar a través de una visualización tabular o gráfica, o mediante estadísticas de muestra que pueden usarse para inferencias. El método utilizado para investigar la asociación dependería del nivel de medición de la variable.
Para dos variables cuantitativas (intervalo o razón en el nivel de medición ) se puede usar un diagrama de dispersión y se puede usar un coeficiente de correlación o un modelo de regresión para cuantificar la asociación. [3] Para dos variables cualitativas (nominal u ordinal en el nivel de medición ) se puede usar una tabla de contingencia para ver los datos, y se puede usar una medida de asociación o una prueba de independencia. [3]
Si las variables son cuantitativas, los pares de valores de estas dos variables a menudo se representan como puntos individuales en un plano utilizando un diagrama de dispersión . Esto se hace para que la relación (si existe) entre las variables se vea fácilmente. [4] Por ejemplo, los datos bivariados en un diagrama de dispersión podrían usarse para estudiar la relación entre la longitud de la zancada y la longitud de las piernas.
Variables dependientes e independientes
En algunos casos de datos bivariados, se determina que una variable influye o determina la segunda variable, y los términos variables dependientes e independientes se utilizan para distinguir entre los dos tipos de variables. En el ejemplo anterior, la longitud de las piernas de una persona es la variable independiente. La longitud de la zancada está determinada por la longitud de las piernas de una persona, por lo que es la variable dependiente. Tener piernas largas aumenta la longitud de la zancada, pero aumentar la longitud de la zancada no aumentará la longitud de sus piernas. [5]
Las correlaciones entre las dos variables se determinan como correlaciones fuertes o débiles y se califican en una escala de –1 a 1, donde 1 es una correlación directa perfecta, –1 es una correlación inversa perfecta y 0 es ninguna correlación. En el caso de piernas largas y zancadas largas, habría una fuerte correlación directa. [6]
Análisis de datos bivariados
En el análisis de datos bivariados, normalmente se comparan estadísticas de resumen de cada una de las variables o se usa el análisis de regresión para encontrar la fuerza y la dirección de una relación específica entre las variables. Si cada variable solo puede tomar uno de un pequeño número de valores, como solo "masculino" o "femenino", o solo "zurdo" o "diestro", entonces la distribución de frecuencia conjunta se puede mostrar en una contingencia tabla , que puede analizarse para determinar la fuerza de la relación entre las dos variables.
Referencias
- ^ "Bivariante" . Wolfram Research . Consultado el 15 de agosto de 2011 .
- ^ Moore, David; McCabe, George (1999). Introducción a la práctica de la estadística (Tercera ed.). Nueva York: WH Freeman and Company. pag. 104.
- ^ a b Ott, Lyman; Longnecker, Michael (2010). Introducción a los métodos estadísticos y al análisis de datos (Sexta ed.). Belmont, CA: Brooks / Cole. págs. 102-112.
- ^ Consejo Nacional de Profesores de Matemáticas. "Problema de estadística y probabilidad". Consultado el 7 de agosto de 2013 en http://www.nctm.org/uploadedFiles/Statistics%20and%20Probability%20Problem%202.pdf#search=%22bivariate [ enlace muerto permanente ] datos% 22
- ^ Centro Nacional de Estadísticas de Educación. "¿Qué son las variables independientes y dependientes? NCES Kids 'Zone". Consultado el 7 de agosto de 2013 en http://nces.ed.gov/nceskids/help/user_guide/graph/variables.asp
- ^ Pierce, Rod. (4 de enero de 2013). "Correlación". La matematica es divertida. Consultado el 7 de agosto de 2013 en http://www.mathsisfun.com/data/correlation.html