Un coeficiente de correlación es una medida numérica de algún tipo de correlación , es decir, una relación estadística entre dos variables . [a] Las variables pueden ser dos columnas de un conjunto de datos de observaciones dado , a menudo llamado muestra , o dos componentes de una variable aleatoria multivariante con una distribución conocida . [ cita requerida ]
Existen varios tipos de coeficientes de correlación, cada uno con su propia definición y su propio rango de usabilidad y características. Todos asumen valores en el rango de -1 a +1, donde ± 1 indica el acuerdo más fuerte posible y 0 el desacuerdo más fuerte posible. [2] Como herramientas de análisis, los coeficientes de correlación presentan ciertos problemas, incluida la propensión de algunos tipos a ser distorsionados por valores atípicos y la posibilidad de ser utilizados incorrectamente para inferir una relación causal entre las variables (para más información, ver Correlación no implica causalidad ). [3]
Tipos
Hay varias medidas diferentes para el grado de correlación en los datos, dependiendo del tipo de datos: principalmente si los datos son una medida, ordinal o categórica.
Pearson
El coeficiente de correlación producto-momento de Pearson , también conocido como r , R o r de Pearson , es una medida de la fuerza y la dirección de la relación lineal entre dos variables que se define como la covarianza de las variables dividida por el producto de su estándar. desviaciones. [4] [5] Este es el tipo de coeficiente de correlación más conocido y utilizado. Cuando el término "coeficiente de correlación" se usa sin más calificaciones, generalmente se refiere al coeficiente de correlación producto-momento de Pearson.
Intraclase
La correlación intraclase (ICC) es una estadística descriptiva que se puede utilizar cuando se realizan mediciones cuantitativas en unidades que se organizan en grupos; describe cuán fuertemente se parecen las unidades del mismo grupo.
Rango
La correlación de rango es una medida de la relación entre las clasificaciones de dos variables o dos clasificaciones de la misma variable:
- El coeficiente de correlación de rango de Spearman es una medida de qué tan bien se puede describir la relación entre dos variables mediante una función monótona.
- El coeficiente de correlación de rangos tau de Kendall es una medida de la porción de rangos que coinciden entre dos conjuntos de datos.
- La gamma de Goodman y Kruskal es una medida de la fuerza de asociación de los datos de tabulación cruzada cuando ambas variables se miden a nivel ordinal.
Tetrachórico y policórico
El coeficiente de correlación policórica mide la asociación entre dos variables categóricas ordenadas. Se define técnicamente como la estimación del coeficiente de correlación de Pearson que se obtendría si:
- Las dos variables se midieron en una escala continua, en lugar de como variables de categoría ordenada.
- Las dos variables continuas siguieron una distribución normal bivariada .
Cuando ambas variables son dicotómicas en lugar de ordenadas-categóricas, el coeficiente de correlación policórico se denomina coeficiente de correlación tetracorico.
Ver también
- Coeficiente de determinación
- Correlación y dependencia
- Razón de correlación
- Correlación de distancia
- Bondad de ajuste , cualquiera de las varias medidas que miden qué tan bien un modelo estadístico se ajusta a las observaciones al resumir la discrepancia entre los valores observados y los valores esperados bajo el modelo.
- Correlación múltiple
- Correlación parcial
Notas al pie
- ^ Coeficiente de correlación: una estadística que se utiliza para mostrar cómo las puntuaciones de una medida se relacionan con las puntuaciones de una segunda medida para el mismo grupo de personas. Un valor alto (cercano a +1,00) es una relación directa fuerte, los valores cercanos a 0,50 se consideran moderados y los valores por debajo de 0,30 se considera que muestran una relación débil. Un valor negativo bajo (cercano a -1,00) es igualmente una fuerte relación inversa, y los valores cercanos a 0,00 indican poca o ninguna relación. [1]
Referencias
- ^ "coeficiente de correlación" . NCME.org . Consejo Nacional de Medición en Educación . Archivado desde el original el 22 de julio de 2017 . Consultado el 17 de abril de 2014 .
- ^ Taylor, John R. (1997). Una introducción al análisis de errores: el estudio de las incertidumbres en las mediciones físicas (PDF) (2ª ed.). Sausalito, CA: University Science Books. pag. 217. ISBN 0-935702-75-X. Archivado desde el original (PDF) el 15 de febrero de 2019 . Consultado el 14 de febrero de 2019 .
- ^ Boddy, Richard; Smith, Gordon (2009). Métodos estadísticos en la práctica: para científicos y tecnólogos . Chichester, Reino Unido: Wiley. págs. 95–96. ISBN 978-0-470-74664-6.
- ^ "Lista de símbolos de probabilidad y estadística" . Bóveda de matemáticas . 2020-04-26 . Consultado el 22 de agosto de 2020 .
- ^ Weisstein, Eric W. "Correlación estadística" . mathworld.wolfram.com . Consultado el 22 de agosto de 2020 .