Fiabilidad equivalente a Tau (), también conocido como alfa de Cronbach o coeficiente alfa , es el coeficiente de confiabilidad de puntaje de prueba más común para una sola administración (es decir, la confiabilidad de las personas sobre los ítems que tienen una ocasión fija). [1] [2] [3]
Estudios recientes recomiendan no usarlo incondicionalmente. [4] [5] [6] [7] [8] [9] Los coeficientes de confiabilidad basados en el modelado de ecuaciones estructurales (SEM) a menudo se recomiendan como su alternativa.
Fórmula y cálculo
Fórmula sistemática y convencional
Dejar denotar la puntuación observada del elemento y denotar la suma de todos los elementos en una prueba que consta de artículos. Dejar denotar la covarianza entre y , denotar la varianza de , y denotar la varianza de . consta de variaciones de artículos y covarianzas entre artículos. Es decir,. Dejardenotar el promedio de las covarianzas entre elementos. Es decir,.
La fórmula "sistemática" [3] es
.
La versión de la fórmula que se usa con más frecuencia es
.
Ejemplo de cálculo
Cuando se aplica a datos apropiados
se aplica a los siguientes datos que satisfacen la condición de ser equivalente a tau.
, ,
,
y .
Cuando se aplica a datos inapropiados
se aplica a los siguientes datos que no satisfacen la condición de ser equivalente a tau.
, ,
,
y .
Compare este valor con el valor de aplicar confiabilidad congenérica a los mismos datos.
Requisitos previos para utilizar la fiabilidad equivalente a tau
Para usar como coeficiente de confiabilidad, los datos deben satisfacer las siguientes condiciones.
1) Unidimensionalidad
2) equivalencia tau (esencial)
3) Independencia entre errores
Las condiciones de ser paralelo, equivalente a tau y congenérico
Condición paralela
A nivel de población, los datos paralelos tienen covarianzas entre elementos iguales (es decir, elementos no diagonales de la matriz de covarianza) y varianzas iguales (es decir, elementos diagonales de la matriz de covarianza). Por ejemplo, los siguientes datos satisfacen la condición de paralelo. En datos paralelos, incluso si se usa una matriz de correlación en lugar de una matriz de covarianza, no hay pérdida de información. Todos los datos paralelos también son equivalentes a tau, pero lo contrario no es cierto. Es decir, entre las tres condiciones, la condición paralela es la más difícil de cumplir.
Condición equivalente a Tau
A nivel de población, los datos equivalentes a tau tienen covarianzas iguales, pero sus varianzas pueden tener valores diferentes. Por ejemplo, los siguientes datos cumplen la condición de ser equivalentes a tau. Todos los elementos de los datos equivalentes a tau tienen la misma discriminación o importancia. Todos los datos equivalentes a tau también son congenéricos, pero lo contrario no es cierto.
Condición congenérica
A nivel de población, los datos congenéricos no necesitan tener varianzas o covarianzas iguales, siempre que sean unidimensionales. Por ejemplo, los siguientes datos cumplen la condición de ser congenéricos. Todos los elementos de los datos congenéricos pueden tener diferente discriminación o importancia.
Relación con otros coeficientes de confiabilidad
Clasificación de los coeficientes de fiabilidad de una sola administración
Nombres convencionales
Existen numerosos coeficientes de fiabilidad. Entre ellos, los nombres convencionales de coeficientes de confiabilidad que están relacionados y se utilizan con frecuencia se resumen a continuación: [3]
Mitad dividida | Unidimensional | Multidimensional | |
---|---|---|---|
Paralelo | Fórmula Spearman-Brown | Estandarizado | (Sin nombre convencional) |
Equivalente a Tau | Fórmula Flanagan Fórmula Rulon Fórmula Flanagan-Rulon Fórmula Guttman | De Cronbach coeficiente Guttman Fiabilidad del KR-20 Hoyt | Estratificado |
Congenérico | Coeficiente de Angoff-Feldt Coeficiente de Raju (1970) | confiabilidad compuesta confiabilidad del constructo coeficiente de confiabilidad congenérica unidimensional Coeficiente de Raju (1977) | coeficiente total de McDonald's multidimensional |
La combinación de nombres de filas y columnas proporciona los requisitos previos para el coeficiente de confiabilidad correspondiente. Por ejemplo, Cronbach y Guttman son coeficientes de confiabilidad derivados bajo la condición de ser unidimensionales y equivalentes a tau.
Nombres sistemáticos
Los nombres convencionales están desordenados y no son sistemáticos. Los nombres convencionales no brindan información sobre la naturaleza de cada coeficiente o brindan información engañosa (por ejemplo, confiabilidad compuesta). Los nombres convencionales son inconsistentes. Algunas son fórmulas y otras son coeficientes. Algunos llevan el nombre del desarrollador original, otros llevan el nombre de alguien que no es el desarrollador original y otros no incluyen el nombre de ninguna persona. Mientras que una fórmula se denomina con varios nombres, varias fórmulas se denominan con una notación (por ejemplo, alfas y omegas). Los nombres sistemáticos propuestos y su notación para estos coeficientes de confiabilidad son los siguientes: [3]
Mitad dividida | Unidimensional | Multidimensional | |
---|---|---|---|
Paralelo | Fiabilidad paralela dividida por la mitad () | fiabilidad paralela) | fiabilidad paralela multidimensional () |
Equivalente a Tau | Fiabilidad equivalente a tau dividida por la mitad () | confiabilidad equivalente a tau () | fiabilidad multidimensional equivalente a tau () |
Congenérico | confiabilidad congenérica dividida () | confiabilidad congenérica) | Modelo de bifactor Fiabilidad de bifactor () Modelo de factor de segundo orden Fiabilidad de factor de segundo orden () Modelo de factores correlacionados Fiabilidad de los factores correlacionados () |
Relación con la fiabilidad paralela
a menudo se denomina coeficiente alfa y a menudo se denomina alfa estandarizado. Debido al modificador estandarizado, a menudo se confunde con una versión más estándar que . No existe una base histórica a la que referirsecomo alfa estandarizado. Cronbach (1951) [10] no se refirió a este coeficiente como alfa ni recomendó su uso.rara vez se usaba antes de la década de 1970. A medida que SPSS comenzó a proporcionarbajo el nombre de alfa estandarizado, este coeficiente comenzó a usarse ocasionalmente. [11] El uso de no se recomienda porque la condición de paralelo es difícil de cumplir en los datos del mundo real.
Relación con la confiabilidad equivalente a tau dividida por la mitad
es igual al promedio de la valores obtenidos para todas las posibles mitades divididas. Esta relación, probada por Cronbach (1951), [10] se utiliza a menudo para explicar el significado intuitivo de. Sin embargo, esta interpretación pasa por alto el hecho de quesubestima la confiabilidad cuando se aplica a datos que no son equivalentes a tau. A nivel de población, el máximo de todos los posibles valores está más cerca de la confiabilidad que el promedio de todos los posibles valores. [7] Este hecho matemático ya se conocía incluso antes de la publicación de Cronbach (1951). [12] Un estudio comparativo [13] informa que el máximo de es el coeficiente de confiabilidad más preciso.
Revelle (1979) [14] se refiere al mínimo de todos los posibles valores como coeficiente , y recomienda que proporciona información complementaria que no es. [6]
Relación con la fiabilidad congenérica
Si se satisfacen los supuestos de unidimensionalidad y equivalencia tau, es igual a .
Si se satisface la unidimensionalidad pero no se satisface la equivalencia tau, es más pequeña que . [7]
es el coeficiente de confiabilidad más comúnmente utilizado después de . Los usuarios tienden a presentar ambos, en lugar de reemplazar con . [3]
Un estudio que investiga estudios que presentaron ambos coeficientes informa que es 0.02 menor que de media. [15]
Relación con coeficientes de fiabilidad multidimensionales y
Si se aplica a datos multidimensionales, su valor es menor que los coeficientes de confiabilidad multidimensionales y mayor que . [3]
Relación con la correlación intraclase
se dice que es igual a la versión de consistencia mejorada del coeficiente de correlación intraclase , que se usa comúnmente en estudios observacionales. Pero esto es solo condicionalmente cierto. En términos de los componentes de la varianza, esta condición es, para el muestreo de artículos: si y solo si el valor del componente de varianza del artículo (evaluador, en el caso de la calificación) es igual a cero. Si este componente de varianza es negativo,subestimará el coeficiente de correlación intraclase aumentado ; si este componente de la varianza es positivo,sobrestimará este coeficiente de correlación intraclase incrementado .
Historia [11]
Antes de 1937
[16] [17] fue el único coeficiente de confiabilidad conocido. El problema era que las estimaciones de fiabilidad dependían de cómo se dividían los elementos por la mitad (p. Ej., Pares / impares o anverso / reverso). Se criticaron esta falta de fiabilidad, pero durante más de 20 años no se encontró una solución fundamental. [18]
Kuder y Richardson (1937)
Kuder y Richardson (1937) [19] desarrollaron varios coeficientes de confiabilidad que podrían superar el problema de. No dieron nombres particulares a los coeficientes de confiabilidad. La ecuación 20 en su artículo es. Esta fórmula a menudo se conoce como fórmula 20 de Kuder-Richardson o KR-20. Se ocuparon de casos en los que las puntuaciones observadas eran dicotómicas (p. Ej., Correctas o incorrectas), por lo que la expresión de KR-20 es ligeramente diferente de la fórmula convencional de. Una revisión de este artículo revela que no presentaron una fórmula general porque no la necesitaban, no porque no pudieran. Dejar denotar la proporción de respuestas correcta del ítem , y denotar la proporción de respuesta incorrecta del ítem (). La fórmula de KR-20 es la siguiente.
Desde , KR-20 y tienen el mismo significado.
Entre 1937 y 1951
Varios estudios publicaron la fórmula general de KR-20
Kuder y Richardson (1937) hicieron suposiciones innecesarias para derivar . Varios estudios han derivado de forma diferente a Kuder y Richardson (1937).
Hoyt (1941) [20] derivóutilizando ANOVA (Análisis de varianza). Cyril Hoyt puede ser considerado el primer desarrollador de la fórmula general del KR-20, pero no presentó explícitamente la fórmula de.
La primera expresión de la fórmula moderna de aparece en Jackson y Ferguson (1941). [21] La versión que presentaron es la siguiente. Edgerton y Thompson (1942) [22] utilizaron la misma versión.
Guttman (1945) [12] derivó seis fórmulas de confiabilidad, cada una denotada por. Louis Guttman demostró que todas estas fórmulas eran siempre menores o iguales a la confiabilidad y, basándose en estas características, se refirió a estas fórmulas como "límites inferiores de confiabilidad". Guttman es , y es . Demostró que es siempre mayor o igual que (es decir, más precisa). En ese momento, todos los cálculos se realizaban con papel y lápiz, y dado que la fórmula de era más sencillo de calcular, mencionó que fue útil en determinadas condiciones.
Gulliksen (1950) [23] derivócon menos supuestos que los estudios anteriores. El supuesto que utilizó es la equivalencia tau esencial en términos modernos.
Reconocimiento de la fórmula original y la fórmula general de KR-20 en ese momento
Se reconoció que las dos fórmulas eran exactamente idénticas y no se utilizó la expresión de la fórmula general de KR-20. Hoyt [20] explicó que su método "da precisamente el mismo resultado" que KR-20 (p.156). Jackson y Ferguson [21] afirmaron que las dos fórmulas son "idénticas" (p.74). Guttman [12] dijoes "algebraicamente idéntico" a KR-20 (p.275). Gulliksen [23] también admitió que las dos fórmulas son “idénticas” (p. 224).
Incluso los estudios críticos de KR-20 no señalaron que la fórmula original de KR-20 solo podría aplicarse a datos dicotómicos. [24]
Críticas a la subestimación del KR-20
Los desarrolladores [19] de esta fórmula informaron quesubestima constantemente la fiabilidad. Hoyt [25] argumentó que esta característica por sí sola hacía más recomendable que la técnica tradicional de la mitad dividida, que se desconocía si subestimar o sobrestimar la fiabilidad.
Cronbach (1943) [24] fue crítico con la subestimación de. Le preocupaba que no se supiera cuántofiabilidad subestimada. Criticó que era probable que la subestimación fuera excesivamente grave, de modo quea veces puede dar lugar a valores negativos. Debido a estos problemas, argumentó que no se puede recomendar como alternativa a la técnica de la mitad dividida.
Cronbach (1951)
Como en estudios anteriores, [20] [12] [21] [23] Cronbach (1951) [10] inventó otro método para derivar. Su interpretación fue intuitivamente más atractiva que las de estudios anteriores. Es decir, probó que es igual al promedio de valores obtenidos para todas las posibles mitades divididas. Criticó que el nombre KR-20 era extraño y sugirió un nuevo nombre, coeficiente alfa. Su enfoque ha sido un gran éxito. Sin embargo, no solo omitió algunos hechos clave, sino que también dio una explicación incorrecta.
Primero, posicionó el coeficiente alfa como una fórmula general de KR-20, pero omitió la explicación de que los estudios existentes habían publicado la fórmula exactamente idéntica. Aquellos que leyeron solo a Cronbach (1951) sin conocimientos previos podrían malinterpretar que él fue el primero en desarrollar la fórmula general de KR-20.
En segundo lugar, no explicó en qué condiciones es igual a fiabilidad. Los no expertos podrían malinterpretar que era un coeficiente de fiabilidad general que se podía utilizar para todos los datos independientemente de los requisitos previos.
En tercer lugar, no explicó por qué cambió su actitud hacia . En particular, no dio una respuesta clara al problema de subestimación de, que él mismo [24] había criticado.
Cuarto, argumentó que un alto valor de indicó homogeneidad de los datos.
Después de 1951
Novick y Lewis (1967) [26] demostraron la condición necesaria y suficiente para para ser igual a la confiabilidad, y lo nombró la condición de ser esencialmente equivalente a tau.
Cronbach (1978) [2] mencionó que la razón por la que Cronbach (1951) recibió muchas citas fue "principalmente porque [él] puso un nombre de marca en un coeficiente de lugar común" (p. 263). [3] Explicó que originalmente había planeado nombrar otros tipos de coeficientes de confiabilidad (p. Ej., Confiabilidad entre evaluadores o confiabilidad test-retest) en letras griegas consecutivas (p. Ej.,, , ), pero luego cambió de opinión.
Cronbach y Schavelson (2004) [27] animaron a los lectores a utilizar la teoría de la generalización en lugar de. Se opuso al uso del nombre alfa de Cronbach. Negó explícitamente la existencia de estudios existentes que hubieran publicado la fórmula general de KR-20 antes de Cronbach (1951).
Conceptos erróneos comunes sobre la confiabilidad equivalente a tau [7]
El valor de la confiabilidad equivalente a tau varía entre cero y uno.
Por definición, la confiabilidad no puede ser menor que cero ni mayor que uno. Muchos libros de texto equiparan erróneamente con fiabilidad y dar una explicación inexacta de su rango. puede ser menor que la confiabilidad cuando se aplica a datos que no son equivalentes a tau. Suponer que copió el valor de como es, y copiado multiplicando el valor de por 1. La matriz de covarianza entre elementos es la siguiente,.
Negativo puede ocurrir por razones tales como discriminación negativa o errores en el procesamiento de elementos calificados de manera inversa.
a diferencia de , Coeficientes de confiabilidad basados en SEM (p. Ej., ) son siempre mayores o iguales a cero.
Esta anomalía fue señalada por primera vez por Cronbach (1943) [24] para criticar, pero Cronbach (1951) [10] no comentó sobre este problema en su artículo, que discutió todos los temas imaginables relacionadosy él mismo [27] describió como "enciclopédico" (p. 396).
Si no hay error de medición, el valor de confiabilidad equivalente a tau es uno
Esta anomalía también se origina en el hecho de que subestima la fiabilidad. Suponer que copió el valor de como es, y copiado multiplicando el valor de por dos. La matriz de covarianza entre elementos es la siguiente,.
Para los datos anteriores, ambos y tiene un valor de uno.
El ejemplo anterior es presentado por Cho y Kim (2015). [7]
Un valor alto de confiabilidad equivalente a tau indica homogeneidad entre los ítems
Muchos libros de texto se refieren a como indicador de homogeneidad entre ítems. Este concepto erróneo se deriva de la explicación inexacta de Cronbach (1951) [10] tan altalos valores muestran homogeneidad entre los elementos. La homogeneidad es un término que rara vez se usa en la literatura moderna, y los estudios relacionados interpretan el término como una referencia a la unidimensionalidad. Varios estudios han proporcionado pruebas o contraejemplos de quelos valores no indican unidimensionalidad. [28] [7] [29] [30] [31] [32] Véanse los contraejemplos a continuación.
en los datos unidimensionales anteriores.
en los datos multidimensionales anteriores.
Los datos anteriores tienen , pero son multidimensionales.
Los datos anteriores tienen , pero son unidimensionales.
La unidimensionalidad es un requisito previo para . Debe verificar la unidimensionalidad antes de calcular, en lugar de calcular para comprobar la unidimensionalidad. [3]
Un valor alto de confiabilidad equivalente a tau indica consistencia interna
El término consistencia interna se usa comúnmente en la literatura sobre confiabilidad, pero su significado no está claramente definido. El término a veces se usa para referirse a un cierto tipo de confiabilidad (por ejemplo, confiabilidad de consistencia interna), pero no está claro exactamente qué coeficientes de confiabilidad se incluyen aquí, además de. Cronbach (1951) [10] utilizó el término en varios sentidos sin una definición explícita. Cho y Kim (2015) [7] demostraron que no es un indicador de ninguno de estos.
Eliminar elementos con "alfa si se eliminó el elemento" siempre aumenta la confiabilidad
La eliminación de un elemento con "alfa si se eliminó el elemento" puede resultar en "inflación alfa", donde se informa que la confiabilidad a nivel de muestra es mayor que la confiabilidad a nivel de población. [33] También puede reducir la confiabilidad a nivel de población. [34] La eliminación de elementos menos fiables debe basarse no solo en una base estadística, sino también en una base teórica y lógica. También se recomienda dividir toda la muestra en dos y realizar una validación cruzada. [33]
Nivel de confiabilidad ideal y cómo aumentar la confiabilidad
Recomendaciones de Nunnally para el nivel de confiabilidad
La fuente citada con más frecuencia de cuánto deberían ser los coeficientes de confiabilidad es el libro de Nunnally. [35] [36] [37] Sin embargo, sus recomendaciones se citan en contra de sus intenciones. Lo que quiso decir fue aplicar diferentes criterios según el propósito o la etapa del estudio. Sin embargo, independientemente de la naturaleza de la investigación, como la investigación exploratoria, la investigación aplicada y la investigación de desarrollo a escala, un criterio de .7 se utiliza universalmente. [38] .7 es el criterio que recomendó para las primeras etapas de un estudio, que la mayoría de los estudios publicados en la revista no lo son. En lugar de .7, el criterio de .8 referido a la investigación aplicada de Nunnally es más apropiado para la mayoría de los estudios empíricos. [38]
1ª edición [35] | 2ª [36] y 3ª [37] edición | |
---|---|---|
Etapa inicial de investigación | .5 o .6 | .7 |
Investigación aplicada | .8 | .8 |
Al tomar decisiones importantes | .95 (mínimo .9) | .95 (mínimo .9) |
Su nivel de recomendación no implicó un punto de corte. Si un criterio significa un punto de corte, es importante si se cumple o no, pero no importa cuánto se exceda o no se supere. No quiso decir que debería ser estrictamente .8 al referirse a los criterios de .8. Si la fiabilidad tiene un valor cercano a .8 (por ejemplo, 0,78), se puede considerar que se ha cumplido su recomendación. [39]
Su idea era que aumentar la confiabilidad tiene un costo, por lo que no es necesario tratar de obtener la máxima confiabilidad en cada situación.
Costo para obtener un alto nivel de confiabilidad
Muchos libros de texto explican que cuanto mayor sea el valor de la confiabilidad, mejor. Rara vez se discuten los posibles efectos secundarios de una alta fiabilidad. Sin embargo, el principio de sacrificar algo para obtener uno también se aplica a la confiabilidad.
Compensación entre fiabilidad y validez [7]
Las mediciones con una fiabilidad perfecta carecen de validez. Por ejemplo, una persona que rinda la prueba con la fiabilidad de uno obtendrá una puntuación perfecta o una puntuación cero, porque el examinado que dé la respuesta correcta o incorrecta en un ítem dará la respuesta correcta o incorrecta en todos los demás ítems. . El fenómeno en el que se sacrifica la validez para aumentar la confiabilidad se llama paradoja de atenuación. [40] [41]
Un alto valor de confiabilidad puede estar en conflicto con la validez del contenido. Para una alta validez de contenido, cada elemento debe construirse para poder representar de manera integral el contenido que se va a medir. Sin embargo, una estrategia de medir repetidamente esencialmente la misma pregunta de diferentes maneras se usa a menudo solo con el propósito de aumentar la confiabilidad. [42] [43]
Compensación entre confiabilidad y eficiencia
Cuando las otras condiciones son iguales, la confiabilidad aumenta a medida que aumenta el número de elementos. Sin embargo, el aumento en el número de ítems dificulta la eficiencia de las mediciones.
Métodos para aumentar la confiabilidad
A pesar de los costos asociados con el aumento de la confiabilidad discutidos anteriormente, puede ser necesario un alto nivel de confiabilidad. Se puede considerar que los siguientes métodos aumentan la confiabilidad.
Antes de la recopilación de datos
Elimina la ambigüedad del elemento de medición.
No mida lo que los encuestados no saben.
Incrementa la cantidad de artículos. Sin embargo, se debe tener cuidado de no inhibir excesivamente la eficiencia de la medición.
Utilice una báscula que se sepa que es altamente confiable. [44]
Realice una prueba preliminar. Descubra de antemano el problema de la fiabilidad.
Excluya o modifique elementos que sean diferentes en contenido o forma de otros elementos (por ejemplo, elementos puntuados de forma inversa).
Después de la recopilación de datos
Elimine los elementos problemáticos usando "alfa si se eliminó el elemento". Sin embargo, esta supresión debería ir acompañada de una justificación teórica.
Utilice un coeficiente de confiabilidad más preciso que . Por ejemplo, es 0.02 más grande que de media. [15]
Qué coeficiente de confiabilidad usar
¿Deberíamos seguir utilizando la fiabilidad equivalente a tau?
se utiliza en una proporción abrumadora. Un estudio estima que aproximadamente el 97% de los estudios utilizancomo coeficiente de fiabilidad. [3]
Sin embargo, los estudios de simulación que comparan la precisión de varios coeficientes de confiabilidad han llevado al resultado común de que es un coeficiente de fiabilidad inexacto. [45] [13] [6] [46] [47]
Los estudios metodológicos son críticos con el uso de . La simplificación y clasificación de las conclusiones de los estudios existentes son las siguientes.
(1) Uso condicional: uso sólo cuando se cumplen determinadas condiciones. [3] [7] [9]
(2) Oposición al uso: es inferior y no debe utilizarse. [48] [5] [49] [6] [4] [50]
Alternativas a la confiabilidad equivalente a tau
Los estudios existentes son prácticamente unánimes en que se oponen a la práctica generalizada de utilizar incondicionalmente para todos los datos. Sin embargo, se dan diferentes opiniones sobre qué coeficiente de confiabilidad debe usarse en lugar de.
Diferentes coeficientes de confiabilidad ocuparon el primer lugar en cada estudio de simulación [45] [13] [6] [46] [47] comparando la precisión de varios coeficientes de confiabilidad. [7]
La opinión mayoritaria es utilizar coeficientes de confiabilidad basados en SEM como alternativa a . [3] [7] [48] [5] [49] [9] [6] [50]
Sin embargo, no hay consenso sobre cuál de los varios coeficientes de confiabilidad basados en SEM (por ejemplo, modelos unidimensionales o multidimensionales) es el mejor para usar.
Alguna gente dice [6] como alternativa, pero muestra información que es completamente diferente a la confiabilidad. es un tipo de coeficiente comparable al de Revelle . [14] [6] No sustituyen, sino que complementan la fiabilidad. [3]
Entre los coeficientes de confiabilidad basados en SEM, los coeficientes de confiabilidad multidimensional rara vez se usan, y el más comúnmente usado es . [3]
Software para coeficientes de confiabilidad basados en SEM
El software estadístico de uso general, como SPSS y SAS, incluye una función para calcular . Usuarios que no conocen la fórmula de no tiene ningún problema en obtener las estimaciones con solo unos pocos clics del mouse.
El software SEM como AMOS, LISREL y MPLUS no tiene una función para calcular los coeficientes de confiabilidad basados en SEM. Los usuarios deben calcular el resultado ingresándolo en la fórmula. Para evitar este inconveniente y posible error, incluso los estudios que informan sobre el uso de SEM se basan enen lugar de coeficientes de confiabilidad basados en SEM. [3] Existen algunas alternativas para calcular automáticamente los coeficientes de confiabilidad basados en SEM.
1) R (gratis): el paquete psych [51] calcula varios coeficientes de fiabilidad.
2) EQS (pagado): [52] Este software SEM tiene una función para calcular coeficientes de confiabilidad.
3) RelCalc (gratis): [3] Disponible con Microsoft Excel.se puede obtener sin necesidad de software SEM. Varios coeficientes de fiabilidad SEM multidimensionales y varios tipos de se puede calcular en función de los resultados del software SEM.
Derivación de la fórmula [3]
Supuesto 1. El puntaje observado de un ítem consiste en el puntaje verdadero del ítem y el error del ítem, que es independiente del puntaje verdadero.
Lema.
Supuesto 2. Los errores son independientes entre sí.
Supuesto 3. (El supuesto de ser esencialmente equivalente a tau) El puntaje verdadero de un ítem consiste en el puntaje verdadero común a todos los ítems y la constante del ítem.
Dejar denotar la suma de las puntuaciones verdaderas del ítem.
La varianza de se llama la verdadera varianza de la puntuación.
Definición. La confiabilidad es la relación entre la varianza de la puntuación real y la varianza de la puntuación observada.
La siguiente relación se establece a partir de los supuestos anteriores.
Por tanto, la matriz de covarianza entre ítems es la siguiente.
Puedes ver eso es igual a la media de las covarianzas entre elementos. Es decir,
Dejar denotar la confiabilidad cuando se satisfacen los supuestos anteriores. es:
Referencias
- ^ Cronbach, Lee J. (1951). "Coeficiente alfa y la estructura interna de pruebas". Psychometrika . Springer Science and Business Media LLC. 16 (3): 297–334. doi : 10.1007 / bf02310555 . hdl : 10983/2196 . ISSN 0033-3123 .
- ^ a b Cronbach, LJ (1978). "Clásicos de citas" (PDF) . Contenidos actuales . 13 : 263.
- ^ a b c d e f g h i j k l m n o p Cho, Eunseong (8 de julio de 2016). "Haciendo confiable la confiabilidad". Métodos de investigación organizacional . Publicaciones SAGE. 19 (4): 651–682. doi : 10.1177 / 1094428116656239 . ISSN 1094-4281 .
- ↑ a b Sijtsma, K. (2009). Sobre el uso, el mal uso y la utilidad muy limitada del alfa de Cronbach. Psychometrika, 74 (1), 107-120. https://doi.org/10.1007/s11336-008-9101-0
- ↑ a b c Green, SB y Yang, Y. (2009). Comentario sobre el coeficiente alfa: una advertencia. Psychometrika, 74 (1), 121-135. https://doi.org/10.1007/s11336-008-9098-4
- ↑ a b c d e f g h Revelle, W. y Zinbarg, RE (2009). Coeficientes alfa, beta, omega y glb: Comentarios sobre Sijtsma. Psychometrika, 74 (1), 145-154. https://doi.org/10.1007/s11336-008-9102-z
- ↑ a b c d e f g h i j k Cho, E. y Kim, S. (2015). Coeficiente alfa de Cronbach: bien conocido pero poco entendido. Métodos de investigación organizacional, 18 (2), 207–230. https://doi.org/10.1177/1094428114555994
- ^ McNeish, D. (2017). Gracias coeficiente alfa, lo tomaremos de aquí. Métodos psicológicos, 23 (3), 412–433. https://doi.org/10.1037/met0000144
- ↑ a b c Raykov, T. y Marcoulides, GA (2017). Gracias coeficiente alfa, ¡todavía te necesitamos! Medición educativa y psicológica, 79 (1), 200–210. https://doi.org/10.1177/0013164417725127
- ↑ a b c d e f Cronbach, LJ (1951). Coeficiente alfa y la estructura interna de pruebas. Psychometrika, 16 (3), 297–334. https://doi.org/10.1007/BF02310555
- ^ a b Cho, E. y Chun, S. (2018), Reparar un reloj roto: una revisión histórica de los creadores de los coeficientes de confiabilidad, incluido el alfa de Cronbach. Survey Research, 19 (2), 23–54.
- ↑ a b c d Guttman, L. (1945). Una base para analizar la fiabilidad test-retest. Psychometrika, 10 (4), 255-282. https://doi.org/10.1007/BF02288892
- ↑ a b c Osburn, HG (2000). Coeficiente alfa y coeficientes de fiabilidad de consistencia interna relacionados. Métodos psicológicos, 5 (3), 343–355. https://doi.org/10.1037/1082-989X.5.3.343
- ↑ a b Revelle, W. (1979). Análisis de conglomerados jerárquicos y estructura interna de las pruebas. Investigación conductual multivariante, 14 (1), 57–74. https://doi.org/10.1207/s15327906mbr1401_4
- ↑ a b Peterson, RA y Kim, Y. (2013). Sobre la relación entre el coeficiente alfa y la fiabilidad compuesta. Revista de psicología aplicada, 98 (1), 194-198. https://doi.org/10.1037/a0030767
- ^ Marrón, W. (1910). Algunos resultados experimentales en la correlación de habilidades mentales. British Journal of Psychology, 3 (3), 296–322. https://doi.org/10.1111/j.2044-8295.1910.tb00207.x
- ^ Spearman, C. (1910). Correlación calculada a partir de datos defectuosos. British Journal of Psychology, 3 (3), 271-295. https://doi.org/10.1111/j.2044-8295.1910.tb00206.x
- ↑ Kelley, TL (1924). Nota sobre la fiabilidad de una prueba: una respuesta a la crítica del Dr. Crum. Revista de psicología de la educación, 15 (4), 193-204. https://doi.org/10.1037/h0072471
- ↑ a b Kuder, GF y Richardson, MW (1937). La teoría de la estimación de la fiabilidad de las pruebas. Psychometrika, 2 (3), 151-160. https://doi.org/10.1007/BF02288391
- ↑ a b c Hoyt, C. (1941). Prueba de confiabilidad estimada por análisis de varianza. Psychometrika, 6 (3), 153-160. https://doi.org/10.1007/BF02289270
- ↑ a b c Jackson, RWB y Ferguson, GA (1941). Estudios de fiabilidad de las pruebas. Boletín del Departamento de Investigación Educativa de la Universidad de Toronto, 12, 132.
- ^ Edgerton, HA y Thomson, KF (1942). Los puntajes de las pruebas se examinan con la relación léxica. Psychometrika, 7 (4), 281–288. https://doi.org/10.1007/BF02288629
- ↑ a b c Gulliksen, H. (1950). Teoría de las pruebas mentales. John Wiley e hijos. https://doi.org/10.1037/13240-000
- ↑ a b c d Cronbach, LJ (1943). Sobre estimaciones de confiabilidad de la prueba. Revista de psicología de la educación, 34 (8), 485–494. https://doi.org/10.1037/h0058608
- ^ Hoyt, CJ (1941). Nota sobre un método simplificado para calcular la confiabilidad de la prueba: Medición educativa y psicológica, 1 (1). https://doi.org/10.1177/001316444100100109
- ^ Novick, MR y Lewis, C. (1967). Coeficiente alfa y fiabilidad de las medidas compuestas. Psychometrika, 32 (1), 1-13. https://doi.org/10.1007/BF02289400
- ↑ a b Cronbach, LJ y Shavelson, RJ (2004). Mis pensamientos actuales sobre el coeficiente alfa y los procedimientos sucesores. Medición educativa y psicológica, 64 (3), 391–418. https://doi.org/10.1177/0013164404266386
- ^ Cortina, JM (1993). ¿Qué es el coeficiente alfa? Un examen de teoría y aplicaciones. Revista de psicología aplicada, 78 (1), 98-104. https://doi.org/10.1037/0021-9010.78.1.98
- ^ Green, SB, Lissitz, RW y Mulaik, SA (1977). Limitaciones del coeficiente alfa como índice de unidimensionalidad de la prueba. Medición educativa y psicológica, 37 (4), 827–838. https://doi.org/10.1177/001316447703700403
- ^ McDonald, RP (1981). La dimensionalidad de las pruebas y los ítems. The British Journal of Mathematical and Statistical Psychology, 34 (1), 100-117. https://doi.org/10.1111/j.2044-8317.1981.tb00621.x
- ^ Schmitt, N. (1996). Usos y abusos del coeficiente alfa. Evaluación psicológica, 8 (4), 350–353. https://doi.org/10.1037/1040-3590.8.4.350
- ^ Ten Berge, JMF y Sočan, G. (2004). El mayor límite inferior de la confiabilidad de una prueba y la hipótesis de unidimensionalidad. Psychometrika, 69 (4), 613–625. https://doi.org/10.1007/BF02289858
- ↑ a b Kopalle, PK y Lehmann, DR (1997). ¿Inflación alfa? El impacto de eliminar los ítems de la escala en el alfa de Cronbach. Comportamiento organizacional y procesos de decisión humana, 70 (3), 189-197. https://doi.org/10.1006/obhd.1997.2702
- ^ Raykov, T. (2007). Fiabilidad si se elimina, no "alfa si se elimina": Evaluación de la confiabilidad de la báscula después de la eliminación del componente. The British Journal of Mathematical and Statistical Psychology, 60 (2), 201-216. https://doi.org/10.1348/000711006X115954
- ↑ a b Nunnally, JC (1967). Teoría psicométrica. Nueva York, NY: McGraw-Hill.
- ↑ a b Nunnally, JC (1978). Teoría psicométrica (2ª ed.). Nueva York, NY: McGraw-Hill.
- ↑ a b Nunnally, JC y Bernstein, IH (1994). Teoría psicométrica (3ª ed.). Nueva York, NY: McGraw-Hill.
- ^ a b Lance, CE, Butts, MM y Michels, LC (2006). ¿Qué dijeron realmente? Métodos de investigación organizacional, 9 (2), 202–220. https://doi.org/10.1177/1094428105284919
- ^ Cho, E. (2020). Una revisión completa del llamado alfa de Cronbach. Journal of Product Research, 38 (1), 9-20.
- ^ Loevinger, J. (1954). La paradoja de la atenuación en la teoría de las pruebas. Psychological Bulletin, 51 (5), 493–504. https://doi.org/10.1002/j.2333-8504.1954.tb00485.x
- ^ Humphreys, L. (1956). La curva normal y la paradoja de la atenuación en la teoría de pruebas. Psychological Bulletin, 53 (6), 472–476. https://doi.org/10.1037/h0041091
- ^ Boyle, GJ (1991). ¿La homogeneidad de los elementos indica consistencia interna o redundancia de elementos en las escalas psicométricas? Personalidad y diferencias individuales, 12 (3), 291-294. https://doi.org/10.1016/0191-8869(91)90115-R
- ^ Streiner, DL (2003). Comenzando por el principio: una introducción al coeficiente alfa y la consistencia interna. Revista de evaluación de la personalidad, 80 (1), 99-103. https://doi.org/10.1207/S15327752JPA8001_18
- ↑ Lee, H. (2017). Metodología de investigación (2ª ed.), Hakhyunsa.
- ↑ a b Kamata, A., Turhan, A. y Darandari, E. (2003). Estimación de la confiabilidad para puntajes de escalas compuestas multidimensionales. Reunión anual de la Asociación Estadounidense de Investigación Educativa, Chicago, abril de 2003, 1 al 27 de abril.
- ↑ a b Tang, W. y Cui, Y. (2012). Un estudio de simulación para comparar tres límites inferiores a la confiabilidad. Documento presentado el 17 de abril de 2012 en la División D de AERA: Metodología de medición e investigación, Sección 1: Medición, psicometría y evaluación de la educación., 1–25.
- ↑ a b van der Ark, LA, van der Palm, DW y Sijtsma, K. (2011). Un enfoque de clase latente para estimar la confiabilidad de la puntuación de la prueba. Medición psicológica aplicada, 35 (5), 380–392. https://doi.org/10.1177/0146621610392911
- ↑ a b Dunn, TJ, Baguley, T. y Brunsden, V. (2014). De alfa a omega: una solución práctica al problema generalizado de la estimación de la consistencia interna. British Journal of Psychology, 105 (3), 399–412. https://doi.org/10.1111/bjop.12046
- ↑ a b Peters, GY (2014). El alfa y el omega de la escala de fiabilidad y validez evaluación integral de la calidad de la escala The European Health Psychologist, 1 (2), 56–69.
- ↑ a b Yang, Y. y Green, SB (2011). Coeficiente alfa: ¿un coeficiente de fiabilidad para el siglo XXI? Revista de evaluación psicoeducativa, 29 (4), 377–392. https://doi.org/10.1177/0734282911406668
- ^ http://personality-project.org/r/overview.pdf
- ^ http://www.mvsoft.com/eqs60.htm
enlaces externos
- Tutorial alfa de SPSS de Cronbach
- La interfaz web gratuita y el paquete R cocron permiten comparar estadísticamente dos o más coeficientes alfa cronbach dependientes o independientes.