Parte de una serie sobre |
Sociología |
---|
|
A escala Likert ( / l ɪ k . Ər t / LIK -ərt [1] o / l aɪ . K ər t / LY -kərt [2] ) es un psicométrica escala comúnmente involucrados en la investigación que emplea cuestionarios . Es el enfoque más utilizado para escalar las respuestas en la investigación de encuestas, de modo que el término (o más completamente la escala tipo Likert ) se usa a menudo indistintamente con escala de calificación , aunque existen otros tipos de escalas de calificación.
La escala lleva el nombre de su inventor, el psicólogo Rensis Likert . [3] Likert distinguió entre una escala propiamente dicha, que surge de las respuestas colectivas a un conjunto de elementos (generalmente ocho o más), y el formato en el que las respuestas se califican en un rango. Técnicamente hablando, una escala Likert se refiere solo a la primera. [4] [5] La diferencia entre estos dos conceptos tiene que ver con la distinción que hizo Likert entre el fenómeno subyacente que se investiga y los medios para capturar la variación que apunta al fenómeno subyacente. [6]
Al responder a un ítem Likert, los encuestados especifican su nivel de acuerdo o desacuerdo en una escala simétrica de acuerdo-en desacuerdo para una serie de afirmaciones. Por lo tanto, el rango captura la intensidad de sus sentimientos por un elemento determinado. [7] Como tal, las escalas Likert han encontrado aplicación en psicología y ciencias sociales, estadística, negocios y marketing. [8]
Se puede crear una escala como la suma simple o el promedio de las respuestas al cuestionario sobre el conjunto de elementos individuales (preguntas). Al hacerlo, la escala Likert asume que las distancias entre cada opción (opción de respuesta) son iguales. Muchos investigadores emplean un conjunto de elementos de este tipo que están altamente correlacionados (que muestran una alta consistencia interna ) pero también que juntos capturarán el dominio completo en estudio (que requiere correlaciones menos que perfectas). Otros mantienen un estándar según el cual "Se supone que todos los elementos son réplicas entre sí o, en otras palabras, los elementos se consideran instrumentos paralelos". [9] : 197 Por el contrario, la teoría de la prueba moderna trata la dificultad de cada elemento (los ICC) como información que se incorporará en los elementos de escala. [10]
Una escala Likert es la suma de las respuestas en varios ítems Likert . Debido a que muchas escalas Likert emparejan cada elemento Likert constituyente con su propia instancia de una escala analógica visual (por ejemplo, una línea horizontal, en la que el sujeto indica una respuesta haciendo un círculo o marcando marcas de verificación), a veces se hace referencia erróneamente a un elemento individual. como ser o tener una escala, con este error creando una confusión generalizada en la literatura y el lenguaje del campo.
Un ítem Likert es simplemente una afirmación que se le pide al encuestado que evalúe dándole un valor cuantitativo en cualquier tipo de dimensión subjetiva u objetiva, siendo el nivel de acuerdo / desacuerdo la dimensión más comúnmente utilizada. Los artículos Likert bien diseñados exhiben tanto "simetría" como "equilibrio". Simetría significa que contienen el mismo número de posiciones positivas y negativas cuyas respectivas distancias son simétricas bilateralmente con respecto al valor "neutral" / cero (se presente o no ese valor como candidato). Equilibrio significa que la distancia entre cada valor candidato es la misma, lo que permite que las comparaciones cuantitativas, como el promedio, sean válidas entre elementos que contienen más de dos valores candidatos. [11]
El formato de un elemento Likert típico de cinco niveles, por ejemplo, podría ser:
La escala Likert es un método de escala bipolar , que mide la respuesta positiva o negativa a una declaración. A veces se utiliza una escala de puntos pares, donde la opción intermedia de "ni de acuerdo ni en desacuerdo" no está disponible. Esto a veces se denomina método de "elección forzada", ya que se elimina la opción neutral. [12] La opción neutral puede verse como una opción fácil de tomar cuando un encuestado no está seguro, por lo que es cuestionable si es una verdadera opción neutral. Un estudio de 1987 encontró diferencias insignificantes entre el uso de "indeciso" y "neutral" como la opción intermedia en una escala Likert de cinco puntos. [13]
Las escalas Likert pueden estar sujetas a distorsiones por varias causas. Los encuestados pueden:
El diseño de una escala con clave equilibrada (un número igual de declaraciones positivas y negativas y, especialmente, un número igual de declaraciones positivas y negativas con respecto a cada posición o tema en cuestión) puede obviar el problema del sesgo de aquiescencia, ya que la aquiescencia en los elementos clave positivamente Equilibrar la aquiescencia en elementos con claves negativas, pero los sesgos defensivos, de tendencia central y de deseabilidad social son algo más problemáticos.
Una vez completado el cuestionario, cada ítem puede analizarse por separado o, en algunos casos, las respuestas de los ítems pueden sumarse para crear una puntuación para un grupo de ítems. Por lo tanto, las escalas Likert a menudo se denominan escalas sumativas.
Si los elementos individuales de Likert pueden considerarse como datos a nivel de intervalo, o si deben tratarse como datos ordenados-categóricos es objeto de un considerable desacuerdo en la literatura, [14] [15] con fuertes convicciones sobre cuáles son los métodos más aplicables . Este desacuerdo se remonta, en muchos aspectos, a la medida en que los elementos de Likert se interpretan como datos ordinales .
Hay dos consideraciones principales en esta discusión. Primero, las escalas Likert son arbitrarias. El valor asignado a un ítem Likert no tiene una base numérica objetiva, ya sea en términos de teoría de medida o escala (a partir de la cual se puede determinar una métrica de distancia ). El valor asignado a cada elemento de Likert lo determina simplemente el investigador que diseña la encuesta, quien toma la decisión en función del nivel de detalle deseado. Sin embargo, por convención, a los elementos Likert se les suele asignar valores enteros positivos progresivos. Las escalas de Likert suelen oscilar entre 2 y 10, siendo 3, 5 o 7 las más comunes. [dieciséis] Además, esta estructura progresiva de la escala es tal que cada elemento Likert sucesivo se trata como si indicara una respuesta "mejor" que el valor anterior. (Esto puede diferir en los casos en que se necesite un orden inverso de la escala Likert).
El segundo punto, y posiblemente más importante, es si la "distancia" entre cada categoría de elementos sucesivos es equivalente, lo que se infiere tradicionalmente. Por ejemplo, en el ítem Likert de cinco puntos anterior, la inferencia es que la 'distancia' entre las categorías 1 y 2 es la misma que entre las categorías 3 y 4. En términos de buenas prácticas de investigación, una presentación equidistante por parte del investigador es importante ; de lo contrario, puede producirse un sesgo en el análisis. Por ejemplo, es poco probable que un elemento Likert de cuatro puntos con las categorías "Pobre", "Promedio", "Bueno" y "Muy bueno" tenga todas las categorías equidistantes, ya que solo hay una categoría que puede recibir una calificación por debajo del promedio. Podría decirse que esto sesgaría cualquier resultado a favor de un resultado positivo. Por otra parte,incluso si un investigador presenta lo que él o ella cree que son categorías equidistantes, es posible que el encuestado no lo interprete como tal.
Una buena escala Likert, como la anterior, presentará una simetría de categorías alrededor de un punto medio con calificadores lingüísticos claramente definidos. En tal escala simétrica, los atributos equidistantes normalmente se observarán más claramente o, al menos, se inferirán. Es cuando una escala Likert es simétrica y equidistante que se comportará más como una medición de nivel de intervalo. Entonces, si bien una escala Likert es de hecho ordinal, si está bien presentado, sin embargo, puede aproximarse a una medición de nivel de intervalo. Esto puede ser beneficioso ya que, si se tratara solo como una escala ordinal, se podría perder información valiosa si la "distancia" entre los elementos de Likert no estuviera disponible para su consideración. La idea importante aquí es que el tipo de análisis apropiado depende de cómo se haya presentado la escala Likert.
Las nociones de tendencia central a menudo son aplicables a nivel de ítem, es decir, las respuestas a menudo muestran una distribución cuasi normal. La validez de tales medidas depende de la naturaleza de intervalo subyacente de la escala. Si se supone una naturaleza de intervalo para una comparación de dos grupos, la prueba t de muestras pareadas no es inapropiada. [5] Si se van a realizar pruebas no paramétricas, se recomienda la modificación de Pratt (1959) [17] a la prueba de rango con signo de Wilcoxon sobre la prueba estándar de rango con signo de Wilcoxon . [5]
Las respuestas a varias preguntas Likert se pueden sumar siempre que todas las preguntas utilicen la misma escala Likert y que la escala sea una aproximación defendible a una escala de intervalo, en cuyo caso el teorema del límite central permite el tratamiento de los datos como datos de intervalo que miden una variable latente. [ cita requerida ] Si las respuestas sumadas cumplen con estos supuestos, se pueden aplicar pruebas estadísticas paramétricas como el análisis de varianza . Los puntos de corte típicos para pensar que esta aproximación será aceptable son un mínimo de cuatro y preferiblemente ocho elementos en la suma. [6] [15]
Para modelar respuestas tipo Likert binarias directamente, se pueden representar en forma binomial sumando las respuestas de acuerdo y en desacuerdo por separado. La chi-cuadrado , la prueba Q de Cochran o la prueba de McNemar son procedimientos estadísticos comunes que se utilizan después de esta transformación. Pruebas no paramétricas como la prueba de chi-cuadrado , la prueba de Mann-Whitney , la prueba de rangos con signo de Wilcoxon o la prueba de Kruskal-Wallis . [18] se utilizan a menudo en el análisis de datos en escala Likert.
Alternativamente, las respuestas de escala Likert se pueden analizar con un modelo probit ordenado , preservando el orden de las respuestas sin la suposición de una escala de intervalo. El uso de un modelo probit ordenado puede evitar errores que surgen cuando se tratan las calificaciones ordenadas como medidas de nivel de intervalo. [19]
La evaluación basada en consenso (CBA) se puede utilizar para crear un estándar objetivo para escalas Likert en dominios donde no existe un estándar objetivo o generalmente aceptado. La evaluación basada en consenso (CBA) se puede utilizar para refinar o incluso validar estándares generalmente aceptados. [ cita requerida ]
Una parte importante del análisis y la presentación de datos es la visualización (o trazado) de datos. El tema de graficar los datos de calificación Likert (y otros) se analiza en detalle en dos artículos de Robbins y Heiberger. [20] En el primero, recomiendan el uso de lo que llaman gráficos de barras apiladas divergentes y los comparan con otros estilos de trazado. El segundo artículo [21] describe el uso de la función Likert en el paquete HH para R y da muchos ejemplos de su uso.
A menudo se cree que las cinco categorías de respuesta representan un nivel de medición de intervalo . Pero este solo puede ser el caso si los intervalos entre los puntos de escala corresponden a observaciones empíricas en un sentido métrico. Reips y Funke (2008) [22] muestran que este criterio se cumple mucho mejor con una escala analógica visual . De hecho, también pueden aparecer fenómenos que incluso cuestionan el nivel de escala ordinal en escalas Likert. [23] Por ejemplo, en un conjunto de elementos A , B , C clasificados con relaciones circulares de escala Likert como A > B , B > C y C > Puede aparecer A. Esto viola el axioma de transitividad para la escala ordinal.
Las investigaciones de Labovitz [24] y Traylor [25] proporcionan evidencia de que, incluso con distorsiones bastante grandes de las distancias percibidas entre los puntos de escala, los ítems de tipo Likert se comportan de cerca a escalas que se perciben como intervalos iguales. Por lo tanto, estos elementos y otras escalas que aparecen en los cuestionarios son robustos a las violaciones del supuesto de igual distancia que muchos investigadores creen que son necesarios para los procedimientos y pruebas estadísticos paramétricos.
Los datos de escala Likert pueden, en principio, usarse como base para obtener estimaciones de nivel de intervalo en un continuo aplicando el modelo politómico de Rasch , cuando se pueden obtener datos que se ajusten a este modelo. Además, el modelo politómico de Rasch permite probar la hipótesis de que las declaraciones reflejan niveles crecientes de una actitud o rasgo, como se pretendía. Por ejemplo, la aplicación del modelo a menudo indica que la categoría neutral no representa un nivel de actitud o rasgo entre las categorías de desacuerdo y de acuerdo.
Nuevamente, no todos los conjuntos de elementos escalados Likert pueden usarse para la medición de Rasch. Los datos deben verificarse minuciosamente para cumplir con los estrictos axiomas formales del modelo. Sin embargo, las puntuaciones brutas son estadísticas suficientes para las medidas de Rasch, una elección deliberada de Georg Rasch , por lo que, si está preparado para aceptar las puntuaciones brutas como válidas, también puede aceptar las medidas de Rasch como válidas.
Rensis Likert , el desarrollador de la escala, pronunció su nombre / l ɪ k . ər t / LIK -ərt '. [26] [27] Algunos han afirmado que el nombre de Likert "es uno de los más pronunciado mal en [el] campo", [28] porque muchas personas pronuncian el nombre de la escala como / l aɪ . k ər t / LY -kərt . [29]