En las ciencias sociales, la escala es el proceso de medir u ordenar entidades con respecto a atributos o rasgos cuantitativos. Por ejemplo, una técnica de escala puede implicar estimar los niveles de extraversión de los individuos o la calidad percibida de los productos. Ciertos métodos de escalado permiten la estimación de magnitudes en un continuo , mientras que otros métodos solo proporcionan el orden relativo de las entidades.
El nivel de medición es el tipo de datos que se miden.
La palabra escala, incluso en la literatura académica, se utiliza a veces para referirse a otra medida compuesta , la de un índice . Sin embargo, esos conceptos son diferentes. [1]
Decisiones de construcción a escala
- ¿Qué nivel ( nivel de medición ) de datos está involucrado ( nominal , ordinal , intervalo o razón )?
- ¿Para qué se utilizarán los resultados?
- ¿Qué se debe utilizar: una escala, un índice o una tipología?
- ¿Qué tipos de análisis estadístico serían útiles?
- Elija utilizar una escala comparativa o una escala no comparativa.
- ¿Cuántas divisiones o categorías de escala deben usarse (1 a 10; 1 a 7; −3 a +3)?
- ¿Debería haber un número par o impar de divisiones? (Impar da un valor de centro neutral; incluso obliga a los encuestados a tomar una posición no neutral).
- ¿Cuál debería ser la naturaleza y el carácter descriptivo de las etiquetas de las escalas?
- ¿Cuál debería ser la forma física o el diseño de la escala? (gráfico, lineal simple, vertical, horizontal)
- ¿Debe forzarse una respuesta o dejarse opcional?
Método de construcción a escala
Es posible que ya exista algo similar a la escala de uno, por lo que incluir esas escalas y posibles variables dependientes en la encuesta de uno puede aumentar la validez de la escala de uno.
- Comience generando al menos diez elementos para representar cada una de las escalas. Administrar la encuesta; cuanto más representativa y grande sea la muestra, más confianza se tendrá en las escalas.
- Revise las medias y las desviaciones estándar de los elementos, descartando los elementos con medias sesgadas o varianza muy baja.
- Ejecute un análisis de componentes principales con rotación oblicua en los elementos de uno y los otros elementos para escalas; será importante diferenciarlos de los propios. Solicite componentes con valores propios (para calcular el valor propio para cada factor, cuadre las cargas del factor y sume las columnas) mayores que 1. Es más fácil agrupar los elementos por escalas específicas. Cuanto más distintos sean los demás elementos, mayores serán las posibilidades de que los elementos se carguen solo en la propia escala.
- Los “artículos cargados limpiamente” son aquellos que cargan al menos .40 en un componente y más de .10 más en ese componente que en cualquier otro. Identifique esos.
- Los "artículos con carga cruzada" son aquellos que no cumplen con el criterio anterior. Estos son candidatos a abandonar.
- Identifique componentes con solo unos pocos elementos que no representan conceptos claros, se trata de "escalas no interpretables". También identifique cualquier componente con un solo artículo. Estos componentes y sus elementos son candidatos a descartarse.
- Mire los candidatos a descartar y los componentes a descartar. ¿Hay algo que deba retenerse porque es fundamental para la propia construcción ? Por ejemplo, si un artículo de importancia conceptual solo cruza las cargas de un componente que se va a soltar, es bueno conservarlo para la siguiente ronda.
- Suelta los elementos y vuelve a ejecutar pidiendo al programa que le dé a uno solo el número de componentes después de descartar los que no se pueden interpretar y los de un solo elemento. Vuelva a realizar el proceso a partir del paso 3.
- Siga ejecutando el proceso hasta obtener "factores limpios" (todos los componentes tienen elementos cargados limpiamente).
- Ejecute el programa Alpha (preguntando por Alphas si se descarta cada elemento). Todas las escalas con alfa insuficientes deben descartarse y el proceso debe repetirse desde el Paso 3. [ Coeficiente alfa = número de elementos 2 x correlación promedio entre diferentes elementos / suma de todas las correlaciones en la matriz de correlación (incluidos 1) ]
- Para mejores prácticas, mantenga los componentes finales y todas las cargas suyas y escalas similares seleccionadas para ser utilizadas en el Apéndice de la propia escala.
Tipos de datos
El tipo de información recopilada puede influir en la construcción de la escala. Los diferentes tipos de información se miden de diferentes formas.
- Algunos datos se miden a nivel nominal . Es decir, los números utilizados son meras etiquetas; no expresan propiedades matemáticas. Algunos ejemplos son los códigos de inventario SKU y los códigos de barras UPC.
- Algunos datos se miden a nivel ordinal . Los números indican la posición relativa de los elementos, pero no la magnitud de la diferencia. Un ejemplo es una clasificación de preferencias.
- Algunos datos se miden a nivel de intervalo . Los números indican la magnitud de la diferencia entre los elementos, pero no hay un punto cero absoluto. Algunos ejemplos son las escalas de actitud y las escalas de opinión.
- Algunos datos se miden a nivel de razón . Los números indican la magnitud de la diferencia y hay un punto cero fijo. Se pueden calcular las proporciones. Los ejemplos incluyen: edad, ingresos, precio, costos, ingresos por ventas, volumen de ventas y participación de mercado.
Medidas compuestas
Las medidas compuestas de variables se crean combinando dos o más indicadores empíricos separados en una sola medida. Las medidas compuestas miden conceptos complejos de manera más adecuada que los indicadores individuales, amplían el rango de puntajes disponibles y son más eficientes en el manejo de múltiples elementos.
Además de las escalas, existen otros dos tipos de medidas compuestas. Los índices son similares a las escalas, excepto que varios indicadores de una variable se combinan en una sola medida. El índice de confianza del consumidor, por ejemplo, es una combinación de varias medidas de las actitudes del consumidor. Una tipología es similar a un índice, excepto que la variable se mide a nivel nominal .
Los índices se construyen acumulando puntuaciones asignadas a atributos individuales, mientras que las escalas se construyen mediante la asignación de puntuaciones a patrones de atributos.
Si bien los índices y las escalas proporcionan medidas de una sola dimensión , a menudo se emplean tipologías para examinar la intersección de dos o más dimensiones. Las tipologías son herramientas analíticas muy útiles y se pueden utilizar fácilmente como variables independientes , aunque al no ser unidimensionales es difícil utilizarlas como variable dependiente .
Escala comparativa y no comparativa
Con la escala comparativa , los elementos se comparan directamente entre sí (ejemplo: ¿Se prefiere Pepsi o Coca - Cola ?). En la escala no comparativa, cada elemento se escala independientemente de los demás. (Ejemplo: ¿Cómo se siente uno con respecto a Coca-Cola?)
Técnicas de escala comparativa
- Escala de comparación por pares : a un encuestado se le presentan dos elementos a la vez y se le pide que seleccione uno (ejemplo: ¿se prefiere Pepsi o Coca-Cola?). Esta es una técnica de nivel ordinal cuando no se aplica un modelo de medición. Krus y Kennedy (1977) elaboraron la escala de comparación pareada dentro de su modelo de dominio referenciado. El modelo de Bradley-Terry-Luce (BTL) (Bradley y Terry, 1952; Luce, 1959) se puede aplicar para derivar medidas siempre que los datos derivados de comparaciones pareadas posean una estructura apropiada. La ley de Thurstone del juicio comparativo también se puede aplicar en tales contextos.
- Escala del modelo de Rasch : los encuestados interactúan con los elementos y las comparaciones se infieren entre los elementos a partir de las respuestas para obtener los valores de la escala. Posteriormente, los encuestados también se escalan en función de sus respuestas a los elementos dados los valores de la escala del elemento. El modelo Rasch tiene una estrecha relación con el modelo BTL.
- Orden de clasificación: a un encuestado se le presentan varios elementos simultáneamente y se le pide que los clasifique (ejemplo: Califique los siguientes anuncios del 1 al 10). Esta es una técnica de nivel ordinal.
- Escala de distancia social de Bogardus : mide el grado en que una persona está dispuesta a asociarse con una clase o tipo de personas. Pregunta qué tan dispuesto está el encuestado a hacer varias asociaciones. Los resultados se reducen a una sola puntuación en una escala. También hay versiones no comparativas de esta escala.
- Q-Sort : hasta 140 elementos se clasifican en grupos según el procedimiento de orden de clasificación.
- Escala de Guttman : este es un procedimiento para determinar si un conjunto de elementos se puede ordenar por rango en una escala unidimensional. Utiliza la estructura de intensidad entre varios indicadores de una variable dada. Las declaraciones se enumeran en orden de importancia. La calificación se escala sumando todas las respuestas hasta la primera respuesta negativa en la lista. La escala de Guttman está relacionada con la medición de Rasch; específicamente, los modelos de Rasch traen el enfoque de Guttman dentro de un marco probabilístico.
- Escala de suma constante : a un encuestado se le da una suma constante de dinero, guión, créditos o puntos y se le pide que los asigne a varios artículos (ejemplo: si uno tuviera 100 yenes para gastar en productos alimenticios, ¿cuánto gastaría en el producto A? , sobre el producto B, sobre el producto C, etc.). Esta es una técnica de nivel ordinal.
- Escala de estimación de magnitud : en unprocedimiento psicofísico inventado por SS Stevens, la gente simplemente asigna números a la dimensión del juicio. La media geométrica de esos números generalmente produce una ley de potencia con un exponente característico. En la coincidencia de modalidades cruzadas en lugar de asignar números, las personas manipulan otra dimensión, como el volumen o el brillo para hacer coincidir los elementos. Normalmente, el exponente de la función psicométrica se puede predecir a partir de los exponentes de estimación de magnitud de cada dimensión.
Técnicas de escalado no comparativas
- Escala analógica visual (también llamada escala de calificación continua y escala de calificación gráfica): los encuestados califican los elementos colocando una marca en una línea. La línea suele estar etiquetada en cada extremo. A veces hay una serie de números, llamados puntos de escala, (digamos, de cero a 100) debajo de la línea. La puntuación y la codificación son difíciles para las escalas de lápiz y papel, pero no para las escalas analógicas visuales computarizadas y basadas en Internet. [2]
- Escala Likert : se les pide a los encuestados que indiquen el grado de acuerdo o desacuerdo (de muy de acuerdo a muy en desacuerdo) en una escala de respuesta de cinco a nueve puntos (que no debe confundirse con una escala Likert). Se utiliza el mismo formato para varias preguntas. Es la combinación de estas preguntas lo que forma la escala Likert. Este procedimiento de escala categórica se puede extender fácilmente a unprocedimiento de estimación de magnitud que utiliza la escala completa de números en lugar de categorías verbales.
- Escalas de finalización de frases : se les pide a los encuestados que completen una frase en una escala de respuesta de 11 puntos en la que 0 representa la ausencia del constructo teórico y 10 representa la cantidad máxima teorizada del constructo que se está midiendo. Se utiliza el mismo formato básico para varias preguntas.
- Escala diferencial semántica : se pide a los encuestados que califiquen en una escala de 7 puntos un elemento en varios atributos. Cada atributo requiere una escala con etiquetas de terminal bipolar.
- Escala de Stapel : esta es una escala de calificación unipolar de diez puntos. Va de +5 a −5 y no tiene un punto cero neutro.
- Escala de Thurstone : esta es una técnica de escalado que incorpora la estructura de intensidad entre los indicadores.
- Escala derivada matemáticamente : los investigadores infieren las evaluaciones de los encuestados matemáticamente. Dos ejemplos son el escalado multidimensional y el análisis conjunto .
Evaluación de escala
Las escalas deben probarse para determinar su confiabilidad , generalización y validez . La generalizabilidad es la capacidad de hacer inferencias de una muestra a la población, dada la escala que uno ha seleccionado. La confiabilidad es la medida en que una escala producirá resultados consistentes. La confiabilidad test-retest comprueba qué tan similares son los resultados si la investigación se repite en circunstancias similares. La confiabilidad de las formas alternativas verifica qué tan similares son los resultados si la investigación se repite utilizando diferentes formas de la escala. La confiabilidad de la consistencia interna verifica qué tan bien las medidas individuales incluidas en la escala se convierten en una medida compuesta.
Las escalas y los índices deben validarse. La validación interna verifica la relación entre las medidas individuales incluidas en la escala y la escala compuesta en sí. La validación externa verifica la relación entre la escala compuesta y otros indicadores de la variable, indicadores no incluidos en la escala. La validación de contenido (también llamada validez aparente) verifica qué tan bien mide la escala lo que se supone que debe medir. La validación de criterios comprueba qué tan significativos son los criterios de escala en relación con otros criterios posibles. La validación de construcción comprueba qué construcción subyacente se está midiendo. Hay tres variantes de validez de constructo . Son validez convergente , validez discriminante y validez nomológica (Campbell y Fiske, 1959; Krus y Ney, 1978). El coeficiente de reproducibilidad indica qué tan bien se pueden reconstruir los datos de las medidas individuales incluidas en la escala a partir de la escala compuesta.
Ver también
- Escala de valoración
- Nivel de medida
- Investigación social
- Márketing
- Investigación de mercado
- Investigación cuantitativa de mercados
- Ley de potencia
- Psicofísica
Referencias
- ^ Earl Babbie (1 de enero de 2012). La práctica de la investigación social . Aprendizaje Cengage. pag. 162. ISBN 1-133-04979-6.
- ^ U.-D. Reips y F. Funke (2008) "Medición de nivel de intervalo con escalas analógicas visuales en la investigación basada en Internet: VAS Generator". doi : 10.3758 / BRM.40.3.699
Otras lecturas
- DeVellis, Robert F (2003), Scale Development: Theory and Applications (2a ed.), Londres: Publicaciones SAGE , ISBN 0-7619-2604-6, consultado el 11 de agosto de 2010 Libro de bolsillo ISBN 0-7619-2605-4
- Lodge, Milton (1981), Escala de magnitud: medición cuantitativa de opiniones , Beverly Hills y Londres: Publicaciones SAGE, ISBN 0-8039-1747-3
- McIver, John P. y Carmines, Edward G (1981), Escala unidimensional , Beverly Hills y Londres: Publicaciones SAGE, ISBN 0-8039-1736-8, consultado el 11 de agosto de 2010
- Bradley, RA y Terry, ME (1952): Análisis de rango de diseños de bloques incompletos, I. el método de comparaciones por pares . Biometrika, 39, 324–345.
- Campbell, DT & Fiske, DW (1959) Validación convergente y discriminante mediante la matriz de múltiples métodos y retratos. Psychological Bulletin, 56, 81-105.
- Hodge, DR y Gillespie, DF (2003). Complementos de frases: una alternativa a las escalas Likert. Investigación sobre trabajo social, 27 (1), 45–55.
- Hodge, DR y Gillespie, DF (2005). Escalas de finalización de frases. En K. Kempf-Leonard (Editor). Enciclopedia de medición social. (Vol. 3, págs. 53-62). San Diego: Prensa académica.
- Krus, DJ y Kennedy, PH (1977) Escalado normal de matrices de dominancia: el modelo de dominio referenciado. Medición educativa y psicológica, 37, 189-193 (Solicitar reimpresión).
- Krus, DJ y Ney, RG (1978) Validez convergente y discriminante en el análisis de ítems. Medición educativa y psicológica, 38, 135-137 (Solicitar reimpresión).
- Luce, RD (1959): Comportamientos de elección individual: un análisis teórico . Nueva York: J. Wiley.
enlaces externos
- Manual de escalas de gestión: métricas de varios elementos que se utilizarán en la investigación, Wikilibros