En el análisis de observaciones multivariadas diseñadas para evaluar sujetos con respecto a un atributo, una Escala de Guttman (llamada así por Louis Guttman ) es una escala ordinal única (unidimensional) para la evaluación del atributo, a partir de la cual se pueden reproducir las observaciones originales. El descubrimiento de una escala de Guttman en los datos depende de que su distribución multivariante se ajuste a una estructura particular (ver más abajo). Por tanto, una escala de Guttman es una hipótesissobre la estructura de los datos, formulados con respecto a un atributo específico y una población específica y no pueden construirse para ningún conjunto dado de observaciones. Contrariamente a la creencia generalizada, una escala de Guttman no se limita a variables dicotómicas y no necesariamente determina un orden entre las variables. Pero si todas las variables son dicotómicas, las variables de hecho están ordenadas por su sensibilidad al registrar el atributo evaluado, como se ilustra en el Ejemplo 1.
Modelo determinista
Ejemplo 1: Variables dicotómicas
Se puede formular la hipótesis de una escala de Guttman para las siguientes cinco preguntas que se refieren al atributo "aceptación del contacto social con inmigrantes" (basado en la escala de distancia social de Bogardus ), presentado a una población adecuada:
- ¿Aceptaría inmigrantes como residentes en su país? (No = 0; Sí = 1)
- ¿Aceptaría inmigrantes como residentes en su ciudad? (No = 0; Sí = 1)
- ¿Aceptaría inmigrantes como residentes en su vecindario? (No = 0; Sí = 1)
- ¿Aceptaría a los inmigrantes como vecinos de al lado? (No = 0; Sí = 1)
- ¿Aceptaría a un inmigrante como cónyuge de su hijo? (No = 0; Sí = 1)
Una respuesta positiva de un encuestado en particular a cualquier pregunta de esta lista sugiere respuestas positivas de ese encuestado a todas las preguntas anteriores de esta lista. Por lo tanto, se podría esperar obtener solo las respuestas enumeradas en la parte sombreada (columnas 1-5) de la Tabla 1.
![Table 1.](http://wikiimg.tojsiabtv.com/wikipedia/commons/0/03/Guttman_Scale-Illustration_w_dichotomous_items.jpg)
Cada fila en la parte sombreada de la Tabla 1 (columnas 1-5) es el perfil de respuesta de cualquier número (≥ 0) de encuestados. Todos los perfiles de esta tabla indican la aceptación de inmigrantes en todos los sentidos indicados por el perfil anterior, más un sentido adicional en el que se aceptan inmigrantes. Si, en un gran número de observaciones, solo se observan los perfiles enumerados en la Tabla 1, entonces se apoya la Hipótesis de la Escala de Guttman, y los valores de la Escala (última columna de la Tabla 1) tienen las siguientes propiedades:
- Valoran la fuerza del atributo "aceptación del contacto social con inmigrantes";
- Reproducen las observaciones originales. (Por ejemplo, la puntuación de la escala de un encuestado de 2 implica que ese encuestado respondió positivamente a las preguntas 1 y 2 y negativamente a las preguntas 3, 4 y 5.)
La escala de Guttman, si está respaldada por datos, es útil para evaluar de manera eficiente a los sujetos (encuestados, examinados o cualquier colección de objetos investigados) en una escala unidimensional con respecto al atributo especificado. Normalmente, las escalas de Guttman se encuentran con respecto a los atributos que se definen de forma estricta.
Mientras que otras técnicas de escala (por ejemplo, escala Likert) producen una escala única sumando las puntuaciones de los encuestados, un procedimiento que asume, a menudo sin justificación, que todas las variables observadas tienen pesos iguales, la escala de Guttman evita ponderar las variables observadas; así, "respetando" los datos por lo que son. Si se confirma una escala de Guttman, la medición del atributo es intrínsecamente unidimensional; la unidimensionalidad no está forzada por la suma o el promedio. Esta característica lo hace apropiado para la construcción de teorías científicas replicables y mediciones significativas, como se explica en Facet Theory.
Variables ordinales
Dado un conjunto de datos de N sujetos observados con respecto a n variables ordinales, cada una con un número finito (≥2) de categorías numéricas ordenadas por fuerza creciente de un atributo preespecificado, sea a ij la puntuación obtenida por el sujeto i en la variable j , y definir la lista de puntajes que obtuvo el sujeto i sobre las n variables, ai = a i1 … a in , para que sea el perfil del sujeto i . (El número de categorías puede ser diferente en diferentes variables; y el orden de las variables en los perfiles no es importante, pero debe ser fijo).
Definir:
Dos perfiles, a s y a t son iguales , denotados a s = a t , si f a sj = a tj para todo j = 1… n
El perfil a s es mayor que el perfil a t , denotado a s > a t , si f a sj ≥ a tj para todo j = 1… n y a sj ' > a tj' para al menos una variable, j ' .
Los perfiles a s y a t son comparables , denotados a s Sa t , sif a s = a t ; o a s > a t ; o a t > a s
Los perfiles a s y a t son incomparables , denotados a s $ a t , si si no son comparables (es decir, para al menos una variable, j ' , a sj' > a tj ' y para al menos otra variable , j '' , a tj '' > a sj '' .
Para conjuntos de datos donde las categorías de todas las variables están ordenadas numéricamente de manera similar (de mayor a menor o de menor a mayor) con respecto a un atributo dado, la escala de Guttman se define simplemente así:
Definición: La escala de Guttman es un conjunto de datos en el que todos los pares de perfiles son comparables.
Ejemplo: variables no dicotómicas
Considere las siguientes cuatro variables que evalúan las habilidades aritméticas entre una población P de alumnos:
V1: ¿Puede el alumno (p) realizar la suma de números? No = 1; Sí, pero solo de números de dos dígitos = 2; Sí = 3.
V2: ¿Conoce el alumno (p) la tabla de multiplicar (1-10)? No = 1; Sí = 2.
V3: ¿Puede el alumno (p) realizar la multiplicación de números? No = 1; Sí, pero solo de números de dos dígitos = 2; Sí = 3.
V4: ¿Puede el alumno (p) realizar una división larga? No = 1; Sí = 2.
Se puede plantear la hipótesis de que los datos recopilados para las cuatro variables anteriores entre una población de niños en edad escolar exhiben la Escala de Guttman que se muestra a continuación en la Tabla 2:
Tabla 2. Los datos de las cuatro variables ordinales de habilidad aritmética se hipotetizan para formar una escala de Guttman
V 1 | V 2 | V 3 | V 4 | Posible Puntuación de escala |
1 | 1 | 1 | 1 | 4 |
2 | 1 | 1 | 1 | 5 |
2 | 2 | 1 | 1 | 6 |
3 | 2 | 1 | 1 | 7 |
3 | 2 | 2 | 1 | 8 |
3 | 2 | 3 | 1 | 9 |
3 | 2 | 3 | 2 | 10 |
El conjunto de perfiles que se plantea como hipótesis (parte sombreada en la Tabla 2) ilustra la característica definitoria de la Escala de Guttman, a saber, que cualquier par de perfiles son comparables. También aquí, si se confirma la hipótesis, una única puntuación de escala reproduce las respuestas de un sujeto en todas las variables observadas.
Cualquier conjunto ordenado de números podría servir como escala. En esta ilustración, elegimos la suma de las puntuaciones de los perfiles. Según la teoría de la faceta, solo en los datos que se ajustan a una escala de Guttman tal suma puede estar justificada.
Reproducibilidad
En la práctica, las escalas de Guttman perfectas ("deterministas") son raras, pero aproximadas, se han encontrado en poblaciones específicas con respecto a atributos tales como prácticas religiosas, dominios de conocimiento estrictamente definidos, habilidades específicas y propiedad de electrodomésticos. [1] Cuando los datos no se ajustan a una Escala de Guttman, pueden representar una Escala de Guttman con ruido (y tratada estocásticamente [1] ), o pueden tener una estructura más compleja que requiere escalas múltiples para identificar las escalas intrínsecas a ellos.
El grado en el que un conjunto de datos se ajusta a una escala de Guttman se puede estimar a partir del coeficiente de reproducibilidad [2] [3] del cual existen algunas versiones, dependiendo de las suposiciones y limitaciones estadísticas. La definición original de Guttman del coeficiente de reproducibilidad, C R es simplemente 1 menos la relación entre el número de errores y el número de entradas en el conjunto de datos. Y, para garantizar que haya una variedad de respuestas (no es el caso si todos los encuestados solo respaldaron un elemento), se utiliza el coeficiente de escalabilidad. [4]
En la escala de Guttman se encuentran los inicios de la teoría de la respuesta al ítem que, a diferencia de la teoría clásica de las pruebas , reconoce que no todos los ítems de los cuestionarios tienen el mismo nivel de dificultad. Se han desarrollado modelos no deterministas (es decir, estocásticos) como la escala de Mokken y el modelo de Rasch . La escala de Guttman se ha generalizado a la teoría y los procedimientos de escala múltiple que identifica el número mínimo de escalas necesarias para una reproducibilidad satisfactoria.
Como procedimiento que vincula los contenidos sustantivos con los aspectos lógicos de los datos, la escala de Guttman anunció el advenimiento de la teoría de facetas desarrollada por Louis Guttman y sus asociados.
Escala de Guttman en variables cualitativas
La definición original de Guttman [3] de una Escala permite también el análisis exploratorio de escala de variables cualitativas (variables nominales o variables ordinales que no necesariamente pertenecen a un atributo común preespecificado). Esta definición de escala de Guttman se basa en la definición previa de una función simple .
Para un conjunto X totalmente ordenado , digamos, 1,2,…, m , y otro conjunto finito, Y , con k elementos k ≤ m , una función de X a Y es una función simple si X se puede dividir en k intervalos que están en una correspondencia de uno a uno con los valores de Y .
Entonces, se puede definir una escala de Guttman para un conjunto de datos de n variables, con la j- ésima variable teniendo k j categorías (cualitativas, no necesariamente ordenadas), por lo tanto:
Definición: La escala de Guttman es un conjunto de datos para el cual existe una variable ordinal, X , con un número finito m de categorías, digamos, 1,…, m con m ≥ max j ( k j ) y una permutación de los perfiles de los sujetos tales que cada variable en el conjunto de datos es una función simple de X .
A pesar de su aparente elegancia y atractivo para la investigación exploratoria, esta definición no ha sido suficientemente estudiada o aplicada.
Referencias
- ^ a b Coombs, Clyde; Coombs, Lolagene; Lingoes, James (1978). "Capítulo 11: Escalas acumulativas estocásticas". En Shye, Samuel (ed.). Construcción de teoría y análisis de datos en las ciencias del comportamiento . San Francisco: Jossey-Bass. págs. 280-298. ISBN 0-87589-379-1.
- ^ Stouffer, SA, Guttman, L., Suchman, EA, Lazarsfeld, PF, Star, SA, Clausen, JA (1950) Medición y predicción Princeton University Press
- ^ a b Guttman, Louis (1944). "Una base para escalar datos cualitativos". American Sociological Review . 9 (2): 139-150. doi : 10.2307 / 2086306 . JSTOR 2086306 .
- ^ Menzel, H. (1953) Un nuevo coeficiente para el análisis de escalograma en Educational and Public Opinion Quarterly Volume: 15 número: 2, página (s): 268-280
Otras lecturas
1. Coombs, CH, Coombs, LC y Lingoes, JC (1978). Escalas acumulativas estocásticas. En S. Shye (Ed.), Construcción de teoría y análisis de datos en las ciencias del comportamiento. San Francisco : Jossey-Bass.
2. Goodman, LA (1975). Un nuevo modelo para escalar patrones de respuesta: una aplicación del concepto de cuasi-independencia. Revista de la Asociación Estadounidense de Estadística, 70, 755–768.
3. Guttman, L. (1944). Una base para escalar datos cualitativos. American Sociological Review, 9 , 139-150.
4. Green, BF (1956). Un método de análisis de escalogramas que utiliza estadísticas resumidas. Psychometrika, 21 , 79-88.