El modelo de Rasch politómico es una generalización del modelo de Rasch dicotómico . Es un modelo de medición que tiene aplicación potencial en cualquier contexto en el que el objetivo sea medir un rasgo o habilidad a través de un proceso en el que las respuestas a los ítems se puntúan con números enteros sucesivos . Por ejemplo, el modelo es aplicable al uso de escalas Likert , escalas de calificación y a ítems de evaluación educativa para los cuales los puntajes enteros sucesivamente más altos están destinados a indicar niveles crecientes de competencia o logro.
Antecedentes y descripción general
El modelo politómico de Rasch fue derivado por Andrich (1978), posterior a las derivaciones de Rasch (1961) y Andersen (1977), mediante la resolución de términos relevantes de una forma general del modelo de Rasch en parámetros de umbral y discriminación . Cuando se derivó el modelo, Andrich se centró en el uso de escalas Likert en psicometría , tanto con fines ilustrativos como para ayudar en la interpretación del modelo.
El modelo a veces se denomina Modelo de escala de calificación cuando (i) los elementos tienen el mismo número de umbrales y (ii) a su vez, la diferencia entre cualquier ubicación de umbral dada y la media de las ubicaciones de umbral es igual o uniforme en todos los elementos. Sin embargo, este es un nombre potencialmente engañoso para el modelo porque su aplicación es mucho más general que las llamadas escalas de calificación. En ocasiones, el modelo también se denomina modelo de crédito parcial , especialmente cuando se aplica en contextos educativos. El modelo de crédito parcial (Masters, 1982) tiene una forma algebraica idéntica pero se derivó de un punto de partida diferente en un momento posterior y se interpreta de una manera algo diferente. El modelo de crédito parcial también permite diferentes umbrales para diferentes artículos. Aunque este nombre para el modelo se usa a menudo, Andrich (2005) proporciona un análisis detallado de problemas asociados con elementos del enfoque de Masters, que se relacionan específicamente con el tipo de proceso de respuesta que es compatible con el modelo, y con situaciones empíricas en las que las estimaciones de las ubicaciones de los umbrales están desordenadas. Estos temas se discuten en la elaboración del modelo que sigue.
El modelo es un modelo de medición probabilístico general que proporciona una base teórica para el uso de puntuaciones enteras secuenciales, de una manera que preserva la propiedad distintiva que define los modelos de Rasch: específicamente, las puntuaciones brutas totales son estadísticas suficientes para los parámetros de los modelos. Consulte el artículo principal del modelo Rasch para la elaboración de esta propiedad. Además de preservar esta propiedad, el modelo permite una prueba empírica rigurosa de la hipótesis de que las categorías de respuesta representan niveles crecientes de un atributo o rasgo latente, por lo que están ordenadas. La razón por la que el modelo proporciona una base para probar esta hipótesis es que es empíricamente posible que los umbrales no muestren el orden previsto.
En esta forma más general del modelo de Rasch para datos dicotómicos, la puntuación en un elemento en particular se define como el recuento del número de ubicaciones de umbral en el rasgo latente superado por el individuo. Esto no significa que un proceso de medición implique hacer tales recuentos en un sentido literal; más bien, las ubicaciones de los umbrales en un continuo latente generalmente se infieren de una matriz de datos de respuesta a través de un proceso de estimación como la estimación de máxima verosimilitud condicional . En general, la característica central del proceso de medición es que los individuos se clasifican en un conjunto de categorías ordenadas contiguas o contiguas. Un formato de respuesta empleado en un contexto experimental dado puede lograr esto de varias maneras. Por ejemplo, los encuestados pueden elegir una categoría que perciben que captura mejor su nivel de respaldo a una declaración (como 'totalmente de acuerdo'), los jueces pueden clasificar a las personas en categorías basadas en criterios bien definidos, o una persona puede clasificar un estímulo físico basado sobre la similitud percibida con un conjunto de estímulos de referencia.
El modelo politómico de Rasch se especializa en el modelo de datos dicotómicos cuando las respuestas se pueden clasificar en solo dos categorías. En este caso especial, la dificultad del objeto y el umbral (único) son idénticos. El concepto de umbral se desarrolla en la siguiente sección.
El modelo de Polytomous Rasch
Primero, deja
ser una variable aleatoria entera dondees la puntuación máxima para el ítem i . Es decir, la variable es una variable aleatoria que puede tomar valores enteros entre 0 y un máximo de .
En el modelo politómico de Rasch (Andrich, 1978), la probabilidad del resultado es
dónde es la k- ésima ubicación del umbral del elemento i en un continuo latente,es la ubicación de la persona n en el mismo continuo, yes la puntuación máxima para el ítem i . Estas ecuaciones son las mismas que
donde el valor de se elige por conveniencia computacional que es: .
El modelo de escala de calificación
De manera similar, el modelo de "Escala de calificación" de Rasch (Andrich, 1978) es
dónde es la dificultad de elemento i yes la ubicación del umbral k de la escala de calificación que es común a todos los elementos. m es la puntuación máxima y es idéntica para todos los ítems. se elige por conveniencia computacional.
Solicitud
Aplicado en un contexto empírico dado, el modelo puede considerarse una hipótesis matemática de que la probabilidad de un resultado dado es una función probabilística de estos parámetros de persona e ítem. El gráfico que muestra la relación entre la probabilidad de una categoría determinada en función de la ubicación de la persona se denomina Curva de probabilidad de categoría (CPC). En la Figura 1 se muestra un ejemplo de las CPC para un artículo con cinco categorías, puntuadas de 0 a 4.
Un umbral dado divide el continuo en regiones por encima y por debajo de su ubicación. El umbral se corresponde con la ubicación en un continuo latente en el que es igualmente probable que una persona sea clasificada en categorías adyacentes y, por lo tanto, obtenga una de dos puntuaciones sucesivas. El primer umbral del elemento i ,, es la ubicación en el continuo en la que una persona tiene la misma probabilidad de obtener una puntuación de 0 o 1, el segundo umbral es la ubicación en la que una persona tiene la misma probabilidad de obtener una puntuación de 1 y 2, y así sucesivamente. En el ejemplo que se muestra en la Figura 1, las ubicaciones de los umbrales son -1,5, -0,5, 0,5 y 1,5 respectivamente.
Los encuestados pueden obtener puntajes de muchas formas diferentes. Por ejemplo, cuando se emplean formatos de respuesta Likert, se puede asignar 0 a Totalmente en desacuerdo , En desacuerdo a 1, De acuerdo a 2 y Totalmente de acuerdo a 3. En el contexto de la evaluación en psicología educativa , se pueden otorgar puntuaciones enteras sucesivamente más altas de acuerdo con criterios o descripciones que caracterizan niveles crecientes de logro en un dominio específico, como la comprensión lectora. La característica común y central es que algún proceso debe resultar en la clasificación de cada individuo en una de un conjunto de categorías ordenadas que comprenden colectivamente un elemento de evaluación.
Elaboración del modelo
Al desarrollar las características del modelo, Andrich (2005) aclara que su estructura implica un proceso de clasificación simultáneo , que da como resultado una única respuesta manifiesta , e involucra una serie de respuestas latentes dicotómicas. Además, las respuestas dicotómicas latentes operan dentro de una estructura de Guttman y el espacio de respuesta asociado, como se caracteriza a continuación.
Dejar
ser un conjunto de variables aleatorias dicotómicas independientes. Andrich (1978, 2005) muestra que el modelo politómico de Rasch requiere que estas respuestas dicotómicas se ajusten a un subespacio de respuesta de Guttman latente:
en el que x unos van seguidos de mx ceros. Por ejemplo, en el caso de dos umbrales, los patrones permitidos en este subespacio de respuesta son:
donde la puntuación entera x implicada por cada patrón (y viceversa) es como se muestra. La razón por la que este subespacio está implícito en el modelo es la siguiente. Dejar
ser la probabilidad de que y deja . Esta función tiene la estructura del modelo de Rasch para datos dicotómicos. A continuación, considere la siguiente probabilidad condicional en el caso de dos umbrales:
Se puede demostrar que esta probabilidad condicional es igual a
que, a su vez, es la probabilidad dado por el modelo politómico de Rasch. A partir del denominador de estas ecuaciones, se puede ver que la probabilidad en este ejemplo está condicionada a patrones de respuesta de o . Por tanto, es evidente que, en general, el subespacio de respuesta, como se definió anteriormente, es intrínseco a la estructura del modelo politómico de Rasch. Esta restricción en el subespacio es necesaria para justificar la puntuación entera de las respuestas: es decir, tal que la puntuación sea simplemente el recuento de umbrales ordenados superados. Andrich (1978) mostró que la igualdad de discriminación en cada uno de los umbrales también es necesaria para esta justificación.
En el modelo politómico de Rasch, una puntuación de x en un elemento dado implica que un individuo ha superado simultáneamente x umbrales por debajo de una determinada región en el continuo, y no ha superado los restantes m - x umbrales por encima de esa región. Para que esto sea posible, los umbrales deben estar en su orden natural, como se muestra en el ejemplo de la Figura 1. Las estimaciones de umbrales desordenadas indican una falla en la construcción de un contexto de evaluación en el que las clasificaciones representadas por puntajes sucesivos reflejan niveles crecientes de los valores latentes. rasgo. Por ejemplo, considere una situación en la que hay dos umbrales y en la que la estimación del segundo umbral es más baja en el continuo que la estimación del primer umbral. Si las ubicaciones se toman literalmente, la clasificación de una persona en la categoría 1 implica que la ubicación de la persona supera simultáneamente el segundo umbral pero no supera el primer umbral. A su vez, esto implica un patrón de respuesta {0,1}, un patrón que no pertenece al subespacio de patrones que es intrínseco a la estructura del modelo, como se describió anteriormente.
Cuando las estimaciones de umbral están desordenadas, las estimaciones no pueden, por tanto, tomarse literalmente; más bien, el desorden, en sí mismo, indica inherentemente que las clasificaciones no satisfacen criterios que deben ser satisfechos lógicamente para justificar el uso de puntajes enteros sucesivos como base para la medición. Para enfatizar este punto, Andrich (2005) utiliza un ejemplo en el que se otorgan calificaciones de reprobación, aprobación, crédito y distinción. Estos grados, o clasificaciones, generalmente están destinados a representar niveles crecientes de logro. Considere una persona A, cuya ubicación en el continuo latente está en el umbral entre las regiones del continuo en el que es más probable que se otorgue un pase y un crédito. Considere también a otra persona B, cuya ubicación se encuentra en el umbral entre las regiones en las que es más probable que se otorgue un crédito y una distinción. En el ejemplo considerado por Andrich (2005, p. 25), los umbrales desordenados, si se toman literalmente, implicarían que la ubicación de la persona A (en el umbral de aprobación / crédito) es más alta que la de la persona B (en el nivel de crédito / distinción). umbral). Es decir, tomado literalmente, las ubicaciones de umbral desordenadas implicarían que una persona necesitaría demostrar un nivel más alto de logro para estar en el umbral de aprobación / crédito del que sería necesario para estar en el umbral de crédito / distinción. Claramente, esto no está de acuerdo con la intención de tal sistema de clasificación. El desorden de los umbrales indicaría, por tanto, que la forma en que se otorgan las calificaciones no está de acuerdo con la intención del sistema de calificación. Es decir, el desorden indicaría que la hipótesis implícita en el sistema de calificaciones - que las calificaciones representan clasificaciones ordenadas de desempeño creciente - no está sustentada por la estructura de los datos empíricos.
Referencias
- Andersen, EB (1977). Estadísticas suficientes y modelos de rasgos latentes, Psychometrika , 42, 69–81.
- Andrich, D. (1978). Una formulación de calificación para categorías de respuesta ordenadas. Psychometrika , 43, 561–73.
- Andrich, D. (2005). Explicación del modelo de Rasch. En Sivakumar Alagumalai, David D Durtis y Njora Hungi (Eds.) Applied Rasch Measurement: Un libro de ejemplos . Springer-Kluwer. Capítulo 3, 308–328.
- Masters, GN (1982). Un modelo de Rasch para la calificación crediticia parcial. Psychometrika , 47, 149-174.
- Rasch, G. (1960/1980). Modelos probabilísticos para algunas pruebas de inteligencia y rendimiento . (Copenhague, Instituto Danés de Investigación Educativa), edición ampliada (1980) con prólogo y epílogo de BD Wright. Chicago: Prensa de la Universidad de Chicago.
- Wright, BD y Masters, GN (1982). Análisis de escala de calificación . Chicago: MESA Press. (Disponible en el Institute for Objective Measurement).