Equiparar

La equiparación de pruebas se refiere tradicionalmente al proceso estadístico de determinar puntuaciones comparables en diferentes formas de un examen . ^[1] Se puede llevar a cabo utilizando ya sea la teoría clásica de los tests o teoría de respuesta al ítem .

En la teoría de la respuesta a los ítems, igualar ^[2] es el proceso de colocar las puntuaciones de dos o más formas de prueba paralelas en una escala de puntuación común. El resultado es que los puntajes de dos formas de prueba diferentes pueden compararse directamente o tratarse como si provinieran de la misma forma de prueba. Cuando las pruebas no son paralelas, el proceso general se llama vinculación. Es el proceso de equiparar las unidades y los orígenes de dos escalas en las que se han estimado las habilidades de los estudiantes a partir de los resultados de diferentes pruebas. El proceso es análogo a equiparar grados Fahrenheit con grados Celsius al convertir las medidas de una escala a otra. La determinación de puntuaciones comparables es un subproducto de la equiparación que resulta de equiparar las escalas obtenidas de los resultados de las pruebas.

¿Por qué es necesario equiparar?

Supongamos que tanto Dick como Jane se someten a una prueba para obtener la licencia en una determinada profesión. Debido a que lo que está en juego (puedes practicar la profesión si apruebas la prueba) puede crear la tentación de hacer trampa, la organización que supervisa la prueba crea dos formas. Si sabemos que Dick obtuvo un 60% en el formulario A y Jane obtuvo un 70% en el formulario B, ¿sabemos con certeza cuál tiene una mejor comprensión del material? ¿Qué pasa si el formulario A se compone de elementos muy difíciles, mientras que el formulario B es relativamente fácil? Se realizan análisis de equiparación para abordar este mismo problema, de modo que los puntajes sean lo más justos posible.

Igualar en la teoría de la respuesta al ítem

Figura 1: Curvas de características de la prueba que muestran la relación entre la puntuación total y la ubicación de la persona para dos pruebas diferentes en relación con una escala común. En este ejemplo, un total de 37 en la Evaluación 1 equivale a un total de 34,9 en la Evaluación 2, como lo muestra la línea vertical.

En la teoría de la respuesta al ítem , las "ubicaciones" de las personas (medidas de cierta calidad evaluadas por una prueba) se estiman en una escala de intervalo ; es decir, las ubicaciones se estiman en relación con una unidad y un origen. En la evaluación educativa es común emplear pruebas para evaluar a diferentes grupos de estudiantes con la intención de establecer una escala común equiparando los orígenes, y en su caso también las unidades, de las escalas obtenidas a partir de los datos de respuesta de las diferentes pruebas. El proceso se conoce como igualación o prueba de igualación.

En la teoría de la respuesta al ítem, dos tipos diferentes de equiparación son la ecuación horizontal y la vertical. ^[3] La equiparación vertical se refiere al proceso de equiparar las pruebas administradas a grupos de estudiantes con diferentes habilidades, como estudiantes en diferentes grados (años de escolaridad). ^[4] La equiparación horizontal se refiere a la equiparación de las pruebas administradas a grupos con habilidades similares; por ejemplo, dos exámenes administrados a estudiantes del mismo grado en dos años calendario consecutivos. Se utilizan diferentes pruebas para evitar los efectos de la práctica.

En términos de la teoría de la respuesta al ítem, la equiparación es solo un caso especial del proceso más general de escalado , aplicable cuando se usa más de una prueba. En la práctica, sin embargo, la escala se implementa a menudo por separado para diferentes pruebas y luego las escalas se equiparan posteriormente.

A menudo se hace una distinción entre dos métodos de equiparación; persona común y elemento común equiparando. La equiparación de persona común implica la administración de dos pruebas a un grupo común de personas. La media y la desviación estándar de las ubicaciones de escala de los grupos en las dos pruebas se equiparan mediante una transformación lineal. La equiparación de elementos comunes implica el uso de un conjunto de elementos comunes denominados prueba de anclaje incorporada en dos pruebas diferentes. Se equipara la ubicación media del artículo de los artículos comunes.

Enfoques clásicos para equiparar

En la teoría clásica de las pruebas, la equiparación de medias simplemente ajusta la distribución de puntuaciones de modo que la media de una forma sea comparable a la media de la otra. Si bien la equiparación de medias es atractiva debido a su simplicidad, carece de flexibilidad, es decir, tiene en cuenta la posibilidad de que las desviaciones estándar de las formas difieran. ^[1]

La ecuación lineal se ajusta para que las dos formas tengan una media y una desviación estándar comparables . Hay varios tipos de ecualización lineal que difieren en los supuestos y las matemáticas utilizadas para estimar los parámetros. Los métodos de puntaje observado de Tucker y Levine estiman la relación entre los puntajes observados en los dos formularios, mientras que el método de puntaje verdadero de Levine estima la relación entre los puntajes verdaderos en los dos formularios. ^[1]

La equiparación de equipercentiles determina la relación de equiparación como aquella en la que una puntuación podría tener un percentil equivalente en cualquiera de las formas. Esta relación puede ser no lineal.

A diferencia de la teoría de respuesta a los ítems, la equiparación basada en la teoría clásica de las pruebas es algo diferente de la escala. La ecualización es una transformación de crudo a crudo en el sentido de que estima una puntuación bruta en el Formulario B que es equivalente a cada puntaje bruto en el Formulario A base. Cualquier transformación de escala utilizada se aplica luego sobre o con la equiparación.

Ver también

Calificación en una curva

Referencias

↑ ^a ^b ^c Kolen, MJ y Brennan, RL (1995). Prueba de equiparación. Nueva York: primavera.
^ Consejo Nacional de Medición en Educación http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorE Archivado 2017-07 -22 en la Wayback Machine
^ Baker, F. (1983). Comparación de métricas de capacidad obtenidas bajo dos procedimientos de teoría de rasgos latentes. Medición psicológica aplicada, 7, 97-110.
^ Baker, F. (1984). Transformaciones de la métrica de capacidad involucradas en la equiparación vertical bajo la teoría de respuesta al ítem Medición psicológica aplicada, 8 (3), 261-271.

enlaces externos

Igualar y el SAT
Pruebas de igualación y AP
IRTEQ: aplicación de Windows que implementa el escalado y la ecualización de IRT

[KolenBrennan-1] Kolen, MJ y Brennan, RL (1995). Prueba de equiparación. Nueva York: primavera.

[2] Consejo Nacional de Medición en Educación http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorE Archivado 2017-07 -22 en la Wayback Machine

[3] Baker, F. (1983). Comparación de métricas de capacidad obtenidas bajo dos procedimientos de teoría de rasgos latentes. Medición psicológica aplicada, 7, 97-110.

[4] Baker, F. (1984). Transformaciones de la métrica de capacidad involucradas en la equiparación vertical bajo la teoría de respuesta al ítem Medición psicológica aplicada, 8 (3), 261-271.

[1]