Software psicométrico

El software psicométrico es un software que se utiliza para el análisis psicométrico de datos de pruebas , cuestionarios o inventarios que reflejan variables psicoeducativas latentes. Si bien algunos análisis psicométricos se pueden realizar con software estadístico estándar como SPSS , la mayoría de los análisis requieren herramientas especializadas. ^{[ cita requerida ]}

Fuentes

Existen muchas herramientas gratuitas desarrolladas por investigadores y educadores. Los sitios web importantes para el software psicométrico gratuito incluyen:

CASMA en la Universidad de Iowa, EE. UU.
REMP en la Universidad de Massachusetts, EE. UU.
Software de Harold Doran
Software de Brad Hanson
Software de John Uebersax
Software de J. Patrick Meyer
Directorio de software en el Institute for Objective Measurement
Software de Lihua Yao
Software de Larry Nelson

Además, hay un número creciente de paquetes para R que se pueden encontrar en la vista de tareas de CRAN: modelos y métodos psicométricos

Teoría clásica de la prueba

La teoría clásica de las pruebas es un enfoque del análisis psicométrico que tiene supuestos más débiles que la teoría de la respuesta a los ítems y es más aplicable a tamaños de muestra más pequeños.

CITAS

CITAS (Hoja de cálculo de análisis de pruebas y elementos clásicos) es un libro de trabajo de Excel gratuito diseñado para proporcionar puntuación y análisis estadístico de las pruebas en el aula. Las respuestas de elementos (ABCD) y las claves se escriben o pegan en el libro de trabajo, y la salida se completa automáticamente; a diferencia de otros programas, CITAS no requiere ningún "funcionamiento" o experiencia en análisis psicométrico, lo que lo hace accesible a los maestros de escuela y profesores.

jMetrik

jMetrik es un software gratuito y de código abierto para realizar un análisis psicométrico completo. Fue desarrollado por J. Patrick Meyer en la Universidad de Virginia . Los métodos actuales incluyen análisis de ítems clásico, análisis de funcionamiento diferencial de ítems (DIF), análisis factorial confirmatorio, teoría de respuesta de ítem, igualación de IRT y teoría de respuesta de ítem no paramétrica. El análisis de elementos incluye estadísticas de proporciones, biseriales puntuales y biseriales para todas las opciones de respuesta. Los coeficientes de confiabilidad incluyen el alfa de Cronbach, la lambda de Guttman, el coeficiente de Feldt-Gilmer, el coeficiente de Feldt-Brennan, los índices de consistencia de decisiones, el error estándar condicional de medición y la confiabilidad si se elimina el elemento. El análisis DIF se basa en curvas características de ítems no paramétricos y el procedimiento de Mantel-Haenszel. Los tamaños del efecto DIF y las clasificaciones ETS DIF se incluyen en la salida. El análisis factorial confirmatorio se limita al modelo de factor común para medidas congenéricas, equivalentes a tau y paralelas. Las estadísticas de ajuste se informan junto con las cargas factoriales y las variaciones de error. Los métodos de IRT incluyen los modelos de escala de Rasch, crédito parcial y calificación. Los métodos de igualación de IRT incluyen los procedimientos de media / media, media / sigma, Haebara y Stocking-Lord.

jMetrik también incluye un ilustrador IRT , una estadística descriptiva básica y una función de gráficos que produce gráficos de barras, gráficos circulares, histogramas, estimaciones de densidad de kernel y diagramas de líneas.

jMetrik es una aplicación Java pura que se ejecuta en versiones de 32 y 64 bits de los sistemas operativos Windows, Mac y Linux. jMetrik requiere Java 1.6 en la computadora host.

Iteman

Iteman es un programa comercial de Windows diseñado específicamente para el análisis de pruebas clásico. Es único en el sentido de que produce informes tecnológicos en Microsoft Word en lugar de salida ASCII, con gráficos, narrativas y tablas incrustadas. Calcula la proporción y el punto biserial de cada ítem, así como las proporciones de subgrupos alta / baja, y gráficos detallados del desempeño del ítem. También calcula estadísticas descriptivas típicas, incluida la media, la desviación estándar, la confiabilidad y el error estándar de medición, para cada dominio y las pruebas generales. Solo está disponible en Assessment Systems Corporation .

Lertap

Lertap5 (la quinta versión del Programa de análisis de pruebas del laboratorio de investigación educativa) es un paquete de software completo para el análisis de pruebas clásico desarrollado para su uso en computadoras Windows y Macintosh con Microsoft Excel . Incluye análisis de la prueba, las estadísticas elementos y opciones, consistencia clasificación y prueba de dominio, los procedimientos para hacer trampa detección, y los gráficos extensos (por ejemplo, líneas de rastreo para opciones de elementos, los errores estándar condicionales de medición, parcelas canchales , diagramas de caja de las diferencias entre grupos, histogramas, gráfico de dispersión).

DIF, funcionamiento diferencial de elementos, es compatible con las versiones Excel 2010, Excel 2013, Excel 2016 y Excel 2019 de Lertap5. Se utilizan métodos de Mantel-Haenszel; Se proporcionan gráficos de resultados, incluidos gráficos DIF empíricos.

Los usuarios de IRT, teoría de la respuesta al ítem, pueden hacer uso de cuatro opciones especiales: una producirá los archivos de control de ítems y datos requeridos por Xcalibre; otro configura un archivo ASCII para Bilog MG; un tercero prepara los datos para su procesamiento con SAS y escribirá líneas adecuadas de código SAS para su uso con módulos SAS IRT; una cuarta interfaz con la versión Excel de un paquete R llamado "RIRT", lo que permite a los usuarios calibrar elementos sin salir de Excel.

Se encuentran disponibles varios conjuntos de datos de muestra para usar con Lertap y / u otros programas de análisis de elementos y pruebas; estos involucran tanto pruebas cognitivas como escalas afectivas (o de calificación). También se encuentran disponibles documentos técnicos relacionados con la aplicación de Lertap5.

Lertap5 fue desarrollado por Larry Nelson en la Universidad de Curtin y está disponible en Lertap5.com .

GRIFO

TAP (el programa de análisis de pruebas) es un programa gratuito de Windows 9x / NT / 2000 / XP / 7 escrito en Delphi Pascal que realiza análisis de pruebas y análisis de elementos basados en la teoría de pruebas clásica. TAP es un programa clásico de análisis de ítems y pruebas. Proporciona informes para las puntuaciones totales de los examinados, estadísticas de los elementos ("por ejemplo", dificultad del elemento, discriminación del elemento, biserial puntual), análisis de opciones y otra información útil. TAP también proporciona informes individuales de los examinados de las puntuaciones totales y las respuestas a los elementos.

ViSta-CITA

ViSta-CITA (Análisis de pruebas y elementos clásicos) es un módulo incluido en el Sistema de estadísticas visuales ( ViSta ) que se centra en métodos de orientación gráfica aplicados al análisis psicométrico. Fue desarrollado por Ruben Ledesma, J. Gabriel Molina, Pedro M. Valero-Mora y Forrest W. Young. ViSta no se ha actualizado desde 2014

psicoanalizar

Paquete R. Varias rutinas de personalidad, psicometría y psicología experimental. Las funciones son principalmente para la construcción de escalas utilizando análisis de factores, análisis de conglomerados y análisis de confiabilidad, aunque otras proporcionan estadísticas descriptivas básicas. La teoría de la respuesta al ítem se realiza mediante el análisis factorial de correlaciones tetracóricas y policóricas. Se incluyen funciones para simular elementos particulares y estructuras de prueba. Varias funciones sirven como una interfaz útil para el modelado de ecuaciones estructurales. Se crean visualizaciones gráficas de diagramas de ruta, análisis de factores y modelos de ecuaciones estructurales utilizando gráficos básicos. Algunas de las funciones están escritas para respaldar un libro sobre psicometría, así como publicaciones en la investigación de la personalidad. Para obtener más información, consulte la página web Personality-project.org/r.

Calibración de la teoría de respuesta al ítem

La teoría de la respuesta al ítem (TRI) es un enfoque psicométrico que asume que la probabilidad de una determinada respuesta es una función directa de un rasgo o rasgos subyacentes. Se han propuesto varias funciones para modelar esta relación, y los diferentes paquetes de calibración lo reflejan. Se han desarrollado varios paquetes de software para análisis adicionales, como igualar ; se enumeran en la siguiente sección.

BILOG-MG

BILOG-MG es un programa de software para el análisis IRT de datos dicotómicos (correctos / incorrectos), incluido el ajuste y el funcionamiento diferencial de los elementos . Es comercial y solo está disponible en Scientific Software International o Assessment Systems Corporation .

diestro

dexter , publicado por primera vez en febrero de 2017, es un paquete R destinado a ser un sistema robusto y bastante completo para administrar y analizar datos de prueba organizados en folletos. El paquete incluye instalaciones para importar y administrar datos de prueba, evaluar y mejorar la calidad de los datos a través del análisis básico de prueba e ítem, ajustar un modelo IRT y calcular varias estimaciones de capacidad. Se proporcionan muchos métodos psicométricos que no se encuentran en otros lugares, como el modelo de interacción de Haberman (2007) generalizado para ítems politómicos, generación eficiente de valores o puntajes plausibles, nuevos métodos para análisis DIF exploratorio y confirmatorio, soporte para el método 3DC de establecimiento de estándares, y muchos más. El modelo de TRI central es una generalización politómica del modelo de Rasch marginal extendido. La estimación se realiza mediante CML o técnicas bayesianas. Hay dos paquetes complementarios: dextergui , publicado por primera vez en junio de 2018, y que proporciona una interfaz gráfica sencilla para las funciones más utilizadas en dexter; y dexterMST , publicado por primera vez en julio de 2018, para administrar y analizar datos de diseños de prueba de múltiples etapas. Todos los paquetes están ampliamente documentados tanto para principiantes como para profesionales (ver también el blog ).

Facetas

Facets es un programa de software para el análisis de Rasch de datos intermediados por evaluadores o jueces, como calificaciones de ensayos, competencias de buceo, encuestas de satisfacción y datos de calidad de vida. Otras aplicaciones incluyen datos de orden de clasificación, ensayos binomiales y recuentos de Poisson.

flexMIRT

El software flexMIRT IRT es un paquete de software de varios niveles y grupos para el análisis de artículos, la calibración de artículos y la puntuación de pruebas. El paquete de software flexMIRT IRT se adapta a una variedad de modelos teóricos de respuesta a ítems unidimensionales y multidimensionales (también conocidos como modelos de análisis de factores de ítems) a datos de un solo nivel y multinivel en cualquier número de grupos.

irtoys

irtoys es un paquete de R que se publicó por primera vez en 2007 y es compatible con casi todo el contenido del libro, pero se limita a un folleto de elementos dicotómicos. Es bueno para la enseñanza, proyectos más pequeños, como navaja suiza de psicometrista y como fuente de piedras de construcción para otros proyectos. Los archivos de sintaxis simple para ICL y BILOG-MG que escribe se pueden estudiar y modificar para manejar problemas más complicados.

ICL

ICL (IRT Command Language) realiza calibraciones IRT, incluidos los modelos logísticos de 1, 2 y 3 parámetros, así como el modelo de crédito parcial y el modelo de crédito parcial generalizado. También puede generar datos de respuesta. Como su nombre lo indica, está completamente controlado por código de comando, sin interfaz gráfica de usuario.

jMetrik

jMetrik es un software gratuito y de código abierto para realizar un análisis psicométrico completo. Fue desarrollado por J. Patrick Meyer en la Universidad de Virginia . Los métodos actuales incluyen análisis de ítems clásico, análisis de funcionamiento diferencial de ítems (DIF), teoría de respuesta de ítem, igualación de IRT y teoría de respuesta de ítem no paramétrica. El análisis de elementos incluye estadísticas de proporciones, biseriales puntuales y biseriales para todas las opciones de respuesta. Los coeficientes de confiabilidad incluyen el alfa de Cronbach, la lambda de Guttman, el coeficiente de Feldt-Gilmer, el coeficiente de Feldt-Brennan, los índices de consistencia de decisiones, el error estándar condicional de medición y la confiabilidad si se elimina el elemento. El análisis DIF se basa en curvas características de ítems no paramétricos y el procedimiento de Mantel-Haenszel. Los tamaños del efecto DIF y las clasificaciones ETS DIF se incluyen en la salida. Los métodos de IRT incluyen los modelos de escala de Rasch, crédito parcial y calificación estimados a través de JMLE. jMetrik también proporciona los modelos 3PL, 4PL y de crédito parcial generalizado estimados a través de MMLE. Los métodos de puntuación de personas incluyen MLE, MAP y EAP. Los métodos de igualación de IRT incluyen los procedimientos de media / media, media / sigma, Haebara y Stocking-Lord.

jMetrik también incluye estadísticas descriptivas básicas y una función de gráficos que produce gráficos de barras, gráficos circulares, histogramas, estimaciones de densidad de kernel y diagramas de líneas.

jMetrik es una aplicación Java pura que se ejecuta en versiones de 32 y 64 bits de los sistemas operativos Windows, Mac y Linux. jMetrik requiere Java 1.6 en la computadora host.

Lertap5

Aunque básicamente es un programa clásico de teoría de pruebas, Lertap5 tiene soporte para usuarios de Xcalibre, Bilog-MG, las rutinas IRT en SAS y "EIRT", el equivalente en Excel del paquete "RIRT". Lertap5 ejecuta una "aplicación" de Excel, al igual que EIRT. Estos dos programas combinados hacen que la calibración de artículos sea muy factible usando solo Excel.

MULTILOG

MULTILOG es una extensión de BILOG a datos con respuestas politómicas (múltiples). Es comercial y solo está disponible en Scientific Software International o Assessment Systems Corporation.

BMIRT

BMIRT es un programa de aplicación Java multipropósito gratuito que realiza calibraciones de elementos y estimación de capacidad en un marco de modelo multidimensional de la teoría de respuesta a elementos (IRT) de múltiples grupos; puede adaptarse a modelos dicotómicos o politómicos, junto con modelos mixtos. Admite modelos MIRT tanto exploratorios como confirmatorios y compensatorios y no compensatorios.

PARCALA

PARSCALE es un programa diseñado específicamente para el análisis IRT politómico. Es comercial y solo está disponible en Scientific Software International o Assessment Systems Corporation .

PARAM-3PL

PARAM-3PL es un programa gratuito para la calibración del modelo IRT logístico de 3 parámetros. Fue desarrollado por Lawrence Rudner en el Centro de Información de Recursos Educativos (ERIC). La última versión fue la versión 0.93 en agosto de 2012.

TESTFact

Características de testfact - Análisis factorial exploratorio de máxima verosimilitud marginal (MML) y análisis clásico de ítems de datos binarios - Calcula correlaciones tetracoricas, solución de factores principales, estadística descriptiva de ítems clásicos, tablas y gráficos fractiles - Maneja hasta 10 factores usando cuadratura numérica: hasta 5 para cuadratura no adaptativa y hasta 10 para cuadratura adaptativa - Maneja hasta 15 factores usando técnicas de integración Monte Carlo - Rotación Varimax (ortogonal) y PROMAX (oblicua) de cargas factoriales - Maneja una forma importante de análisis factorial confirmatorio conocido como "bifactor" análisis: el patrón de factores consta de un factor principal más factores de grupo - Simulación de respuestas a elementos basados en parámetros especificados por el usuario - Corrección de elementos adivinados y no alcanzados - Permite imponer restricciones en las estimaciones de parámetros de elementos - Maneja elementos omitidos y no presentados - La documentación detallada de HELP en línea incluye sintaxis y ejemplos anotados.

WINMIRA 2001

WINMIRA 2001 es un programa de análisis con el modelo de Rasch para respuestas ordinales dicotómicas y politómicas, con el análisis de clases latentes, y con el modelo Rasch de distribución de mezclas para respuestas de ítems dicotómicos y politómicos. ^[1]^[2] El software proporciona una estimación de máxima verosimilitud condicional (CML) de los parámetros de los elementos, así como estimaciones de MLE y WLE de los parámetros de la persona, y estadísticas de ajuste de la persona y del elemento, así como criterios de información (AIC, BIC, CAIC ) para la selección del modelo. El software también realiza un procedimiento de arranque paramétrico para la selección del número de componentes de la mezcla. Una versión gratuita para estudiantes está disponible en la página web de Matthias von Davier y una versión comercial está disponible.

Winsteps

Winsteps es un programa diseñado para el análisis con el modelo de Rasch , un modelo de teoría de respuesta al ítem de un parámetro que se diferencia del modelo 1PL en que cada individuo en la muestra de personas está parametrizado para la estimación del ítem y es prescriptivo y con referencia a criterios, en lugar de de naturaleza descriptiva y referenciada a normas. ^[3] Está disponible comercialmente en Winsteps, Inc. También está disponible una versión anterior basada en DOS, BIGSTEPS.

Xcalibre

Xcalibre es un programa comercial que realiza una estimación de máxima verosimilitud marginal tanto de modelos dicotómicos (1PL-Rasch, 2PL, 3PL) como de todos los principales modelos de IRT politómicos. La interfaz es de apuntar y hacer clic; no se requiere código de comando. Su salida incluye hojas de cálculo y un documento de informe detallado y narrado con tablas y figuras incrustadas, que se pueden imprimir y entregar a expertos en la materia para que revisen los elementos. Solo está disponible en Assessment Systems Corporation .

IATA

IATA es un paquete de software para analizar datos de evaluación psicométrica y educativa. La interfaz es de apuntar y hacer clic, y toda la funcionalidad se entrega a través de interfaces de estilo asistente que se basan en diferentes flujos de trabajo o objetivos de análisis, como pruebas piloto o equiparación. IATA lee y escribe formatos de archivo csv, Excel y SPSS, y produce gráficos exportables para todos los análisis estadísticos. Cada análisis también incluye heurísticas que sugieren interpretaciones apropiadas de los resultados numéricos. IATA realiza análisis factorial, escalado y calibración (1PL-Rasch, 2PL, 3PL), análisis de funcionamiento diferencial de ítems (DIF), desarrollo de pruebas (básico) asistido por computadora, igualación, establecimiento de estándares basados en IRT, acondicionamiento de puntajes y generación de valores plausibles. Está disponible de forma gratuita en Polymetrika International.

mirt

Paquete R. Análisis de datos de respuesta dicotómica y politómica utilizando modelos de rasgos latentes unidimensionales y multidimensionales bajo el paradigma de la Teoría de Respuesta al Ítem. Los modelos exploratorios y confirmatorios se pueden estimar con métodos en cuadratura (EM) o estocásticos (MHRM). Se encuentran disponibles análisis confirmatorios de dos factores y dos niveles para modelar testlets de elementos. También se encuentran disponibles análisis de grupos múltiples y diseños de efectos mixtos para detectar el funcionamiento diferencial de los elementos y modelar las covariables de los elementos y las personas.

ltm

Paquete R. Análisis de datos multivariados dicotómicos y politómicos utilizando modelos de rasgos latentes bajo el enfoque de la Teoría de Respuesta al Ítem. Incluye los modelos de Rasch, Logística de dos parámetros, Tres parámetros de Birnbaum, Respuesta graduada y Crédito parcial generalizado.

TAM

Paquete R. El paquete incluye estimación de máxima verosimilitud marginal y conjunta de modelos de respuesta de ítem unidimensionales y multidimensionales (Rasch, 2PL, crédito parcial generalizado, escala de calificación, múltiples facetas), estadísticas de ajuste, estimación de error estándar, así como imputación de valor plausible y estimación de verosimilitud ponderada de habilidad.

ACER ConQuest

ACER ConQuest es un programa de computadora para ajustar modelos de regresión latente y respuesta de ítems unidimensionales y multidimensionales. Proporciona un análisis de datos basado en una gama completa y flexible de modelos de respuesta a elementos (IRM), lo que permite examinar las propiedades de las evaluaciones de desempeño, las evaluaciones tradicionales y las escalas de calificación. ACER ConQuest 4 también ofrece procedimientos de análisis de la comunidad de investigación y medición más amplios basados en los métodos psicométricos más actualizados de modelos de respuesta de ítems multifacéticos, modelos de respuesta de ítems multidimensionales, modelos de regresión latente y elaboración de valores plausibles.

irtplay

Paquete R. Ajustar los modelos de la teoría de respuesta al ítem unidimensional (TRI) a una combinación de datos dicotómicos y politómicos, calibrar los parámetros de los ítems en línea, estimar las habilidades latentes de los examinados y examinar el ajuste de los datos del modelo del IRT a nivel del ítem de diferentes maneras, así como proporcionar funciones útiles relacionadas a IRT unidimensional.

MIRT

Un programa general de código abierto para el análisis de respuesta a los ítems desarrollado en Educational Testing Service. ^[4] El programa puede manejar variables independientes, parámetros de capacidad multidimensional, datos incompletos y muestreo complejo. Las variables de capacidad pueden ser politómicas o multivariadas normales, y los ítems pueden ser dicotómicos o politómicos.

Software adicional de teoría de respuesta al ítem

Debido a la complejidad de IRT, existen pocos paquetes de software capaces de calibrar. Sin embargo, existen muchos programas de software para análisis IRT auxiliares específicos, como igualar y escalar. A continuación se muestran ejemplos de dicho software.

LinkMIRT

LinkMIRT es un programa de aplicación Java gratuito que vincula dos conjuntos de parámetros de elementos en un marco IRT multidimensional (MIRT). El software puede implementar el método Stocking and Lord, el método mean / mean y el método mean / sigma. Se admite la vinculación por comentario-persona y por diseño de grupos equivalentes aleatorios.

MÉTRICA

METRICS (Métodos para igualar, probar, regresión, teoría de respuesta a elementos y puntuación) es una aplicación web gratuita para psicometristas. Fue desarrollado por Harold Doran en los Institutos Americanos de Investigación. El software incluye un entorno para usar presentaciones visuales interactivas de datos junto con varias herramientas de exploración de datos, cálculo de confiabilidad usando alfa de Cronbach, alfa estratificado y Feldt-Raju junto con variaciones de navaja, análisis de ítems clásico de ítems de prueba, estadísticas de ajuste basadas en IRT que incluyen gráficas de ajuste de elementos, estadísticas de Yen Q1 y Q3, seis métodos de igualación diferentes junto con presentaciones visuales de curvas de características de elementos después de vincular y curvas de características de prueba, un motor de puntuación de prueba completo basado en IRT para calificar modelos unidimensionales y multidimensionales dado un conjunto de parámetros de elemento , métodos de consistencia y precisión de clasificación, modelos de regresión lineal que incluyen modelos lineales de efectos fijos y efectos mixtos diseñados para tener en cuenta el error de medición en las variables predictoras, y procedimientos de estimación directa como se utilizan en los análisis de estilo NAEP.

SimuMIRT

SimuMIRT es un programa que simula datos multidimensionales (capacidad del examinado y respuestas de los ítems) para una prueba de forma fija (es decir, papel y lápiz), a partir de un conjunto de parámetros especificado por el usuario. Se admite el modelo de efecto evaluador.

SimuMCAT

SimuMCAT es un programa de aplicación Java gratuito que simula una prueba adaptativa por computadora multidimensional (MCAT). El usuario puede seleccionar entre cinco procedimientos de selección de elementos MCAT diferentes (Volumen, información Kullback-Leibler, Minimizar la variación del error de la combinación lineal, Ángulo mínimo y Minimizar la variación del error de la puntuación compuesta con el peso optimizado). ^[5] Son posibles dos enfoques de control de exposición: el enfoque tradicional de Sympson-Hetter y un enfoque de control de exposición máxima. También es posible implementar restricciones de contenido utilizando el método de índice de prioridad. Se implementan diferentes reglas de parada con prueba de longitud fija y prueba de longitud variable. El usuario especifica la verdadera capacidad del examinado, los grupos de elementos y los procedimientos de selección de elementos, y el programa genera elementos seleccionados con respuestas de elementos y estimaciones de capacidad. El usuario puede especificar métodos bayesianos y no bayesianos. Las distribuciones especificadas por el usuario también pueden crear los grupos de elementos y habilidades de los examinados a partir del programa.

IRTEQ

IRTEQ es una aplicación GUI de Windows gratuita que implementa el escalado y la equiparación de IRT desarrollada por Kyung (Chris) T. Han. Implementa métodos de escalado / igualación de IRT que se utilizan ampliamente con el diseño de “Prueba de anclaje de grupos no equivalentes”: métodos de Media / Media, Media / Sigma, Media robusta / Sigma y TCC. ^[6]^[7]^[8]^[9]^[10] Para los métodos TCC, IRTEQ ofrece al usuario la opción de elegir varias distribuciones de puntuación para incorporarlas a la función de pérdida. IRTEQ admite varios modelos populares de IRT unidimensionales: modelos logísticos para respuestas dicotómicas (con 1, 2 o 3 parámetros) y el modelo de crédito parcial generalizado (GPCM) (incluido el modelo de crédito parcial (PCM), que es un caso especial de GPCM) y Modelo de respuesta gradual (GRM) para respuestas politómicas. IRTEQ también puede equiparar las puntuaciones de las pruebas en la escala de una prueba con la escala de otra prueba utilizando la ecuación de puntuación real de IRT. ^[11]

ResidPlots-2

ResidPlots-2 es un programa gratuito para el análisis gráfico de residuos IRT. Fue desarrollado por Tie Liang, Kyung (Chris) T. Han y Ronald K. Hambleton en la Universidad de Massachusetts Amherst .

WinGen

WinGen es un programa gratuito basado en Windows que genera parámetros IRT y respuestas de elementos. Kyung (Chris) T. Han de la Universidad de Massachusetts Amherst . ^[12]

S T

ST realiza transformaciones de escala de la teoría de respuesta al ítem (IRT) para pruebas calificadas dicotómicamente.

POLYST

POLYST realiza transformaciones de escala IRT para pruebas puntuadas dicotómicamente y politómicamente.

STUIRT

STUIRT realiza transformaciones de escala IRT para pruebas de formato mixto (pruebas que incluyen algunos ítems de opción múltiple y algunos ítems politómicos).

plink

Paquete R. Este paquete utiliza métodos de teoría de respuesta al ítem para calcular las constantes de vinculación y realizar la vinculación en cadena de pruebas unidimensionales o multidimensionales para múltiples grupos bajo un diseño de ítem común. Los métodos unidimensionales incluyen los métodos Media / Media, Media / Sigma, Haebara y Stocking-Lord para dicotómicos (1PL, 2PL y 3PL) y / o politómicos (respuesta calificada, crédito parcial / crédito parcial generalizado, nominal y de opción múltiple). modelo) artículos. Los métodos multidimensionales incluyen el método de mínimos cuadrados y extensiones del método Haebara y Stocking-Lord utilizando parámetros de dilatación única o múltiple para extensiones multidimensionales de todos los modelos de respuesta a ítems unidimensionales dicotómicos y politómicos. El paquete también incluye funciones para importar elementos y / o parámetros de capacidad desde el software común de IRT, realizar la puntuación verdadera de IRT y la igualación de la puntuación observada, y trazar curvas / superficies de respuesta de los elementos, gráficos vectoriales y gráficos de comparación para examinar la deriva de los parámetros.

Consistencia de decisiones

Los métodos de coherencia de decisiones son aplicables a las pruebas con criterios de referencia , como los exámenes de licenciatura y las pruebas de dominio académico.

Iteman

Iteman proporciona un índice de consistencia de decisiones, así como una estimación clásica del error estándar condicional de medición en la puntuación de corte, que a menudo se solicita para la acreditación de un programa de prueba.

jMetrik

jMetrik es un software gratuito y de código abierto para realizar un análisis psicométrico completo. La información detallada se enumera arriba. jMetrik incluye las estimaciones de consistencia de decisión de Huynh si se proporcionan puntajes de corte en el análisis de ítems.

Lertap

Lertap calcula varias estadísticas relacionadas con la consistencia de decisión y clasificación, incluido el coeficiente de Livingston, el índice de confiabilidad de Brennan-Kane, kappa, y una estimación de p (0), número de clasificaciones correctas como proporción, derivadas mediante el uso de la adaptación de Peng-Subkoviac de El método de Huynh. Se proporciona información más detallada sobre Lertap arriba, bajo 'Teoría de prueba clásica'.

Otros análisis

La mayor parte del software psicométrico está diseñado para analizar datos de respuesta para evaluar el desempeño de los ítems y pruebas; la mayor parte del software anterior se centra en esto. Algunos programas están destinados a otros análisis psicométricos.

TAMIZAR

SIFT está diseñado para análisis forense de datos, es decir, para encontrar evidencia de trampas u otro comportamiento que amenace la validez e integridad de la prueba. Es un programa de Windows con una interfaz de usuario de apuntar y hacer clic y salida de Microsoft Excel .

Detectar copia

CopyDetect es un paquete R que está diseñado para análisis forense de datos, es decir, para encontrar evidencia de trampas u otro comportamiento que amenace la validez e integridad de la prueba.

Ensamblador de pruebas

TestAssembler es un programa de Windows que realiza un ensamblaje de prueba automatizado.

ATA

ATA es un paquete R para el ensamblaje de pruebas automatizado.

Software de análisis estadístico general

El software diseñado para el análisis estadístico general a menudo se puede utilizar para ciertos tipos de análisis psicométrico. Además, a menudo se dispone de código para tipos más avanzados de análisis psicométrico.

R

R es un entorno de programación diseñado para la computación estadística y la producción de gráficos. La funcionalidad básica de R se puede ampliar mediante la instalación de 'paquetes' contribuidos, y se mantiene una lista de paquetes relacionados psicométricos en el sitio web de CRAN . ^[13]

SAS

SAS es un paquete disponible comercialmente para el análisis estadístico y la manipulación de datos. También está basado en comandos.

SPSS

SPSS , originalmente llamado Paquete Estadístico para las Ciencias Sociales, es un programa comercial de análisis estadístico general donde los datos se presentan en un diseño de hoja de cálculo y los análisis comunes se manejan mediante menús.

S-Plus

S-Plus es un paquete de análisis comercial basado en el lenguaje de programación S .

Stata

Stata es un paquete comercial. La implementación de IRT de Stata incluye modelos logísticos de 1, 2 y 3 parámetros, modelos de respuesta graduada, modelos de crédito parcial y crédito parcial generalizado, modelos de escala de calificación y un modelo de respuesta nominal para respuestas categóricas desordenadas. Está impulsado por un panel de control que permite al usuario especificar el modelo, examinar el ajuste numérica y gráficamente e investigar el funcionamiento diferencial de los elementos desde una única interfaz. ^[14]

Ver también

Pruebas psicológicas
Generación automática de artículos

Referencias

^ Rost, J. (1990). Modelos de Rasch en clases latentes: una integración de dos enfoques para el análisis de elementos. Medición psicológica aplicada, 14, 271-282.
^ von Davier, M. y Rost, J. (1995). Modelos Rasch mixtos politómicos. En GH Fischer & IW Molenaar (Eds.), Modelos de Rasch, fundamentos, desarrollos recientes y aplicaciones (págs. 371-382). Nueva York: Springer.
^ Modelo dicotómico de Rasch frente al modelo logístico de un parámetro [1] . Transacciones de medición de Rasch [2] , 2005, 19: 3 p. 1032
^ https://github.com/EducationalTestingService/MIRT
↑ Yao, Lihua (17 de mayo de 2012). "Métodos de selección de elementos de CAT multidimensional para puntuaciones de dominio y puntuaciones compuestas: teoría y aplicaciones". Psychometrika . 77 (3): 495–523. doi : 10.1007 / s11336-012-9265-5 . ISSN 0033-3123 . PMID 27519778 .
^ Loyd y Hoover, 1980
↑ Marco, 1977
^ Linn, Levine, Hastings y Wardrop, 1981
^ Haebara, T. (1980). Igualación de escalas de capacidad logística mediante un método de mínimos cuadrados ponderados. Investigación psicológica japonesa, 22 , 144‐149.
^ Media, ML y Lord, FM (1983). Desarrollar una métrica común en la teoría de respuesta al ítem. Medición psicológica aplicada, 7 , 201-210.
^ Señor, FM (1980). Aplicaciones de la teoría de respuesta al ítem a problemas prácticos de prueba . Mahwah, Nueva Jersey: Lawrence Erlbaum Associates, Inc.
^ Han, KT (2007). WinGen: software de Windows que genera parámetros de IRT y respuestas de elementos. Medición psicológica aplicada, 31 , 457-459.
^ [3] Vista de tareas CRAN: modelos y métodos psicométricos
^ [4] Manual de IRT de Stata en línea

[1] Rost, J. (1990). Modelos de Rasch en clases latentes: una integración de dos enfoques para el análisis de elementos. Medición psicológica aplicada, 14, 271-282.

[2] von Davier, M. y Rost, J. (1995). Modelos Rasch mixtos politómicos. En GH Fischer & IW Molenaar (Eds.), Modelos de Rasch, fundamentos, desarrollos recientes y aplicaciones (págs. 371-382). Nueva York: Springer.

[3] Modelo dicotómico de Rasch frente al modelo logístico de un parámetro [1] . Transacciones de medición de Rasch [2] , 2005, 19: 3 p. 1032

[4] ttps://github.com/EducationalTestingService/MIRT

[5] Yao, Lihua (17 de mayo de 2012). "Métodos de selección de elementos de CAT multidimensional para puntuaciones de dominio y puntuaciones compuestas: teoría y aplicaciones". Psychometrika . 77 (3): 495–523. doi : 10.1007 / s11336-012-9265-5 . ISSN 0033-3123 . PMID 27519778 .

[6] Loyd y Hoover, 1980

[7] Marco, 1977

[8] Linn, Levine, Hastings y Wardrop, 1981

[9] Haebara, T. (1980). Igualación de escalas de capacidad logística mediante un método de mínimos cuadrados ponderados. Investigación psicológica japonesa, 22 , 144‐149.

[10] Media, ML y Lord, FM (1983). Desarrollar una métrica común en la teoría de respuesta al ítem. Medición psicológica aplicada, 7 , 201-210.

[11] Señor, FM (1980). Aplicaciones de la teoría de respuesta al ítem a problemas prácticos de prueba . Mahwah, Nueva Jersey: Lawrence Erlbaum Associates, Inc.

[12] Han, KT (2007). WinGen: software de Windows que genera parámetros de IRT y respuestas de elementos. Medición psicológica aplicada, 31 , 457-459.

[13] [3] Vista de tareas CRAN: modelos y métodos psicométricos

[14] [4] Manual de IRT de Stata en línea

[1]