De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

La psicometría es un campo de estudio relacionado con la teoría y la técnica de la medición psicológica . Según la definición del Consejo Nacional de Medición en la Educación de los EE. UU. (NCME), la psicometría se refiere a la medición psicológica. Generalmente, se refiere a los campos de especialización dentro de la psicología y la educación dedicados a las pruebas, la medición, la evaluación y actividades relacionadas. [1]

El campo se ocupa de la medición objetiva de habilidades y conocimientos, habilidades, actitudes, rasgos de personalidad , constructos clínicos y trastornos mentales, así como los logros educativos . Algunos investigadores psicométricos se centran en la construcción y validación de instrumentos de evaluación como cuestionarios , pruebas , juicios de los evaluadores, escalas de síntomas psicológicos y pruebas de personalidad . Otros se centran en la investigación relacionada con la teoría de la medición (p. Ej., Teoría de la respuesta al ítem ; correlación intraclase ).

Los médicos se describen como psicometristas. Los psicometristas suelen poseer una titulación específica y la mayoría son psicólogos con formación de posgrado avanzada. Además de las instituciones académicas tradicionales, muchos psicometristas trabajan para el gobierno o en departamentos de recursos humanos . Otros se especializan como profesionales del aprendizaje y el desarrollo .

Fundación histórica [ editar ]

Las pruebas psicológicas provienen de dos corrientes de pensamiento: la primera, de Darwin , Galton y Cattell sobre la medición de las diferencias individuales, y la segunda, de Herbart , Weber , Fechner y Wundt y sus mediciones psicofísicas de un constructo similar. El segundo grupo de individuos y su investigación es lo que ha llevado al desarrollo de la psicología experimental y las pruebas estandarizadas. [2]

Corriente victoriana [ editar ]

Charles Darwin fue la inspiración detrás de Sir Francis Galton, quien condujo a la creación de la psicometría. En 1859, Darwin publicó su libro Sobre el origen de las especies , que se dedicó al papel de la selección natural en el surgimiento a lo largo del tiempo de diferentes poblaciones de especies de plantas y animales. El libro analiza en qué se diferencian los miembros individuales de una especie y cómo poseen características que se adaptan más o menos a su entorno. Aquellos con características más adaptativas tienen más probabilidades de procrear y dar lugar a otra generación. Aquellos con características menos adaptativas tienen menos probabilidades de procrear. Esta idea estimuló el interés de Galton por el estudio de los seres humanos y cómo se diferencian entre sí y, lo que es más importante, cómo medir esas diferencias.

Galton escribió un libro titulado Hereditary Genius sobre las diferentes características que poseen las personas y cómo esas características las hacen más "aptas" que otras. Hoy en día, estas diferencias, como el funcionamiento sensorial y motor (tiempo de reacción, agudeza visual y fuerza física) son dominios importantes de la psicología científica. Gran parte del trabajo teórico y aplicado temprano en psicometría se llevó a cabo en un intento de medir la inteligencia . Galton, a menudo referido como "el padre de la psicometría", ideó e incluyó pruebas mentales entre sus medidas antropométricas . James McKeen Cattell, considerado un pionero de la psicometría, amplió el trabajo de Galton. Cattell también acuñó el término prueba mental, y es responsable de la investigación y el conocimiento que finalmente llevaron al desarrollo de pruebas modernas. [3]

Corriente alemana [ editar ]

El origen de la psicometría también tiene conexiones con el campo relacionado de la psicofísica . Casi al mismo tiempo que Darwin, Galton y Cattell estaban haciendo sus descubrimientos, Herbart también estaba interesado en "desvelar los misterios de la conciencia humana" a través del método científico. [3] Herbart fue responsable de crear modelos matemáticos de la mente, que fueron influyentes en las prácticas educativas en los años venideros.

EH Weber se basó en el trabajo de Herbart e intentó probar la existencia de un umbral psicológico, diciendo que era necesario un estímulo mínimo para activar un sistema sensorial. Después de Weber, GT Fechner amplió el conocimiento que obtuvo de Herbart y Weber, para idear la ley de que la fuerza de una sensación crece a medida que el logaritmo de la intensidad del estímulo. Seguidor de Weber y Fechner, a Wilhelm Wundt se le atribuye el mérito de haber fundado la ciencia de la psicología. Es la influencia de Wundt la que allanó el camino para que otros desarrollaran pruebas psicológicas. [3]

Siglo XX [ editar ]

En 1936, el psicometrista LL Thurstone , fundador y primer presidente de la Psychometric Society, desarrolló y aplicó un enfoque teórico a la medición denominado ley del juicio comparativo , un enfoque que tiene estrechas conexiones con la teoría psicofísica de Ernst Heinrich Weber y Gustav Fechner. . Además, Spearman y Thurstone hicieron importantes contribuciones a la teoría y aplicación del análisis factorial , un método estadístico desarrollado y utilizado ampliamente en psicometría. [ cita requerida ] A finales de la década de 1950, Leopold Szondihizo una evaluación histórica y epistemológica del impacto del pensamiento estadístico en la psicología durante las últimas décadas: "en las últimas décadas, el pensamiento específicamente psicológico ha sido casi completamente suprimido y eliminado, y reemplazado por un pensamiento estadístico. Precisamente aquí vemos el cáncer de la testología y la testomanía de hoy ". [4]

Más recientemente, la teoría psicométrica se ha aplicado en la medición de la personalidad , las actitudes y creencias , y el rendimiento académico . La medición de estos fenómenos inobservables es difícil, y gran parte de la investigación y la ciencia acumulada en esta disciplina se ha desarrollado en un intento por definir y cuantificar adecuadamente dichos fenómenos. Los críticos, incluidos los profesionales de las ciencias físicas y los activistas sociales , han argumentado que tal definición y cuantificación es increíblemente difícil, y que tales medidas a menudo se utilizan incorrectamente, como ocurre con las pruebas psicométricas de personalidad que se utilizan en los procedimientos de empleo:

"Por ejemplo, un empleador que desee a alguien para un puesto que requiera atención constante a los detalles repetitivos probablemente no querrá darle ese trabajo a alguien que es muy creativo y se aburre fácilmente". [5]

Las figuras que hicieron contribuciones significativas a la psicometría incluyen a Karl Pearson , Henry F. Kaiser, Carl Brigham , LL Thurstone , EL Thorndike , Georg Rasch , Eugene Galanter , Johnson O'Connor , Frederic M. Lord , Ledyard R Tucker y Jane Loevinger .

Definición de medición en las ciencias sociales [ editar ]

La definición de medición en las ciencias sociales tiene una larga historia. Una definición actualmente extendida, propuesta por Stanley Smith Stevens (1946), es que la medición es "la asignación de números a objetos o eventos de acuerdo con alguna regla". Esta definición se introdujo en el artículo en el que Stevens propuso cuatro niveles de medición . Aunque ampliamente adoptada, esta definición difiere en aspectos importantes de la definición más clásica de medición adoptada en las ciencias físicas, es decir, que la medición científica implica "la estimación o descubrimiento de la relación de alguna magnitud de un atributo cuantitativo a una unidad del mismo atributo "(pág. 358) [6]

De hecho, la definición de medición de Stevens se presentó en respuesta al Comité Británico de Ferguson, cuyo presidente, A. Ferguson, era un físico. El comité fue designado en 1932 por la Asociación Británica para el Avance de la Ciencia para investigar la posibilidad de estimar cuantitativamente los eventos sensoriales. Aunque su presidente y otros miembros eran físicos, el comité también incluía a varios psicólogos. El informe del comité destacó la importancia de la definición de medición. Si bien la respuesta de Stevens fue proponer una nueva definición, que ha tenido una influencia considerable en el campo, esta no fue de ninguna manera la única respuesta al informe. Otra respuesta, notablemente diferente, fue aceptar la definición clásica, como se refleja en la siguiente declaración:

La medición en psicología y física no es diferente en ningún sentido. Los físicos pueden medir cuándo pueden encontrar las operaciones mediante las cuales pueden cumplir con los criterios necesarios; los psicólogos tienen que hacer lo mismo. No necesitan preocuparse por las misteriosas diferencias entre el significado de la medición en las dos ciencias (Reese, 1943, p. 49). [7]

Estas respuestas divergentes se reflejan en enfoques alternativos de medición. Por ejemplo, los métodos basados ​​en matrices de covarianza se emplean típicamente bajo la premisa de que los números, como los puntajes brutos derivados de las evaluaciones, son mediciones. Tales enfoques implican implícitamente la definición de medición de Stevens, que solo requiere que los números se asignen de acuerdo con alguna regla. Entonces, generalmente se considera que la principal tarea de investigación es el descubrimiento de asociaciones entre puntuaciones y de los factores que se postulan para subyacer a tales asociaciones. [8]

Por otro lado, cuando se emplean modelos de medición como el modelo de Rasch , los números no se asignan según una regla. En cambio, de acuerdo con la declaración de Reese anterior, se establecen criterios específicos para la medición, y el objetivo es construir procedimientos u operaciones que proporcionen datos que cumplan con los criterios relevantes. Las mediciones se estiman en función de los modelos y se realizan pruebas para determinar si se han cumplido los criterios relevantes. [ cita requerida ]

Instrumentos y procedimientos [ editar ]

Los primeros instrumentos psicométricos [ cita requerida ] fueron diseñados para medir el concepto de inteligencia . [9] Un enfoque histórico involucró la prueba de CI de Stanford-Binet , desarrollada originalmente por el psicólogo francés Alfred Binet . Una concepción alternativa de la inteligencia es que las capacidades cognitivas dentro de los individuos son una manifestación de un componente general, o factor de inteligencia general , así como la capacidad cognitiva específica de un dominio dado. [ cita requerida ]

Otro enfoque importante en psicometría ha sido la prueba de personalidad . Ha habido una variedad de enfoques teóricos para conceptualizar y medir la personalidad. Algunos de los instrumentos más conocidos incluyen el Inventario Multifásico de Personalidad de Minnesota , el Modelo de Cinco Factores (o "5 Grandes") y herramientas como el Inventario de Personalidad y Preferencias y el Indicador de Tipo Myers-Briggs . Las actitudes también se han estudiado ampliamente utilizando enfoques psicométricos. [ cita requerida ] Un método común en la medición de actitudes es el uso de la escala Likert. Un método alternativo implica la aplicación de modelos de medida desplegables, siendo el más general el Modelo Coseno Hiperbólico (Andrich & Luo, 1993). [10]

Enfoques teóricos [ editar ]

Los psicometristas han desarrollado varias teorías de medición diferentes. Estos incluyen la teoría de pruebas clásica (CTT) y la teoría de respuesta al ítem (IRT). [11] [12] Un enfoque que parece matemáticamente similar al IRT pero también bastante distintivo, en términos de sus orígenes y características, está representado por el modelo de medición de Rasch . El desarrollo del modelo de Rasch, y la clase más amplia de modelos a los que pertenece, se basó explícitamente en los requisitos de medición en las ciencias físicas. [13]

Los psicometristas también han desarrollado métodos para trabajar con grandes matrices de correlaciones y covarianzas. Las técnicas en esta tradición general incluyen: análisis factorial , [14] un método para determinar las dimensiones subyacentes de los datos. Uno de los principales desafíos que enfrentan los usuarios del análisis factorial es la falta de consenso sobre los procedimientos adecuados para determinar el número de factores latentes . [15] Un procedimiento habitual es dejar de factorizar cuando los valores propios caen por debajo de uno porque la esfera original se encoge. La falta de puntos de corte también afecta a otros métodos multivariados. [ cita requerida ]

El escalado multidimensional [16] es un método para encontrar una representación simple de datos con un gran número de dimensiones latentes. El análisis de conglomerados es un método para encontrar objetos que se parezcan entre sí. El análisis factorial, el escalado multidimensional y el análisis de conglomerados son todos métodos descriptivos multivariados que se utilizan para extraer grandes cantidades de estructuras de datos más simples.

Más recientemente, el modelado de ecuaciones estructurales [17] y el análisis de ruta representan enfoques más sofisticados para trabajar con matrices de covarianza grandes . Estos métodos permiten ajustar modelos estadísticamente sofisticados a los datos y probarlos para determinar si son adecuados. Debido a que a un nivel granular la investigación psicométrica se ocupa del alcance y la naturaleza de la multidimensionalidad en cada uno de los elementos de interés, un procedimiento relativamente nuevo conocido como análisis bi-factorial [18] [19] [20] puede ser útil. El análisis de dos factores puede descomponer "la varianza sistemática de un ítem en términos de, idealmente, dos fuentes, un factor general y una fuente de varianza sistemática adicional". [21]

Conceptos clave [ editar ]

Los conceptos clave en la teoría de pruebas clásica son confiabilidad y validez . Una medida confiable es aquella que mide un constructo de manera consistente a lo largo del tiempo, los individuos y las situaciones. Una medida válida es aquella que mide lo que se pretende medir. La confiabilidad es necesaria, pero no suficiente, para la validez.

Tanto la fiabilidad como la validez pueden evaluarse estadísticamente. La consistencia sobre medidas repetidas de la misma prueba se puede evaluar con el coeficiente de correlación de Pearson, y a menudo se denomina confiabilidad prueba-reprueba. [22] De manera similar, la equivalencia de diferentes versiones de la misma medida puede indexarse ​​mediante una correlación de Pearson , y se denomina confiabilidad de formas equivalentes o un término similar. [22]

La consistencia interna, que aborda la homogeneidad de una única forma de prueba, puede evaluarse correlacionando el desempeño en dos mitades de una prueba, lo que se denomina confiabilidad dividida por la mitad ; el valor de este coeficiente de correlación producto-momento de Pearson para dos medias pruebas se ajusta con la fórmula de predicción de Spearman-Brown para que corresponda a la correlación entre dos pruebas completas. [22] Quizás el índice de confiabilidad más comúnmente utilizado es el α de Cronbach , que es equivalente a la media de todos los posibles coeficientes de mitades divididas. Otros enfoques incluyen la correlación intraclase, que es la relación entre la varianza de las mediciones de un objetivo dado y la varianza de todos los objetivos.

Hay varias formas diferentes de validez. La validez relacionada con el criterio se refiere al grado en que una prueba o escala predice una muestra de comportamiento, es decir, el criterio, que es "externo al propio instrumento de medición". [23] Esa muestra externa de comportamiento puede ser muchas cosas, incluida otra prueba; promedio de calificaciones universitarias como cuando el SAT de la escuela secundaria se usa para predecir el desempeño en la universidad; e incluso comportamiento que ocurrió en el pasado, por ejemplo, cuando se usa una prueba de síntomas psicológicos actuales para predecir la ocurrencia de victimización pasada (lo que representaría con precisión la postdicción). Cuando la medida de criterio se recopila al mismo tiempo que la medida que se valida, el objetivo es establecer la validez concurrente; cuando el criterio se recopila más tarde, el objetivo es establecer la validez predictiva . Una medida tiene validez de constructo si está relacionada con medidas de otros constructos como lo requiere la teoría. La validez de contenido es una demostración de que los elementos de una prueba hacen un trabajo adecuado al cubrir el dominio que se mide. En un ejemplo de selección de personal, el contenido de la prueba se basa en una declaración definida o un conjunto de declaraciones de conocimiento, habilidad, habilidad u otras características obtenidas de un análisis de trabajo .

La teoría de la respuesta al ítem modela la relación entre rasgos latentesy respuestas a los elementos de la prueba. Entre otras ventajas, la TRI proporciona una base para obtener una estimación de la ubicación de un examinado en un rasgo latente dado, así como el error estándar de medición de esa ubicación. Por ejemplo, el conocimiento de historia de un estudiante universitario puede deducirse de su puntaje en una prueba universitaria y luego compararse de manera confiable con el conocimiento de un estudiante de secundaria deducido de una prueba menos difícil. Los puntajes derivados de la teoría clásica de los exámenes no tienen esta característica, y la evaluación de la capacidad real (en lugar de la capacidad relativa a otros examinados) debe evaluarse comparando los puntajes con los de un "grupo normal" seleccionado al azar de la población. De hecho, todas las medidas derivadas de la teoría clásica de las pruebas dependen de la muestra probada, mientras que, en principio,los derivados de la teoría de respuesta al ítem no lo son.

Muchos psicometristas también se preocupan por encontrar y eliminar el sesgo de prueba de sus pruebas psicológicas. El sesgo de la prueba es una forma de error sistemático (es decir, no aleatorio) que lleva a que los examinados de un grupo demográfico tengan una ventaja injustificada sobre los examinados de otro grupo demográfico. [24] Según los principales expertos, el sesgo de la prueba puede causar diferencias en los puntajes promedio entre los grupos demográficos, pero las diferencias en los puntajes de los grupos no son evidencia suficiente de que el sesgo de la prueba está realmente presente porque la prueba podría medir diferencias reales entre los grupos. [25] [24]Los psicometristas utilizan métodos científicos sofisticados para buscar el sesgo de las pruebas y eliminarlo. Las investigaciones muestran que generalmente es imposible para las personas que leen un elemento de prueba determinar con precisión si está sesgado o no. [26]

Estándares de calidad [ editar ]

Las consideraciones de validez y confiabilidad generalmente se consideran elementos esenciales para determinar la calidad de cualquier prueba. Sin embargo, las asociaciones de profesionales y practicantes con frecuencia han colocado estas preocupaciones dentro de contextos más amplios al desarrollar estándares y emitir juicios generales sobre la calidad de cualquier prueba en su conjunto dentro de un contexto dado. Una consideración de preocupación en muchos entornos de investigación aplicada es si la métrica de un inventario psicológico dado es significativa o arbitraria. [27]

Estándares de prueba [ editar ]

En 2014, la Asociación Estadounidense de Investigación Educativa (AERA), la Asociación Estadounidense de Psicología (APA) y el Consejo Nacional de Medición en la Educación (NCME) publicaron una revisión de los Estándares para Pruebas Educativas y Psicológicas , [28] que describe los estándares para el desarrollo de exámenes. , evaluación y uso. Los estándares cubren temas esenciales en las pruebas, incluida la validez, la confiabilidad / errores de medición y la imparcialidad en las pruebas. El libro también establece estándares relacionados con las operaciones de prueba, incluido el diseño y desarrollo de pruebas, puntajes, escalas, normas, vinculación de puntajes, puntajes de corte, administración de exámenes, puntajes, informes, interpretación de puntajes, documentación de exámenes y derechos y responsabilidades de los examinados y los usuarios de exámenes. . Finalmente, elLos estándares cubren temas relacionados con las aplicaciones de pruebas, que incluyen pruebas y evaluaciones psicológicas , pruebas y acreditación en el lugar de trabajo , pruebas y evaluaciones educativas y pruebas en la evaluación de programas y políticas públicas.

Estándares de evaluación [ editar ]

En el campo de la evaluación , y en particular la evaluación educativa , el Comité Conjunto de Estándares para la Evaluación Educativa [29] ha publicado tres conjuntos de estándares para las evaluaciones. Las Normas de evaluación del personal [30] se publicaron en 1988, las Normas de evaluación de programas (segunda edición) [31] se publicaron en 1994 y las Normas de evaluación de estudiantes [32] se publicaron en 2003.

Cada publicación presenta y elabora un conjunto de estándares para su uso en una variedad de entornos educativos. Los estándares proporcionan pautas para diseñar, implementar, evaluar y mejorar la forma de evaluación identificada. [33] Cada uno de los estándares se ha colocado en una de las cuatro categorías fundamentales para promover evaluaciones educativas que sean adecuadas, útiles, factibles y precisas. En estos conjuntos de estándares, las consideraciones de validez y confiabilidad se tratan en el tema de precisión. Por ejemplo, los estándares de precisión de los estudiantes ayudan a garantizar que las evaluaciones de los estudiantes proporcionen información sólida, precisa y creíble sobre el aprendizaje y el desempeño de los estudiantes.

No humanos: animales y máquinas [ editar ]

La psicometría aborda las habilidades humanas , las actitudes, los rasgos y la evolución educativa. En particular, el estudio del comportamiento, los procesos mentales y las habilidades de los animales no humanos se suele abordar mediante la psicología comparada , o con un continuo entre los animales no humanos y el resto de animales mediante la psicología evolutiva . No obstante, hay algunos defensores de una transición más gradual entre el enfoque adoptado para los seres humanos y el enfoque adoptado para los animales (no humanos). [34] [35] [36] [37]

La evaluación de las habilidades, los rasgos y la evolución del aprendizaje de las máquinas ha estado mayoritariamente ajena al caso de humanos y animales no humanos, con enfoques específicos en el área de la inteligencia artificial . También se ha propuesto un enfoque más integrado, bajo el nombre de psicometría universal. [38]

Ver también [ editar ]

  • Teoría de Cattell-Horn-Carroll
  • Teoría clásica de la prueba
  • Psicometría computacional
  • Inventario de conceptos
  • Alfa de Cronbach
  • Procesamiento de datos
  • Evaluación educativa
  • Psicología Educacional
  • Análisis factorial
  • Teoría de la respuesta al ítem
  • Lista de software psicométrico
  • Lista de escuelas de psicometría
  • Operacionalización
  • Psicología cuantitativa
  • Sociedad Psicométrica
  • Modelo Rasch
  • Escala (ciencias sociales)
  • Consejero de la escuela
  • Psicología escolar
  • Prueba estandarizada

Referencias [ editar ]

Bibliografía [ editar ]

  • Andrich, D. y Luo, G. (1993). "Un modelo de coseno hiperbólico para el desarrollo de respuestas dicotómicas de estímulo único" (PDF) . Medición psicológica aplicada . 17 (3): 253–276. CiteSeerX  10.1.1.1003.8107 . doi : 10.1177 / 014662169301700307 . S2CID  120745971 .
  • Michell, J. (1999). Medición en Psicología . Cambridge: Cambridge University Press. DOI: 10.1017 / CBO9780511490040
  • Rasch, G. (1960/1980). Modelos probabilísticos para algunas pruebas de inteligencia y rendimiento . Copenhagen, Danish Institute for Educational Research), edición ampliada (1980) con prólogo y epílogo de BD Wright. Chicago: Prensa de la Universidad de Chicago.
  • Reese, TW (1943). La aplicación de la teoría de la medida física a la medida de magnitudes psicológicas, con tres ejemplos experimentales. Monografías psicológicas, 55 , 1-89. doi: 10.1037 / h0061367
  • Stevens, SS (1946). "En la teoría de las escalas de medición". Ciencia . 103 (2684): 677–80. Código Bibliográfico : 1946Sci ... 103..677S . doi : 10.1126 / science.103.2684.677 . PMID  17750512 .
  • Thurstone, LL (1927). "Una ley de juicio comparativo". Revisión psicológica . 34 (4): 278–286. doi : 10.1037 / h0070288 .
  • Thurstone, LL (1929). La medición del valor psicológico. En TV Smith y WK Wright (Eds.), Ensayos en Filosofía de Diecisiete Doctores en Filosofía de la Universidad de Chicago . Chicago: Open Court.
  • Thurstone, LL (1959). La medición de valores . Chicago: Prensa de la Universidad de Chicago.
  • SF Blinkhorn (1997). "Pasado imperfecto, futuro condicional: cincuenta años de teoría de la prueba". Br. J. Math. Estadístico. Psychol . 50 (2): 175–185. doi : 10.1111 / j.2044-8317.1997.tb01139.x .
  • Sanford, David (18 de noviembre de 2017). "Cambridge acaba de decirme que Big Data todavía no funciona" . LinkedIn .

Notas [ editar ]

  1. ^ Consejo Nacional de Medición en Educación http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorP Archivado 2017-07 -22 en la Wayback Machine
  2. ^ Kaplan, RM y Saccuzzo, DP (2010). Pruebas psicológicas: principios, aplicaciones y problemas. (8ª ed.). Belmont, CA: Wadsworth, Cengage Learning.
  3. ↑ a b c Kaplan, RM y Saccuzzo, DP (2010). Tresting psicológico: principios, aplicaciones y problemas (8ª ed.). Belmont, CA: Wadsworth, Cengage Learning.
  4. ^ Leopold Szondi (1960) Das zweite Buch: Lehrbuch der Experimentellen Triebdiagnostik . Huber, Berna y Stuttgart, 2ª edición. Capítulo 27, De la traducción al español, B) II Las condiciones estadisticas , p.396. Cotización:

    el pensamiento psicologico especifico, en las ultima decadas, fue suprimido y eliminado casi totalmente, sustituido por un pensamiento estadistico. Precisamente aqui vemos el cáncer de la testología y testomania de hoy.

  5. ^ Evaluaciones psicométricas. Evaluaciones psicométricas. Universidad de Melbourne.
  6. ^ Michell, Joel (agosto de 1997). "La ciencia cuantitativa y la definición de medición en psicología". Revista británica de psicología . 88 (3): 355–383. doi : 10.1111 / j.2044-8295.1997.tb02641.x .
  7. ^ Reese, TW (1943). La aplicación de la teoría de la medida física a la medida de magnitudes psicológicas, con tres ejemplos experimentales. Monografías psicológicas, 55 , 1-89. doi: 10.1037 / h0061367
  8. ^ http://www.assessmentpsychology.com/psychometrics.htm
  9. ^ "Los diferentes tipos de tests psicometricos - examen psicometrico" . examenpsicometrico.com .
  10. ^ Andrich, D. y Luo, G. (1993). Un modelo de rasgo latente de coseno hiperbólico para desarrollarrespuestas dicotómicas de estímulo único. Medición psicológica aplicada, 17, 253-276.
  11. ^ Embretson, SE y Reise, SP (2000). Teoría de la respuesta al ítem para psicólogos . Mahwah, Nueva Jersey: Erlbaum.
  12. ^ Hambleton, RK y Swaminathan, H. (1985). Teoría de la respuesta al ítem: principios y aplicaciones. Boston: Kluwer-Nijhoff.
  13. Rasch, G. (1960/1980). Modelos probabilísticos para algunas pruebas de inteligencia y rendimiento . Copenhague, Instituto Danés de Investigación Educativa, edición ampliada (1980) con prólogo y epílogo de BD Wright. Chicago: Prensa de la Universidad de Chicago.
  14. ^ Thompson, BR (2004). Análisis factorial exploratorio y confirmatorio: comprensión de conceptos y aplicaciones. Asociacion Americana de Psicologia.
  15. ^ Zwick, William R .; Velicer, Wayne F. (1986). "Comparación de cinco reglas para determinar el número de componentes a retener". Boletín psicológico . 99 (3): 432–442. doi : 10.1037 // 0033-2909.99.3.432 .
  16. ^ Davison, ML (1992). Escalamiento multidimensional. Krieger.
  17. ^ Kaplan, D. (2008). Modelado de ecuaciones estructurales: fundaciones y extensiones , 2ª ed. Sabio.
  18. ^ DeMars, CE (2013). Un tutorial sobre la interpretación de las puntuaciones del modelo de dos factores.Revista Internacional de Pruebas, 13 , 354–378. http://dx.doi.org/10 .1080 / 15305058.2013.799067
  19. ^ Reise, SP (2012). El redescubrimiento del modelado bifactorial. Investigación conductual multivariante, 47 , 667–696. http://dx.doi.org/10.1080/00273171.2012.715555
  20. ^ Rodríguez, A., Reise, SP y Haviland, MG (2016). Evaluación de modelos bifactoriales: cálculo e interpretación de índices estadísticos. Métodos psicológicos, 21 , 137-150. http://dx.doi.org/10.1037/met0000045
  21. ^ Schonfeld, IS, Verkuilen, J. y Bianchi, R. (2019). Una ecuación estructural exploratoria que modela un enfoque analítico de dos factores para descubrir qué miden las escalas de agotamiento, depresión y ansiedad. Evaluación psicológica, 31 , 1073-1079. http://dx.doi.org/10.1037/pas0000721 pág. 1075
  22. ^ a b c "Inicio - Fundamentos de la investigación educativa por Del Siegle" . www.gifted.uconn.edu .
  23. ^ Nunnally, JC (1978). Teoría psicométrica (2ª ed.). Nueva York: McGraw-Hill.
  24. ↑ a b Warne, Russell T .; Yoon, Myeongsun; Precio, Chris J. (2014). "Explorando las diversas interpretaciones de" sesgo de prueba " ". Diversidad cultural y psicología de minorías étnicas . 20 (4): 570–582. doi : 10.1037 / a0036503 . PMID 25313435 . 
  25. ^ Reynolds, CR (2000). ¿Por qué se ignora con tanta frecuencia la investigación psicométrica sobre el sesgo en las pruebas mentales? Psicología, políticas públicas y derecho, 6 , 144-150. doi : 10.1037 / 1076-8971.6.1.144
  26. ^ Reschly, DJ (1980) Evidencia psicológica en laopinión de Larry P .: ¿Un caso de solución correcta-problema incorrecto? Revista de psicología escolar, 9 , 123-125.
  27. ^ Blanton, H. y Jaccard, J. (2006). Métricas arbitrarias en psicología. Archivado el 10 demayo de 2006en la Wayback Machine American Psychologist, 61 (1), 27-41.
  28. ^ "Los estándares para pruebas educativas y psicológicas" . apa.org .
  29. ^ Comité conjunto de normas para la evaluación educativa Archivado el 15 de octubre de 2009 en la Wayback Machine.
  30. ^ Comité conjunto de normas para la evaluación educativa. (1988). Los estándares de evaluación de personal: cómo evaluar los sistemas para evaluar a los educadores. Archivado el 12 de diciembre de 2005 en Wayback Machine Newbury Park, CA: Sage Publications.
  31. ^ Comité conjunto de normas para la evaluación educativa. (1994). Estándares de evaluación del programa, 2ª edición. Archivado el 22 de febrero de 2006 en Wayback Machine Newbury Park, CA: Sage Publications.
  32. ^ Comité de Normas para la Evaluación Educativa. (2003). Los estándares de evaluación de los estudiantes: cómo mejorar las evaluaciones de los estudiantes. Archivado el 24 de mayo de 2006 en la Wayback Machine de Newbury Park, CA: Corwin Press.
  33. ^ [ E. Cabrera-Nguyen. "Directrices de autor para la elaboración de informes de resultados de validación y desarrollo en la Revista de la Sociedad de Trabajo Social e Investigación]" . Academia.edu . 1 (2): 99–103.
  34. ^ Humphreys, LG (1987). "Consideraciones psicométricas en la evaluación de diferencias de inteligencia intraespecies". Behav Brain Sci . 10 (4): 668–669. doi : 10.1017 / s0140525x0005514x .
  35. ^ Eysenck, HJ (1987). "Los diversos significados de la inteligencia". Behav Brain Sci . 10 (4): 663. doi : 10.1017 / s0140525x00055060 .
  36. ^ Locurto, C. y Scanlon, C (1987). "Diferencias individuales y factor de aprendizaje espacial en dos cepas de ratones". Behav Brain Sci . 112 : 344–352.
  37. ^ King, James E y Figueredo, Aurelio Jose (1997). "El modelo de cinco factores más el dominio en la personalidad del chimpancé". Revista de Investigación en Personalidad . 31 (2): 257–271. doi : 10.1006 / jrpe.1997.2179 .
  38. ^ J. Hernández-Orallo; DL Dowe; MV Hernández-Lloreda (2013). "Psicometría universal: medición de las habilidades cognitivas en el reino de las máquinas" (PDF) . Investigación de sistemas cognitivos . 27 : 50–74. doi : 10.1016 / j.cogsys.2013.06.001 . hdl : 10251/50244 . S2CID 26440282 .  

Lectura adicional [ editar ]

  • Robert F. DeVellis (2016). Desarrollo de escalas: teoría y aplicaciones . Publicaciones SAGE. ISBN 978-1-5063-4158-3.
  • Borsboom, Denny (2005). Midiendo la mente: cuestiones conceptuales en psicometría contemporánea . Cambridge: Cambridge University Press . ISBN 978-0-521-84463-5. Resumen Lay (28 de junio de 2010).
  • Leslie A. Miller; Robert L. Lovler (2015). Fundamentos de las pruebas psicológicas: un enfoque práctico . Publicaciones SAGE. ISBN 978-1-4833-6927-3.
  • Roderick P. McDonald (2013). Test Theory: Un tratamiento unificado . Prensa de psicología. ISBN 978-1-135-67530-1.
  • Paul Kline (2000). El manual de pruebas psicológicas . Prensa de psicología. ISBN 978-0-415-21158-1.
  • Rush AJ Jr; Primer MB; Blacker D (2008). Manual de medidas psiquiátricas . Editorial Psiquiátrica Estadounidense. ISBN 978-1-58562-218-4. OCLC  85885343 .
  • Ann C Silverlake (2016). Comprensión de los manuales de prueba: una guía y un libro de trabajo . Taylor y Francis. ISBN 978-1-351-97086-0.
  • Fenton H (2019). "¡Los 10 mejores consejos sobre cómo prepararse para una prueba psicométrica para conseguir ese trabajo!" . Instituto de Formación en Optimización Empresarial.
  • Dr. Snigdha Rai (2018). "Una guía definitiva para las pruebas psicométricas" . Mercer Mettl.
  • Radhika Kulkarni (2019). "Contratación mediante pruebas psicométricas en línea" . Psychometrica.
  • Saville, P. y Hopton, T. (2014). "Psicometría en el trabajo" . Libros CPI.CS1 maint: varios nombres: lista de autores ( enlace )

Enlaces externos [ editar ]

  • Estándares APA para pruebas educativas y psicológicas
  • Fondo de artículos de personalidad internacional
  • Comité Conjunto de Estándares para la Evaluación Educativa
  • El Centro de Psicometría, Universidad de Cambridge
  • Página de inicio de Psychometric Society y Psychometrika
  • Laboratorio Psicométrico de Londres