Teoría de la generalización


La teoría de la generalizabilidad , o teoría G , es un marco estadístico para conceptualizar, investigar y diseñar observaciones confiables . Se utiliza para determinar la confiabilidad (es decir, la reproducibilidad) de las mediciones en condiciones específicas. Es particularmente útil para evaluar la confiabilidad de las evaluaciones de desempeño. Se introdujo originalmente en Cronbach, LJ , Nageswari, R. y Gleser, GC (1963).

En la teoría G, las fuentes de variación se denominan facetas . Las facetas son similares a los "factores" utilizados en el análisis de varianza.y puede incluir personas, evaluadores, elementos / formularios, tiempo y entornos, entre otras posibilidades. Estas facetas son fuentes potenciales de error y el propósito de la teoría de la generalización es cuantificar la cantidad de error causado por cada faceta e interacción de facetas. La utilidad de los datos obtenidos de un estudio G depende fundamentalmente del diseño del estudio. Por lo tanto, el investigador debe considerar cuidadosamente las formas en las que espera generalizar los resultados específicos. ¿Es importante generalizar de un entorno a un número mayor de entornos? ¿De un evaluador a un mayor número de evaluadores? ¿De un conjunto de elementos a un conjunto más grande de elementos? Las respuestas a estas preguntas variarán de un investigador a otro e impulsarán el diseño de un estudio G de diferentes maneras.

Además de decidir qué facetas generalmente desea examinar el investigador, es necesario determinar qué faceta servirá como objeto de medición (por ejemplo, la fuente sistemática de varianza) para el propósito del análisis. Las restantes facetas de interés se consideran entonces como fuentes de error de medición. En la mayoría de los casos, el objeto de medición será la persona a quien se le asigna un número / puntaje. En otros casos, puede ser un grupo o artistas como un equipo o un aula. Idealmente, casi toda la varianza medida se atribuirá al objeto de medición (por ejemplo, diferencias individuales), con solo una cantidad insignificante de variación atribuida a las facetas restantes (por ejemplo, evaluador, tiempo, entorno).

Los resultados de un estudio G también se pueden utilizar para informar una decisión, o un estudio D. En un estudio D, podemos plantearnos la pregunta hipotética de "¿qué pasaría si se modificaran diferentes aspectos de este estudio?" Por ejemplo, una empresa de refrescos podría estar interesada en evaluar la calidad de un nuevo producto mediante el uso de una escala de calificación del consumidor. Al emplear un estudio D, sería posible estimar cómo cambiaría la consistencia de las calificaciones de calidad si a los consumidores se les hicieran 10 preguntas en lugar de 2, o si 1,000 consumidores calificaran el refresco en lugar de 100. Al emplear estudios D simulados, es Por lo tanto, es posible examinar cómo los coeficientes de generalización (similares a los coeficientes de confiabilidad en la teoría de pruebas clásica) cambiaría en diferentes circunstancias y, en consecuencia, determinaría las condiciones ideales en las que nuestras mediciones serían las más fiables.