Alfa de Krippendorff

El coeficiente alfa de Krippendorff , ^[1] llamado así por el académico Klaus Krippendorff , es una medida estadística del acuerdo alcanzado al codificar un conjunto de unidades de análisis. Desde la década de 1970, alfa se ha utilizado en el análisis de contenido donde las unidades textuales son categorizadas por lectores capacitados, en el asesoramiento y la investigación de encuestas donde los expertos codifican los datos de entrevistas abiertas en términos analizables, en pruebas psicológicas donde las pruebas alternativas de los mismos fenómenos deben ser comparados, o en estudios observacionales donde los sucesos no estructurados se registran para su análisis posterior.

El alfa de Krippendorff generaliza varias estadísticas conocidas, a menudo llamadas medidas de concordancia entre codificadores, confiabilidad entre evaluadores , confiabilidad de codificar conjuntos de unidades dados (a diferencia de la unificación), pero también se distingue de las estadísticas que se denominan coeficientes de confiabilidad pero que no son adecuadas para los detalles de los datos de codificación generados para su análisis posterior.

El alfa de Krippendorff es aplicable a cualquier número de codificadores, cada uno asignando un valor a una unidad de análisis, a datos incompletos (faltantes), a cualquier número de valores disponibles para codificar una variable, a binario, nominal, ordinal, intervalo, relación, polar y métricas circulares ( niveles de medición ), y se ajusta a pequeños tamaños de muestra de los datos de confiabilidad. La virtud de un coeficiente único con estas variaciones es que las confiabilidades calculadas son comparables entre cualquier número de codificadores, valores, métricas diferentes y tamaños de muestra desiguales.

Los datos de confiabilidad se generan en una situación en la que m ≥ 2 se instruye conjuntamente (por ejemplo, mediante un libro de códigos ) pero los codificadores que trabajan de forma independiente asignan cualquiera de un conjunto de valores 1, ..., V a un conjunto común de N unidades de análisis . En su forma canónica, los datos de confiabilidad se tabulan en una matriz m- por- N que contiene N valores v _ij que el codificador c _i ha asignado a la unidad u _j . Defina m _j como el número de valores asignados a la unidad j en todos los codificadores c. Cuando los datos están incompletos, m _j puede ser menor que m . Los datos de confiabilidad requieren que los valores sean emparejables, es decir, m _j ≥ 2. El número total de valores emparejables es n ≤ mN .

Denotamos por el conjunto de todas las respuestas posibles que puede dar un observador. Las respuestas de todos los observadores para un ejemplo se denominan unidades (forman un conjunto múltiple). Se denota un conjunto múltiple con estas unidades como los artículos, . ${\ Displaystyle R}$ ${\ Displaystyle U}$

donde se observa el desacuerdo y es el desacuerdo esperado por casualidad. $D_{o}$ $D_{e}$