Ganancia acumulada descontada


La ganancia acumulada descontada ( DCG ) es una medida de la calidad de clasificación. En la recuperación de información , a menudo se usa para medir la eficacia de los algoritmos de los motores de búsqueda web o aplicaciones relacionadas. Utilizando una escala de relevancia graduada de documentos en un conjunto de resultados de motor de búsqueda, DCG mide la utilidad, o ganancia , de un documento en función de su posición en la lista de resultados. La ganancia se acumula desde la parte superior de la lista de resultados hasta la parte inferior, y la ganancia de cada resultado se descuenta en los rangos inferiores. [1]

La ganancia acumulativa (CG) es la suma de los valores de relevancia clasificados de todos los resultados en una lista de resultados de búsqueda. Este predecesor de DCG no incluye el rango (posición) de un resultado en la lista de resultados en la consideración de la utilidad de un conjunto de resultados. El CG en una posición de rango particular se define como:

¿Dónde está la relevancia graduada del resultado en la posición ?

El valor calculado con la función CG no se ve afectado por los cambios en el orden de los resultados de búsqueda. Es decir, mover un documento altamente relevante por encima de un documento de mayor rango y menos relevante no cambia el valor calculado para CG (suponiendo ). Según las dos suposiciones hechas anteriormente sobre la utilidad de los resultados de búsqueda, generalmente se prefiere (N) DCG a CG.

La ganancia acumulativa a veces se denomina precisión graduada, ya que es idéntica a la métrica de precisión si la escala de calificación es binaria.

La premisa de DCG es que los documentos altamente relevantes que aparecen más abajo en una lista de resultados de búsqueda deben ser penalizados ya que el valor de relevancia graduada se reduce logarítmicamente proporcional a la posición del resultado.