NIST es un método para evaluar la calidad del texto que se ha traducido mediante traducción automática . Su nombre proviene del Instituto Nacional de Estándares y Tecnología de EE. UU .
Se basa en la métrica BLEU , pero con algunas modificaciones. Donde BLEU simplemente calcula n-gram precisión la adición de un peso igual a cada uno, NIST también calcula cómo informativo un particular, n-gram es. Es decir, cuando se encuentra un n-gramo correcto , cuanto más raro sea el n-gramo, más peso se le dará. [1]
Por ejemplo, si el bigrama "en el" se empareja correctamente, recibirá un peso menor que el emparejamiento correcto de los "cálculos interesantes" del bigrama, ya que es menos probable que esto ocurra.
NIST también se diferencia de BLEU en su cálculo de la penalización por brevedad en la medida en que pequeñas variaciones en la longitud de la traducción no afectan tanto a la puntuación general.
Ver también
Referencias
- ^ "Evaluación automática de la calidad de la traducción automática mediante estadísticas de coincidencia de N-gram" (PDF) . Consultado el 17 de abril de 2010 .
Resultados oficiales de la evaluación de traducción automática de NIST 2005