¿Para qué se utiliza principalmente bleu para evaluar?
En realidad, a menudo necesitamos evaluar manualmente los resultados de la traducción, pero este método es muy lento y costoso porque es necesario invitar a suficientes traductores profesionales para dar un resultado de traducción relativamente confiable. Generalmente, este tipo de evaluación manual es subjetiva y depende en gran medida del nivel profesional y la experiencia.
Para resolver este problema, investigadores en el campo de la traducción automática han inventado algunos indicadores de evaluación automática como BLEU, METEOR y NIST, entre los cuales BLEU es el más cercano a la puntuación humana.
Ventajas y desventajas de BLEU
Ventajas: Conveniente y rápido, los resultados se acercan a la puntuación humana.
Desventajas: Ignorar la precisión de la expresión del lenguaje (gramática); la precisión de la evaluación se verá interferida por palabras comunes; la precisión de la evaluación de oraciones cortas traducidas es a veces mayor si no se consideran sinónimos o expresiones similares; rechazo La traducción razonable; BLEU en sí no persigue una precisión del 100, ni puede alcanzar el 100. Su objetivo es simplemente proporcionar una solución de evaluación automática rápida y buena.