La Red de Conocimientos Pedagógicos - Currículum vitae - ¿Para qué se utiliza principalmente bleu para evaluar?

¿Para qué se utiliza principalmente bleu para evaluar?

Bleu es un algoritmo de evaluación de textos que se utiliza para evaluar en qué medida la traducción automática se corresponde con la traducción humana profesional. La idea central de bleu es que cuanto más se acerque la traducción automática a la traducción humana profesional, mejor será la calidad. La puntuación obtenida por el algoritmo azul se puede utilizar como uno de los indicadores de la calidad de la traducción automática.

En realidad, a menudo necesitamos evaluar manualmente los resultados de la traducción, pero este método es muy lento y costoso porque es necesario invitar a suficientes traductores profesionales para dar un resultado de traducción relativamente confiable. Generalmente, este tipo de evaluación manual es subjetiva y depende en gran medida del nivel profesional y la experiencia.

Para resolver este problema, investigadores en el campo de la traducción automática han inventado algunos indicadores de evaluación automática como BLEU, METEOR y NIST, entre los cuales BLEU es el más cercano a la puntuación humana.

Ventajas y desventajas de BLEU

Ventajas: Conveniente y rápido, los resultados se acercan a la puntuación humana.

Desventajas: Ignorar la precisión de la expresión del lenguaje (gramática); la precisión de la evaluación se verá interferida por palabras comunes; la precisión de la evaluación de oraciones cortas traducidas es a veces mayor si no se consideran sinónimos o expresiones similares; rechazo La traducción razonable; BLEU en sí no persigue una precisión del 100, ni puede alcanzar el 100. Su objetivo es simplemente proporcionar una solución de evaluación automática rápida y buena.