¿A qué problemas nos enfrentaremos al desarrollar un sistema de traducción con IA de Hokkien?
1. Recopilación de datos: Hokkien es un idioma llamado de bajos recursos, lo que significa que, en comparación con el inglés o el español, no hay muchos. Datos de entrenamiento. Disponibles. Además, hay relativamente pocos traductores del inglés al hokkien, lo que dificulta la recopilación y anotación de datos para entrenar el modelo.
2. Reconocimiento de voz: Para idiomas hablados como el Hokkien, la evaluación de la traducción del habla también es un desafío. Para la evaluación automatizada, los investigadores desarrollaron un sistema que convierte Hokkien en símbolos fonéticos estandarizados.
3. Diseño del modelo: para desarrollar este nuevo sistema de traducción de voz únicamente, los investigadores de MetaAI tuvieron que superar muchos desafíos de los sistemas de traducción automática tradicionales, incluida la recopilación de datos, el diseño de modelos y la evaluación de la precisión.