¿Cómo valoras el robot de escritura Xiaomingbot desarrollado por Toutiao?
Conjunto de datos experimental: 150 guiones de comentarios de texto en vivo de partidos de fútbol) + 150 reportajes de noticias oficiales de partidos de fútbol.
Características de los datos: en la parte de texto en vivo, hay 242 oraciones en un solo juego, lo que representa 4.590 palabras; en la sección de noticias normal, un promedio de 32 oraciones en un solo juego, 1.185 palabras.
Proceso experimental: Este problema es un proceso de aprendizaje supervisado. La parte de texto en vivo se utiliza como entrada para conjuntos de entrenamiento y prueba. El vector de características de entrada X se configura manualmente con múltiples dimensiones para la representación vectorial de cada oración, y la etiqueta Y se genera a partir de noticias regulares. Por lo tanto, se entrenó un modelo de clasificación de aprendizaje, que puede generar una puntuación para cada oración en el texto transmitido en vivo para representar su importancia, seleccionar una cierta cantidad de oraciones en función de la puntuación y luego combinarlas en una noticia a través del proceso. de eliminar la redundancia.
Así que efectivamente hay un problema con la frase "La diosa del fracaso le extiende una rama de olivo". En primer lugar, las transmisiones de texto en vivo están escritas por personas, y la gente definitivamente no escribirá esas oraciones. En segundo lugar, dado que la IA esencialmente escribe noticias seleccionando oraciones de transmisiones en vivo, ciertamente no incluirá esta oración sin ningún motivo.
Esto es sólo una idea basada en este artículo. Tal vez hayan agregado algunos otros métodos en aplicaciones prácticas, pero la actual llamada "inteligencia artificial que reemplaza a editores o reporteros" son solo amigos en el campo del periodismo que se asustan a sí mismos. Después de todo, la inteligencia entrenada es sólo un procesamiento secundario de materiales existentes.