La Red de Conocimientos Pedagógicos - Conocimientos de educación temprana - ¿Cómo convertir WORD a un archivo TXT o un archivo WORD?

¿Cómo convertir WORD a un archivo TXT o un archivo WORD?

Alguien más pegó la imagen en Word para crear un documento de Word. Cambiar el sufijo de dicho archivo no sirve de nada. Si desea reconocer contenido de texto y convertirlo en un documento de texto o de Word, primero seleccionará una imagen en el documento de su elección y la guardará como un archivo de imagen, y luego usará el sistema de reconocimiento de texto para identificar el texto en el imagen y conviértala en un archivo de texto o de Word.

La siguiente es una breve introducción al sistema de reconocimiento de caracteres de tabla:

En la historia del desarrollo de los escáneres, la aparición del software de reconocimiento de caracteres (OCR) ha permitido la conversión de imágenes escaneadas. de caracteres impresos en caracteres de texto, proporciona un nuevo método de entrada de texto, mejora en gran medida la eficiencia del trabajo del usuario y también aporta progreso a la aplicación de escáneres. Desde entonces, los escáneres ya no son sólo una herramienta de entrada de gráficos e imágenes, sino que se han convertido realmente en una parte integral del trabajo electrónico de oficina. Posteriormente, los escáneres se utilizaron ampliamente en finanzas, valores, gobierno y otros campos, allanando el camino para que las personas se deshicieran de las cadenas de los documentos en papel y lograran una oficina verdaderamente sin papel.

Actualmente, todos los productos de escáner Zhongjing vendidos en el mercado chino vienen con el software de reconocimiento de caracteres "Shang Shu No. 6". Basado en el conocido software de reconocimiento de texto "Shang Shu No. 5", "Shang Shu No. 6" ha logrado muchos avances nuevos. Ha cambiado la limitación del software de reconocimiento de texto anterior que solo puede reconocer imágenes en "blanco y negro" y puede identificar directamente archivos de imágenes en color y escala de grises. Shangshu No. 6 admite más formatos de archivos escaneados, como los formatos TIFF, BMP y JPG; al mismo tiempo, Shangshu No. 6 ha mejorado Con la función de reconocimiento de formularios, casi todos los formularios se pueden cambiar del formato de imagen al formato de texto libremente editable. Lo más destacable es que "Shang Shu No. 6" también incorpora un diseño humanizado. Una vez instalado el software, las "Instrucciones de Shang Shu No. 6" aparecerán automáticamente en el icono del grupo de programas. Con la ayuda de este manual de usuario, incluso los principiantes pueden dominar rápidamente el uso del software.

Este artículo combina el software del controlador ScanWizard 5 del escáner Zhongjing para presentar en detalle cómo cooperar con el software OCR de Shangshu No. 6 para realizar el reconocimiento de caracteres:

Paso 1: Escanear el archivo de imagen

Se recomienda hacer clic en el icono del software ScanWizard 5 en el escritorio para ingresar a la interfaz del software del controlador del escáner Zhongjing y escanear directamente sin iniciar otros programas de escaneo o programas de edición de imágenes, lo cual puede acelerar enormemente el proceso de escaneo. Al mismo tiempo, preste atención a cambiar el software ScanWizard 5 al modo de trabajo avanzado (como se muestra en la Figura 1) para que los usuarios puedan verificar la resolución cuando el escáner esté funcionando. En el reconocimiento de caracteres, la resolución de escaneo recomendada se establece en 300 ppp, el modo de color puede ser color RGB o escala de grises, el formato del archivo "escaneado" puede ser TIF o JPG y luego el archivo escaneado se guarda en un directorio determinado por el usuario.

Paso 2: Abra Shangshu No. 6 y lea el archivo de imagen escaneado.

Paso 3: Preprocesar las imágenes reconocidas.

El preprocesamiento de imágenes de reconocimiento incluye principalmente los dos pasos de "corrección de inclinación" y "establecimiento del área de reconocimiento correcta". Mientras realiza la corrección de inclinación, puede presionar el botón de la herramienta Corrección de inclinación de imagen en la parte inferior de la barra de herramientas. El sistema abrirá automáticamente un cuadro de diálogo para indicar el ángulo que debe corregirse. En este momento, presione el botón "Sí" y el sistema corregirá la inclinación horizontal de la pantalla. Lo que necesita especial atención aquí es que la "función de corrección automática de inclinación" sólo puede corregir el ángulo de inclinación de 2,8 grados del original. Si el ángulo de inclinación del manuscrito es superior a 2,8 grados, el sistema recomendará al usuario que escanee el manuscrito nuevamente para mejorar la tasa de reconocimiento.

Cómo "configurar correctamente el área de reconocimiento" también es un punto que merece la atención de los usuarios: por ejemplo, el artículo "Haier" en realidad se lee en dos columnas, por lo que al configurar el área de reconocimiento, preste atención a la necesidad de poner esto Las dos columnas están demarcadas por separado, es decir, se configuran dos áreas de identificación (como se muestra en la Figura 2). Al mismo tiempo, para algunos manuscritos de texto, si se inserta una imagen en el medio, se recomienda omitir la configuración del área de reconocimiento para el texto circundante. Además, para imágenes de tipo tabla, para identificar la barra de título, se recomienda seleccionar toda la parte de la tabla y el título como un área de selección de marco separada.

Paso 4: Iniciar la identificación.

Al iniciar "Reconocimiento", preste atención a si la configuración del software de reconocimiento es correcta, especialmente la selección del conjunto de palabras de reconocimiento: si desea reconocer el chino simplificado, seleccione "Conjunto de caracteres de chino simplificado". "; si desea reconocer chino tradicional para chino, seleccione "Conjunto de caracteres de chino tradicional"; al seleccionar "Conjunto de palabras en inglés puro", la tasa de reconocimiento de letras en inglés se puede mejorar considerablemente. Al mismo tiempo, el "Juego de caracteres chinos simplificados" y el "Juego de caracteres chinos tradicionales" también tienen sólidas capacidades de reconocimiento del inglés.

Paso 5: Guarda el logo después de revisarlo.

En el software de reconocimiento de caracteres "Shang Shu No. 6", hay cuatro formatos de guardado (es decir, tipos de guardado de archivos), a saber: Word, Texto, CSV y HTML. Cuando se guarda directamente en formato Word, se puede abrir con el software Microsoft Word y el formato de diseño se puede guardar de forma relativamente completa. Sin embargo, se recomienda que los usuarios generalmente opten por guardar en formato de texto (texto sin formato), porque este formato se puede abrir con casi todos los editores de documentos, si el usuario reconoce el formulario, el resultado del reconocimiento se puede guardar en formato CSV, de modo que; se puede abrir directamente con EXCEL. El formato HTML está diseñado para páginas web y se puede abrir con navegadores de Internet como IE o fckeditor.

1 Dirección de descarga de la versión descifrada de Shangshu No. 6

/other/SHOCR60.zip

Si aún no comprende, consulte /pregunta/ 7714096.html? si=5