La Red de Conocimientos Pedagógicos - Currículum vitae - ¿Qué software es COR?

¿Qué software es COR?

OCR es una función, no el nombre de un software, sino algunas funciones de OCR que se pueden implementar en combinación con la configuración del hardware.

OCR (Reconocimiento Óptico de Caracteres) significa que un dispositivo electrónico (como un escáner o una cámara digital) examina los caracteres impresos en papel, determina su forma detectando patrones claros y oscuros y luego traduce la forma en un computadora a través del proceso de reconocimiento de caracteres.

Para los caracteres impresos, el texto del documento en papel se convierte ópticamente en un archivo de imagen de matriz de puntos en blanco y negro. El texto de la imagen se convierte a formato de texto mediante un software de reconocimiento para su posterior edición y procesamiento en Word. software de procesamiento.

Cómo depurar o utilizar información auxiliar para mejorar la precisión del reconocimiento es el tema más importante de OCR, y surgió el término ICR (reconocimiento inteligente de caracteres). Los principales indicadores para medir el rendimiento de un sistema OCR son: tasa de rechazo, tasa de error, velocidad de reconocimiento, facilidad de interfaz de usuario, estabilidad del producto, facilidad de uso y viabilidad.

Datos ampliados

Debido a la popularidad y la amplia aplicación de los escáneres, el software OCR solo necesita proporcionar una interfaz con el escáner y utilizar el software del controlador del escáner. Por lo tanto, el software OCR consta principalmente de las siguientes partes.

Entrada y preprocesamiento de imágenes:

Entrada de imágenes: para diferentes formatos de imagen, existen diferentes formatos de almacenamiento y diferentes métodos de compresión. Actualmente existen proyectos de código abierto como OpenCV y CxImage. Preprocesamiento: incluye principalmente binarización, eliminación de ruido, corrección de inclinación, etc.

Binarización:

La mayoría de las fotografías tomadas por las cámaras son imágenes en color, que contienen una gran cantidad de información. Para el contenido de la imagen, simplemente podemos dividirla en primer plano y fondo. Para que la computadora reconozca los caracteres más rápido y mejor, primero debemos procesar la imagen en color para que la imagen solo tenga información de primer plano e información de fondo. Simplemente podemos definir la información de primer plano como negra y la información de fondo como blanca, que es. una imagen binaria.

Eliminación de ruido:

Para diferentes documentos, podemos definir el ruido de manera diferente en función de las características del ruido.

Enciclopedia Baidu: reconocimiento óptico de caracteres

上篇: ¿Qué es la animación? 下篇: Traducción de acceso público

¿Qué software es COR?

Artículos populares