La Red de Conocimientos Pedagógicos - Currículum vitae - ¿Qué algoritmo se utiliza para el reconocimiento de caracteres OCR?

¿Qué algoritmo se utiliza para el reconocimiento de caracteres OCR?

La rutina general de OCR es así

1. Primero detecta y extrae el área de texto.

2. Luego utilizamos la transformación de radón hough para corregir el texto.

3. Utilice histograma de proyección para segmentar imágenes de texto de una sola línea.

El último es OCR de una sola línea.

Hay dos ideas principales para el OCR de una sola línea.

Lo primero es dividir los personajes.

Hay muchas formas de dividir personajes. El método más común es utilizar los puntos extremos del histograma de proyección como puntos de segmentación candidatos y utilizar clasificador + búsqueda de haz para buscar los mejores puntos de segmentación.

Después de encontrar el punto de división, el método tradicional es realizar ingeniería de características + clasificador en un solo carácter. El proceso general es -> escala de grises; binarización -> imagen corregida -> extracción de características (varios métodos como pca lbp, etc.) -> cuantificador (los cuantificadores son generalmente SVM, ANN, etc.).

Hoy en día, la CNN (red neuronal convolucional) puede evitar en gran medida la ingeniería de características.

La segunda es que no es necesario dividir personajes.

Otro punto es el reconocimiento de un extremo a otro, pero la premisa es que se necesita una gran cantidad de conjuntos de datos etiquetados. Este método puede generar secuencias de caracteres continuamente sin segmentar la imagen.

La clasificación multietiqueta está disponible para longitudes cortas. Como matrícula y código de verificación. Aquí probé la clasificación de matrículas con múltiples etiquetas. Reconocimiento de extremo a extremo de caracteres no segmentados en el reconocimiento de matrículas.

Este es el método que utiliza Google para identificar los números de las casas en Street View.