Resumen comparativo de proyectos de código abierto de OCR
El desarrollo de ocr ha acumulado mucho. La mayoría de las personas o empresas utilizan servicios de terceros directamente. Actualmente, existen muchas empresas grandes que brindan servicios de terceros. Baidu, Alibaba Cloud, Tencent, etc. proporcionan interfaces API muy convenientes a las que se puede llamar, y la velocidad de reconocimiento, la precisión y el efecto también son muy buenos. La única desventaja es que las llamadas API requieren cargos, que siguen siendo muy bajos para individuos y empresas que no llaman con frecuencia.
Debido a la situación actual de la empresa, existen varios propósitos para utilizar el código abierto.
Actualmente existen muchos proyectos de código abierto relacionados con OCR. Resulta que el autor es una empresa que necesita funciones similares, por lo que hizo una investigación sencilla y la registró aquí.
Espero que puedas señalar que esta encuesta es inexacta.
Tesseract es un motor de reconocimiento de imágenes y texto de código abierto desarrollado por Google y desarrollado en Python.
Por lo que ante la situación actual de la empresa desistí del estudio e inspección de este proyecto.
Paddleocr es el software OCR de reconocimiento chino de código abierto de Baidu.
EasyOCR es una biblioteca de OCR escrita en Python, que se utiliza para reconocer caracteres en imágenes y generarlos como texto, y admite más de 80 idiomas.
ocr chino
ocr_lite chino
TrWebOCR
cnocr
En vista de la comparación y discusión anteriores, al mismo tiempo, de acuerdo con la situación actual de la empresa y algunos objetivos previamente establecidos, elegí temporalmente el cnocr más simple para el aprendizaje y el aprendizaje interno. Al mismo tiempo, dado que cnocr es solo un paquete de Python y no se puede llamar a través de la interfaz, se creó un proyecto complementario hn_ocr.
Actualmente está en github. Todos son bienvenidos a aprender y mejorar juntos.