Cómo utilizar Tesseract OCR en Java

Contenido

instrucciones

Las bibliotecas de reconocimiento óptico de caracteres Tesseract ofrecen a los desarrolladores un método para escanear documentos y textos en una imagen. Se utilizan para almacenar imágenes de documentos que ya no necesita en papel. Usted puede utilizarlas en Java, creando lazos de control para cada carácter y escribiendo cada uno en un archivo. Para utilizar las bibliotecas Tesseract, debe incluir el "espacio de nombres" de Java para las funciones OCR.

instrucciones

Bibliotecas Tesseract permiten a los usuarios escanear sus documentos (John Foxx / Stockbyte / Getty Images)

Haga clic con el botón derecho del archivo Java que desea utilizar para crear el documento OCR. Haga clic en "Abrir con" y seleccione el editor de Java que desee.
Agregue el espacio de nombres de la biblioteca OCR en la parte superior del archivo. Copie y pegue el siguiente código a su archivo de código fuente:

com.tplan.robot.imagecomparison.tesseractocr
Cree el código responsable de escanear caracteres en un archivo. Por ejemplo, el código siguiente crea vínculos a través de cada carácter en un archivo y los escribe en un archivo de imagen:

En el caso de que se produzca un error en el sistema, se debe tener en cuenta que, +1) {Typeline "{_TOCR_LINE {i}}"}
Haga clic en el botón "Guardar" del editor y haga clic en "Ejecutar" para ejecutar el código en un compilador de Java.