Cómo utilizar Tesseract OCR en Java

Autor: Robert Simon
Fecha De Creación: 22 Junio 2021
Fecha De Actualización: 1 Mes De Julio 2024
Anonim
Cómo utilizar Tesseract OCR en Java - Artículos
Cómo utilizar Tesseract OCR en Java - Artículos

Contenido

Las bibliotecas de reconocimiento óptico de caracteres Tesseract ofrecen a los desarrolladores un método para escanear documentos y textos en una imagen. Se utilizan para almacenar imágenes de documentos que ya no necesita en papel. Usted puede utilizarlas en Java, creando lazos de control para cada carácter y escribiendo cada uno en un archivo. Para utilizar las bibliotecas Tesseract, debe incluir el "espacio de nombres" de Java para las funciones OCR.


instrucciones

Bibliotecas Tesseract permiten a los usuarios escanear sus documentos (John Foxx / Stockbyte / Getty Images)
  1. Haga clic con el botón derecho del archivo Java que desea utilizar para crear el documento OCR. Haga clic en "Abrir con" y seleccione el editor de Java que desee.

  2. Agregue el espacio de nombres de la biblioteca OCR en la parte superior del archivo. Copie y pegue el siguiente código a su archivo de código fuente:

    com.tplan.robot.imagecomparison.tesseractocr

  3. Cree el código responsable de escanear caracteres en un archivo. Por ejemplo, el código siguiente crea vínculos a través de cada carácter en un archivo y los escribe en un archivo de imagen:

    En el caso de que se produzca un error en el sistema, se debe tener en cuenta que, +1) {Typeline "{_TOCR_LINE {i}}"}


  4. Haga clic en el botón "Guardar" del editor y haga clic en "Ejecutar" para ejecutar el código en un compilador de Java.