OCRGet 1.5.3

Software que permite realizar reconocimiento óptico de caracteres (OCR) en imágenes y PDFs, extrayendo texto de manera eficiente.


Descripción


OCRGet es un software que permite realizar reconocimiento óptico de caracteres (OCR) en imágenes y PDFs, extrayendo texto de manera eficiente. Está basado en Python y utiliza la biblioteca Tesseract OCR, con soporte para automatización a través de interfaz gráfica (GUI) y línea de comando (CLI). El proyecto está dirigido a usuarios que necesitan una herramienta simple y personalizable para extraer texto de documentos escaneados o imágenes.

Principales Funcionalidades:

  • OCR en Imágenes y PDFs: Extrae texto de archivos PNG, JPEG, BMP, TIFF y PDFs.
  • Interfaz Gráfica y CLI: Ofrece una GUI construida con Tkinter para facilidad de uso y soporte a CLI para automatización.
  • Preprocesamiento de Imágenes: Incluye opciones para mejorar la calidad de la imagen (ajuste de brillo, contraste, binarización) antes del OCR.
  • Salida Flexible: El texto extraído puede ser guardado en archivos TXT o copiado al portapapeles.
  • Configuración de Tesseract: Permite especificar la ruta de Tesseract y parámetros adicionales para optimizar el reconocimiento.
  • Soporte para Múltiples Archivos: Procesa varios archivos en lote a través de CLI.

Captura de pantalla


OCRGet