OCRGet 1.5.3

Software que permite realizar reconhecimento óptico de caracteres (OCR) em imagens e PDFs, extraindo texto de maneira eficiente.


Descrição


OCRGet é um software que permite realizar reconhecimento óptico de caracteres (OCR) em imagens e PDFs, extraindo texto de maneira eficiente. Ele é baseado em Python e utiliza a biblioteca Tesseract OCR, com suporte para automação via interface gráfica (GUI) e linha de comando (CLI). O projeto é voltado para usuários que precisam de uma ferramenta simples e personalizável para extrair texto de documentos digitalizados ou imagens.

Principais Funcionalidades:

  • OCR em Imagens e PDFs: Extrai texto de arquivos PNG, JPEG, BMP, TIFF e PDFs.
  • Interface Gráfica e CLI: Oferece uma GUI construída com Tkinter para facilidade de uso e suporte a CLI para automação.
  • Pré-processamento de Imagens: Inclui opções para melhorar a qualidade da imagem (ajuste de brilho, contraste, binarização) antes do OCR.
  • Saída Flexível: O texto extraído pode ser salvo em arquivos TXT ou copiado para a área de transferência.
  • Configuração do Tesseract: Permite especificar o caminho do Tesseract e parâmetros adicionais para otimizar o reconhecimento.
  • Suporte a Múltiplos Arquivos: Processa vários arquivos em lote via CLI.

Captura de Tela


OCRGet