OCRGet 1.5.3

Software che permette di effettuare il riconoscimento ottico dei caratteri (OCR) in immagini e PDF, estraendo testo in modo efficiente.


Descrizione


OCRGet è un software che consente di eseguire il riconoscimento ottico dei caratteri (OCR) su immagini e PDF, estraendo testo in modo efficiente. È basato su Python e utilizza la libreria Tesseract OCR, con supporto per automazione tramite interfaccia grafica (GUI) e linea di comando (CLI). Il progetto è rivolto a utenti che hanno bisogno di uno strumento semplice e personalizzabile per estrarre testo da documenti scannerizzati o immagini.

Principali Funzionalità:

  • OCR in Immagini e PDF: Estrae testo da file PNG, JPEG, BMP, TIFF e PDF.
  • Interfaccia Grafica e CLI: Offre una GUI costruita con Tkinter per facilità d'uso e supporto a CLI per automazione.
  • Pre-processamento di Immagini: Include opzioni per migliorare la qualità dell'immagine (regolazione di luminosità, contrasto, binarizzazione) prima dell'OCR.
  • Uscita Flessibile: Il testo estratto può essere salvato in file TXT o copiato negli appunti.
  • Configurazione del Tesseract: Permette di specificare il percorso del Tesseract e parametri aggiuntivi per ottimizzare il riconoscimento.
  • Supporto a Molti Files: Elabora più file in batch tramite CLI.

Screenshot


OCRGet