OCRGet 1.5.3

Programvara som möjliggör optisk teckenigenkänning (OCR) i bilder och PDF-filer, och effektivt extraherar text.


Beskrivning


OCRGet är en mjukvara som möjliggör optisk teckenigenkänning (OCR) i bilder och PDF-filer, som effektivt extraherar text. Den är baserad på Python och använder Tesseract OCR-biblioteket, med stöd för automatisering via grafiskt gränssnitt (GUI) och kommandorad (CLI). Projektet riktar sig till användare som behöver ett enkelt och anpassningsbart verktyg för att extrahera text från skannade dokument eller bilder.

Huvudfunktioner:

  • OCR i Bilder och PDF-filer: Extraherar text från filer i PNG, JPEG, BMP, TIFF och PDF-format.
  • Grafiskt Gränssnitt och CLI: Erbjuder en GUI byggd med Tkinter för användarvänlighet och stöd för CLI för automatisering.
  • Förbehandling av Bilder: Inkluderar alternativ för att förbättra bildkvaliteten (justering av ljusstyrka, kontrast, binärisering) före OCR.
  • Flexibel Utdata: Den extraherade texten kan sparas i TXT-filer eller kopieras till urklipp.
  • Konfiguration av Tesseract: Möjlighet att specificera sökvägen till Tesseract och ytterligare parametrar för att optimera igenkänning.
  • Stöd för Flera Filer: Bearbetar flera filer i batch via CLI.

Skärmdump


OCRGet