OCRGet 1.5.3

Software dat optische karakterherkenning (OCR) in afbeeldingen en PDF's mogelijk maakt, waarmee tekst efficiënt kan worden geëxtraheerd.


Beschrijving


OCRGet is een software die het mogelijk maakt om optische tekenherkenning (OCR) uit te voeren op afbeeldingen en PDF's, waarbij tekst efficiënt wordt geëxtraheerd. Het is gebaseerd op Python en maakt gebruik van de Tesseract OCR-bibliotheek, met ondersteuning voor automatisering via een grafische interface (GUI) en de opdrachtregel (CLI). Het project is gericht op gebruikers die behoefte hebben aan een eenvoudige en aanpasbare tool om tekst uit gescande documenten of afbeeldingen te extraheren.

Hoofdfuncties:

  • OCR van Afbeeldingen en PDF's: Extraheert tekst uit PNG-, JPEG-, BMP-, TIFF-bestanden en PDF's.
  • Grafische Interface en CLI: Biedt een GUI gebouwd met Tkinter voor gebruiksgemak en ondersteuning voor CLI voor automatisering.
  • Voorbewerking van Afbeeldingen: Bevat opties om de kwaliteit van de afbeelding te verbeteren (helderheid, contrast, binarisatie) vóór de OCR.
  • Flexibele Uitvoer: De geëxtraheerde tekst kan worden opgeslagen in TXT-bestanden of gekopieerd naar het klembord.
  • Configuratie van Tesseract: Maakt het mogelijk om het pad van Tesseract en aanvullende parameters op te geven om de herkenning te optimaliseren.
  • Ondersteuning voor Meerdere Bestanden: Verwerkt meerdere bestanden in batch via CLI.

Schermafbeelding


OCRGet