OCRGet 1.5.3

Oprogramowanie, które umożliwia wykonywanie optycznego rozpoznawania znaków (OCR) w obrazach i plikach PDF, skutecznie wyciągając tekst.


Opis


OCRGet to oprogramowanie, które umożliwia rozpoznawanie optyczne znaków (OCR) w obrazach i plikach PDF, efektywnie wydobywając tekst. Jest oparte na Pythonie i wykorzystuje bibliotekę Tesseract OCR, z obsługą automatyzacji za pomocą interfejsu graficznego (GUI) oraz wiersza poleceń (CLI). Projekt skierowany jest do użytkowników, którzy potrzebują prostego i konfigurowalnego narzędzia do wydobywania tekstu z zeskanowanych dokumentów lub obrazów.

Najważniejsze funkcje:

  • OCR w obrazach i PDF-ach: Wydobywa tekst z plików PNG, JPEG, BMP, TIFF i PDF.
  • Interfejs graficzny i CLI: Oferuje GUI zbudowane z Tkinter dla łatwości użytkowania oraz wsparcie dla CLI w celu automatyzacji.
  • Przetwarzanie wstępne obrazów: Zawiera opcje poprawy jakości obrazu (regulacja jasności, kontrastu, binarizacja) przed OCR.
  • Elastyczne wyjście: Wydobyty tekst można zapisać w plikach TXT lub skopiować do schowka.
  • Konfiguracja Tesseract: Umożliwia określenie ścieżki do Tesseract i dodatkowych parametrów w celu optymalizacji rozpoznawania.
  • Wsparcie dla wielu plików: Przetwarza wiele plików wsadowo za pomocą CLI.

Zrzut Ekranu


OCRGet