OCRGet 1.5.3

Perangkat lunak yang memungkinkan melakukan pengenalan karakter optik (OCR) pada gambar dan PDF, mengekstrak teks dengan cara yang efisien.


Deskripsi


OCRGet adalah perangkat lunak yang memungkinkan pengenalan karakter optik (OCR) pada gambar dan PDF, mengekstrak teks dengan cara yang efisien. Ini berbasis Python dan menggunakan pustaka Tesseract OCR, dengan dukungan untuk otomatisasi melalui antarmuka grafis (GUI) dan baris perintah (CLI). Proyek ini ditujukan untuk pengguna yang memerlukan alat sederhana dan dapat disesuaikan untuk mengekstrak teks dari dokumen yang dipindai atau gambar.

Fitur Utama:

  • OCR pada Gambar dan PDF: Mengekstrak teks dari file PNG, JPEG, BMP, TIFF, dan PDF.
  • Antarmuka Grafis dan CLI: Menawarkan GUI yang dibangun dengan Tkinter untuk kemudahan penggunaan dan dukungan CLI untuk otomatisasi.
  • Pra-pemrosesan Gambar: Termasuk opsi untuk meningkatkan kualitas gambar (penyesuaian kecerahan, kontras, binarisasi) sebelum OCR.
  • Output Fleksibel: Teks yang diekstrak dapat disimpan dalam file TXT atau disalin ke papan klip.
  • Konfigurasi Tesseract: Memungkinkan spesifikasi jalur Tesseract dan parameter tambahan untuk mengoptimalkan pengenalan.
  • Dukungan untuk Beberapa File: Memproses beberapa file secara batch melalui CLI.

Tangkapan Layar


OCRGet