OCRGet 1.5.3

Görüntüler ve PDF'lerde optik karakter tanıma (OCR) yapmayı sağlayan, metinleri etkili bir şekilde çıkartan yazılım.


Açıklama


OCRGet, görsellerden ve PDF'lerden metin çıkarmayı verimli bir şekilde gerçekleştiren bir optik karakter tanıma (OCR) yazılımıdır. Python tabanlıdır ve Tesseract OCR kütüphanesini kullanır, grafiksel kullanıcı arayüzü (GUI) ve komut satırı arayüzü (CLI) üzerinden otomasyon desteği sunar. Proje, taranmış belgelerden veya görsellerden metin çıkarmak için basit ve özelleştirilebilir bir araca ihtiyaç duyan kullanıcıları hedef almaktadır.

Temel Özellikler:

  • Görsel ve PDF'lerde OCR: PNG, JPEG, BMP, TIFF dosyalarından ve PDF'lerden metin çıkarır.
  • Grafik Arayüz ve CLI: Kullanım kolaylığı için Tkinter ile yapılmış bir GUI sunar ve otomasyon için CLI desteği sağlar.
  • Görüntü Ön İşleme: OCR'dan önce görüntü kalitesini artırmak için (parlaklık, kontrast ayarı, ikileştirme) seçenekler içerir.
  • Esnek Çıktı: Çıkarılan metin, TXT dosyalarına kaydedilebilir veya panoya kopyalanabilir.
  • Tesseract Konfigürasyonu: Tanımayı optimize etmek için Tesseract'ın yolunu ve ek parametreleri belirtmeye olanak tanır.
  • Birden Fazla Dosya Desteği: CLI üzerinden toplu olarak birden fazla dosyayı işler.

Ekran görüntüsü


OCRGet