OCRGet 1.5.3

सॉफ्टवेयर जो चित्रों और PDFs में ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) करने की अनुमति देता है, कुशलता से पाठ निकालता है।


विवरण


OCRGet एक सॉफ्टवेयर है जो इमेज और PDFs में ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) करने की अनुमति देता है, जिससे टेक्स्ट को प्रभावी तरीके से निकाला जा सकता है। यह Python पर आधारित है और Tesseract OCR लाइब्रेरी का उपयोग करता है, जिसमें ग्राफिकल यूज़र इंटरफेस (GUI) और कमांड लाइन इंटरफेस (CLI) के माध्यम से स्वचालन के लिए समर्थन है। यह प्रोजेक्ट उन उपयोगकर्ताओं के लिए है जिन्हें स्कैन किए गए दस्तावेज़ों या छवियों से टेक्स्ट निकालने के लिए एक सरल और अनुकूलित उपकरण की आवश्यकता है।

मुख्य विशेषताएँ:

  • इमेज और PDFs में OCR: PNG, JPEG, BMP, TIFF और PDFs से टेक्स्ट निकालता है।
  • ग्राफिकल इंटरफेस और CLI: उपयोग में आसानी के लिए Tkinter के साथ एक GUI प्रदान करता है और स्वचालन के लिए CLI का समर्थन करता है।
  • इमेज का प्री-प्रोसेसिंग: OCR से पहले इमेज की गुणवत्ता को सुधारने के लिए विकल्प शामिल हैं (चमक, कंट्रास्ट, बाइनरीकरण का समायोजन)।
  • लचीली आउटपुट: निकाला गया टेक्स्ट TXT फ़ाइलों में सहेजा जा सकता है या क्लिपबोर्ड पर कॉपी किया जा सकता है।
  • Tesseract का कॉन्फ़िगरेशन: पहचान को अनुकूलित करने के लिए Tesseract के पथ और अतिरिक्त पैरामीटर को निर्दिष्ट करने की अनुमति देता है।
  • कई फ़ाइलों का समर्थन: CLI के माध्यम से बैच में कई फ़ाइलों को संसाधित करता है।

स्क्रीनशॉट


OCRGet