OCRGet 1.5.3

برنامج يمكنه إجراء التعرف الضوئي على الحروف (OCR) في الصور وملفات PDF، مستخرجاً النص بطريقة فعالة.


وصف


OCRGet هو برنامج يتيح إجراء التعرف الضوئي على الحروف (OCR) في الصور وملفات PDF، واستخراج النص بشكل فعال. يعتمد البرنامج على بايثون ويستخدم مكتبة Tesseract OCR، مع دعم للتشغيل الآلي عبر واجهة رسومية (GUI) وسطر الأوامر (CLI). يهدف المشروع إلى المستخدمين الذين يحتاجون إلى أداة بسيطة وقابلة للتخصيص لاستخراج النص من المستندات الممسوحة ضوئياً أو الصور.

الميزات الرئيسية:

  • OCR في الصور وملفات PDF: يتم استخراج النص من ملفات PNG وJPEG وBMP وTIFF وPDF.
  • واجهة رسومية وسطر الأوامر: يوفر واجهة رسومية مبنية باستخدام Tkinter لسهولة الاستخدام ودعم سطر الأوامر للتشغيل الآلي.
  • معالجة مسبقة للصور: يشمل خيارات لتحسين جودة الصورة (تعديل السطوع، التباين، ثنائي اللون) قبل إجراء التعرف الضوئي على الحروف.
  • إخراج مرن: يمكن حفظ النص المستخرج في ملفات TXT أو نسخه إلى الحافظة.
  • إعدادات Tesseract: يسمح بتحديد مسار Tesseract ومعلمات إضافية لتحسين عملية التعرف.
  • دعم لملفات متعددة: يعالج ملفات متعددة دفعة واحدة عبر سطر الأوامر.

لقطة الشاشة


OCRGet