OCRGet 1.5.3

ซอฟต์แวร์ที่อนุญาตให้ทำการรู้จำอักขระด้วยแสง (OCR) ในภาพและ PDF โดยการดึงข้อความออกมาอย่างมีประสิทธิภาพ


คำอธิบาย


OCRGet คือซอฟต์แวร์ที่ช่วยในการทำการรู้จำอักขระด้วยแสง (OCR) ในภาพและ PDF โดยสามารถดึงข้อความออกมาได้อย่างมีประสิทธิภาพ มันสร้างขึ้นด้วย Python และใช้ไลบรารี Tesseract OCR รองรับการทำงานอัตโนมัติผ่านส่วนติดต่อผู้ใช้ (GUI) และบรรทัดคำสั่ง (CLI) โครงการนี้มุ่งเน้นไปที่ผู้ใช้งานที่ต้องการเครื่องมือที่เรียบง่ายและปรับแต่งได้สำหรับการดึงข้อความจากเอกสารที่สแกนหรือภาพ

ฟังก์ชั่นหลัก:

  • OCR ในภาพและ PDF: ดึงข้อความจากไฟล์ PNG, JPEG, BMP, TIFF และ PDFs
  • ส่วนติดต่อกราฟิกและ CLI: มี GUI ที่สร้างด้วย Tkinter เพื่อความสะดวกในการใช้งานและสนับสนุน CLI สำหรับการทำงานอัตโนมัติ
  • การประมวลผลภาพล่วงหน้า: รวมตัวเลือกเพื่อปรับปรุงคุณภาพของภาพ (การปรับความสว่าง, ความคอนทราสต์, การแปลงเป็นขาวดำ) ก่อนทำการ OCR
  • การส่งออกที่ยืดหยุ่น: ข้อความที่ถูกดึงออกสามารถบันทึกเป็นไฟล์ TXT หรือคัดลอกไปยังคลิปบอร์ด
  • การตั้งค่า Tesseract: อนุญาตให้ระบุพาธของ Tesseract และพารามิเตอร์เพิ่มเติมเพื่อเพิ่มประสิทธิภาพการรู้จำ
  • การสนับสนุนไฟล์หลายๆ ไฟล์: ประมวลผลไฟล์หลายๆ ไฟล์ในครั้งเดียวผ่าน CLI

ภาพหน้าจอ


OCRGet