- Baixe.net
- 实用程序
- 各种各样的
- OCRGet
OCRGet 1.5.3
允许在图像和 PDF 中进行光学字符识别(OCR)的软件,高效提取文本。
描述
OCRGet 是一款允许在图像和PDF中进行光学字符识别(OCR)的软件,能够高效地提取文本。它基于Python,使用Tesseract OCR库,支持通过图形用户界面(GUI)和命令行界面(CLI)进行自动化。该项目面向需要简单且可定制工具以从扫描文档或图像中提取文本的用户。
主要功能:
- 图像和PDF中的OCR:从PNG、JPEG、BMP、TIFF和PDF文件中提取文本。
- 图形界面和CLI:提供使用Tkinter构建的GUI以便于使用,支持CLI以进行自动化。
- 图像预处理:包括在OCR之前改善图像质量的选项(亮度调整、对比度、二值化)。
- 灵活输出:提取的文本可以保存为TXT文件或复制到剪贴板。
- Tesseract配置:允许指定Tesseract的路径和附加参数以优化识别。
- 多文件支持:通过CLI批量处理多个文件。
屏幕截图