OCRGet 1.5.3

Программное обеспечение, которое позволяет выполнять оптическое распознавание символов (OCR) на изображениях и PDF-файлах, эффективно извлекая текст.


Описание


OCRGet - это программа, которая позволяет выполнять оптическое распознавание символов (OCR) на изображениях и PDF, эффективно извлекая текст. Она основана на Python и использует библиотеку Tesseract OCR, с поддержкой автоматизации через графический интерфейс (GUI) и командную строку (CLI). Проект нацелен на пользователей, которым необходим простой и настраиваемый инструмент для извлечения текста из отсканированных документов или изображений.

Основные функции:

  • OCR на изображениях и PDF: Извлекает текст из файлов PNG, JPEG, BMP, TIFF и PDF.
  • Графический интерфейс и CLI: Предоставляет GUI, созданный с помощью Tkinter для удобства использования, и поддержку CLI для автоматизации.
  • Предварительная обработка изображений: Включает параметры для улучшения качества изображения (регулировка яркости, контрастности, бинаризация) перед OCR.
  • Гибкий вывод: Извлеченный текст может быть сохранен в файлы TXT или скопирован в буфер обмена.
  • Настройка Tesseract: Позволяет указать путь к Tesseract и дополнительные параметры для оптимизации распознавания.
  • Поддержка нескольких файлов: Обрабатывает несколько файлов в пакетном режиме через CLI.

Скриншот


OCRGet