Xinki Pdf Extractor

Программа для извлечения текста из pdf-документа.

Поддерживается несколько форматов для сохранения текста.

Программа портативна, не требует инсталляции, может запускаться с флешки.

  • Платформа: Windows 7/8.
  • Язык интерфейса: русский.

Работа с программой

Полученный текст сохраняется в текстовые файлы в рабочей папке программы в кодировке юникод (UTF-8) с именами вида имя_pdf_документа + .format1.txt, …, имя_pdf_документа + .format8.txt. Открыть текстовый файл можно Блокнотом или с помощью Microsoft Word.

Примечание

Программа не распознает текст на изображениях. Если документ состоит из отсканированных страниц-картинок, то, скорее всего, результирующий текстовый файл будет пуст. Также извлеченный текст может отличаться от текста на страницах-изображениях, поскольку извлеченный текстовый слой из pdf-документа служит для организации поиска и может не точно соответствовать оригиналу.

Как узнать, имеет ли pdf-документ текстовый слой?

Если можно мышкой выделить текст в документе, значит, он содержит текстовый слой. Также можно проверить, работает ли поиск.

История изменений

Версия 1.1, 14.06.2016

Базовая версия.

Аналоги

  • MuPDF
  • Xpdf

Командная строка

xinki_pdf_extractor.exe [имя_pdf_документа]

Если имя_pdf_документа указано, сохраняет текст и автоматически закрывает программу.

Скачать

Xinki Pdf Extractor, версия 1.1, 14.06.2016

Программа предоставляется бесплатно для личного, некоммерческого использования.

Вы не можете модифицировать или переименовывать файлы, входящие в архив.

Скачать последнюю версию

Установка

Программа не требует установки и полностью портативна, можно запускать ее с любого съемного носителя, флешки или диска.

Скачать архив, распаковать его в любую папку и запустить xinki_pdf_extractor.exe.

Для сохранения настроек требуются права на запись в рабочую папку программы.