Xinki Pdf Extractor
Программа для извлечения текста из pdf-документа.
Поддерживается несколько форматов для сохранения текста.
Программа портативна, не требует инсталляции, может запускаться с флешки.
-
Платформа: Windows 7/8.
-
Язык интерфейса: русский.
Работа с программой
Полученный текст сохраняется в текстовые файлы в рабочей папке программы в кодировке юникод (UTF-8) с именами вида имя_pdf_документа
+ .format1.txt
, …, имя_pdf_документа
+ .format8.txt
. Открыть текстовый файл можно Блокнотом или с помощью Microsoft Word.
Примечание
Программа не распознает текст на изображениях. Если документ состоит из отсканированных страниц-картинок, то, скорее всего, результирующий текстовый файл будет пуст. Также извлеченный текст может отличаться от текста на страницах-изображениях, поскольку извлеченный текстовый слой из pdf-документа служит для организации поиска и может не точно соответствовать оригиналу.
Как узнать, имеет ли pdf-документ текстовый слой?
Если можно мышкой выделить текст в документе, значит, он содержит текстовый слой. Также можно проверить, работает ли поиск.
История изменений
Версия 1.1, 14.06.2016
Базовая версия.
Аналоги
-
MuPDF
-
Xpdf
Командная строка
xinki_pdf_extractor.exe [имя_pdf_документа]
Если имя_pdf_документа
указано, сохраняет текст и автоматически закрывает программу.
Скачать
Xinki Pdf Extractor, версия 1.1, 14.06.2016
Вы не можете модифицировать или переименовывать файлы, входящие в архив.
Установка
Программа не требует установки и полностью портативна, можно запускать ее с любого съемного носителя, флешки или диска.
Скачать архив, распаковать его в любую папку и запустить xinki_pdf_extractor.exe
.
Для сохранения настроек требуются права на запись в рабочую папку программы.