Как конвертировать PDF-файл в редактируемый текст с помощью командной строки в Linux

Как конвертировать PDF-файл в редактируемый текст с помощью командной строки в Linux
Как конвертировать PDF-файл в редактируемый текст с помощью командной строки в Linux

Видео: Как конвертировать PDF-файл в редактируемый текст с помощью командной строки в Linux

Видео: Как конвертировать PDF-файл в редактируемый текст с помощью командной строки в Linux
Видео: Калибровка цвета дисплея MacBook и iMac - YouTube 2024, Апрель
Anonim
Существуют различные причины, по которым вы можете конвертировать PDF-файл в редактируемый текст. Возможно, вам нужно пересмотреть старый документ, и все, что у вас есть, это его версия в формате PDF. Преобразование PDF-файлов в Windows легко, но что, если вы используете Linux?
Существуют различные причины, по которым вы можете конвертировать PDF-файл в редактируемый текст. Возможно, вам нужно пересмотреть старый документ, и все, что у вас есть, это его версия в формате PDF. Преобразование PDF-файлов в Windows легко, но что, если вы используете Linux?

Не волнуйтесь. Мы покажем вам, как легко конвертировать PDF-файлы в редактируемый текст с помощью инструмента командной строки pdftotext, который является частью пакета «poppler-utils». Возможно, этот инструмент уже установлен. Чтобы проверить, установлен ли pdftotext в вашей системе, нажмите «Ctrl + Alt + T», чтобы открыть окно терминала. Введите в командной строке следующую команду и нажмите «Ввод».

dpkg –s poppler-utils

ПРИМЕЧАНИЕ. Когда мы говорим, чтобы напечатать что-то в этой статье, и есть кавычки вокруг текста, НЕ вводите кавычки, если мы не укажем иначе.

Если pdftotext не установлен, введите в командной строке следующую команду и нажмите «Ввод».
Если pdftotext не установлен, введите в командной строке следующую команду и нажмите «Ввод».

sudo apt-get install poppler-utils

Введите свой пароль при появлении запроса и нажмите «Ввод».

В пакете poppler-utils имеется несколько инструментов для преобразования PDF в разные форматы, управления файлами PDF и извлечения информации из файлов.
В пакете poppler-utils имеется несколько инструментов для преобразования PDF в разные форматы, управления файлами PDF и извлечения информации из файлов.
Ниже приведена основная команда для преобразования PDF-файла в редактируемый текстовый файл. Нажмите «Ctrl + Alt + T», чтобы открыть окно терминала, введите команду в приглашении и нажмите «Ввод».
Ниже приведена основная команда для преобразования PDF-файла в редактируемый текстовый файл. Нажмите «Ctrl + Alt + T», чтобы открыть окно терминала, введите команду в приглашении и нажмите «Ввод».

pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Измените путь к каждому файлу, чтобы он соответствовал местоположению и имени исходного файла PDF и где вы хотите сохранить полученный текстовый файл. Кроме того, измените имена файлов, чтобы они соответствовали именам ваших файлов.

Текстовый файл создается и может быть открыт так же, как вы можете открыть любой другой текстовый файл в Linux.
Текстовый файл создается и может быть открыт так же, как вы можете открыть любой другой текстовый файл в Linux.
Преобразованный текст может иметь разрывы строк в местах, которые вам не нужны. Разрывы строк вставляются после каждой строки текста в файле PDF.
Преобразованный текст может иметь разрывы строк в местах, которые вам не нужны. Разрывы строк вставляются после каждой строки текста в файле PDF.

pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Если вы хотите конвертировать ряд страниц в файл PDF, используйте флажки «-f» и «-l» (нижний регистр «L»), чтобы указать первую и последнюю страницы в диапазоне, который вы хотите преобразовать.
Если вы хотите конвертировать ряд страниц в файл PDF, используйте флажки «-f» и «-l» (нижний регистр «L»), чтобы указать первую и последнюю страницы в диапазоне, который вы хотите преобразовать.

pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Чтобы преобразовать PDF-файл, защищенный и зашифрованный с помощью пароля владельца, используйте флаг «-opw» (первый символ в флагове - строчная буква «O», а не ноль).
Чтобы преобразовать PDF-файл, защищенный и зашифрованный с помощью пароля владельца, используйте флаг «-opw» (первый символ в флагове - строчная буква «O», а не ноль).

pdftotext -opw ‘password’ /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Измените «пароль» на тот, который используется для защиты исходного PDF-файла, который был преобразован. Убедитесь, что есть одиночные кавычки, а не двойные, вокруг «пароль».

Если файл PDF защищен и зашифрован с помощью пароля пользователя, используйте флаг «-upw» вместо флага «-opw». Остальная команда такая же.
Если файл PDF защищен и зашифрован с помощью пароля пользователя, используйте флаг «-upw» вместо флага «-opw». Остальная команда такая же.
Вы также можете указать тип символа конца строки, который применяется к преобразованному тексту. Это особенно полезно, если вы планируете получить доступ к файлу в другой операционной системе, такой как Windows или Mac. Для этого используйте флаг «-eol» (средний символ в флагове - строчная буква «O», а не ноль), за которым следует пробел и тип конечного символа, который вы хотите использовать (« unix "," dos "или" mac ").
Вы также можете указать тип символа конца строки, который применяется к преобразованному тексту. Это особенно полезно, если вы планируете получить доступ к файлу в другой операционной системе, такой как Windows или Mac. Для этого используйте флаг «-eol» (средний символ в флагове - строчная буква «O», а не ноль), за которым следует пробел и тип конечного символа, который вы хотите использовать (« unix "," dos "или" mac ").
ПРИМЕЧАНИЕ. Если вы не укажете имя файла для текстового файла, pdftotext автоматически использует базу имени файла PDF и добавляет расширение «.txt». Например, файл «file.pdf» будет преобразован в «file.txt». Если текстовый файл указан как «-», преобразованный текст отправляется на stdout, что означает, что текст отображается в окне терминала и не сохраняется в файле.
ПРИМЕЧАНИЕ. Если вы не укажете имя файла для текстового файла, pdftotext автоматически использует базу имени файла PDF и добавляет расширение «.txt». Например, файл «file.pdf» будет преобразован в «file.txt». Если текстовый файл указан как «-», преобразованный текст отправляется на stdout, что означает, что текст отображается в окне терминала и не сохраняется в файле.

Чтобы закрыть окно терминала, нажмите кнопку «X» в верхнем левом углу.

Для получения дополнительной информации о команде pdftotext введите «man pdftotext» в командной строке в окне терминала.

Рекомендуемые: