Pdfgrep Команди за търсене на PDF файлове Linux терминал

Операционните системи се основават на командни редове, които ни предлагат множество опции за увеличаване на дистрибуторските възможности, като могат да изпълняват търсения, административни действия, поддръжка и много други.

Точно една от тези опции е свързана с възможността за търсене на определени типове файлове в Linux и по този начин лесен достъп до тяхното съдържание и затова днес ще говорим за pdfgrep, който е фокусиран върху търсенето на PDF файлове.

Какво е pdfgrepPdfgrep е помощна програма за командния ред за търсене на текст в PDF файлове по прост и функционален начин, спестявайки ни време от достъп до всеки файл и търсене на текста с PDF инструменти.
Някои от неговите характеристики са:

  • Съвместим с Grep, можем да изпълним много параметри на grep като -r, -i, -n или -c.
  • Възможност за търсене на текст в множество PDF файлове
  • Представени цветове, тази опция за цвят GNU Grep се поддържа и активира по подразбиране.
  • Поддържа използването на регулярни изрази.
  • Безплатен софтуер

1. Инсталирайте Pdfgrep на Linux

Етап 1
В този случай ще използваме Ubuntu, за който е достатъчно да изпълним следния ред. Там въвеждаме буквата S, за да приемем изтеглянето и инсталирането на пакетите.

 sudo apt инсталирате pdfgrep

Стъпка 2
Други опции за инсталиране са:

  • Изтеглете файла .TAR.GZ на следната връзка.

Стъпка 3

  • Или изпълнете следната команда:
 git clone https://gitlab.com/pdfgrep/pdfgrep.git
Стъпка 4
След това въведете всеки от следните редове в техния ред:
 ./configure make sudo make install

2. Използвайте Pdfgrep в Linux

Етап 1
След като pdfgrep е инсталиран, това ще бъде синтаксисът за използване:

 pdfgrep [ОПЦИЯ …] ШАБЛОН [ФАЙЛ]
Стъпка 2
Всеки от елементите е:
  • Опция: Показва атрибутите, които можем да добавим например в търсенето -i или --ignore-case, които пренебрегват разграничаването на главни и малки букви между шаблона, който сме посочили, и този, който трябва да съответства на файла.
  • Модел: Указва разширен регулярен израз.
  • Файл: Това е PDF файлът, в който трябва да се извърши търсенето.

Стъпка 3
Ще започнем с просто търсене, например ще търсим думата Solvetic във файла Solvetic.pdf, за това изпълняваме следното:

 pdfgrep Solvetic Solvetic.pdf

Увеличете

Стъпка 4
В този случай този термин съществува само веднъж в споменатия файл, но сега ще търсим термина Windows в официален Microsoft PDF файл и това ще бъде резултатът, който ще видим:

Увеличете

Стъпка 5
Можем да видим, че търсената дума е подчертана, което улеснява нейното местоположение. Сега, ако добавим параметъра -в, Ще бъде възможно да видите резултатите с номера на страницата, където е открит този термин:

Увеличете

Стъпка 6
Друг вариант, който можем да използваме с pdfgrep, е да изброим PDF файловете, които съдържат определен термин, за това изпълняваме следното:

 pdfgrep Solvetic * pdf
Стъпка 7
По този начин PDF файлът, съдържащ термина Solvetic, ще бъде изброен:

Увеличете

Стъпка 8
Ако искаме да отворим PDF файла, можем да изпълним следната команда:

 xdg-open (File.PDF)

Увеличете

Стъпка 9
Общите опции, които ни предлага pdfgrep, са:

-i, --ignore-caseПренебрегвайте различията между малки и главни букви както в изходните, така и във входните файлове.

-F,-фиксирани низовеТълкува PATTERN като списък с фиксирани низове, разделени с нови редове.

-кешИзползвайте кеш за визуализиран текст, за да ускорите работата с големи файлове.

-P, --perl-regexpИнтерпретира PATTERN като Perl-съвместим регулярен израз (PCRE).

-H, --with-filenameОтпечатайте името на файла за всяко съвпадение.

-h, --no-filenameПотиска префикса на името на файла в изхода.

-n, --page-numberПрефикс на всяко съвпадение с номера на страницата, където е намерена думата за търсене.

-c, --countПотиска нормалния изход и вместо това отпечатва броя на съвпаденията за всеки входен файл.

-p, -брой странициОтпечатайте броя на съвпаденията на страница. Това предполага -n.

-ЦвятПозволява маркиране на имена на файлове, номера на страници и съвпадащ текст с различни последователности, за да ги показва цветно в терминала, някои от опциите му са Винаги, тила или автоматични.

-o,-само съвпадениеОтпечатайте само съвпадащата част от ред без заобикалящ контекст.

-r, --рекурсивноПозволява ни да рекурсивно търсим всички файлове (ограничени от --include и --exclude) във всяка директория, следвайки символните връзки само ако са в командния ред.

-R, --recursive-referenceСъщото като -r, но следва всички символни връзки.

-тихо или -qТя ни позволява да излезем от приложението.

С тази pdfgrep се превръща в идеално решение при работа с PDF файлове в Linux среди.

wave wave wave wave wave