✅ Pdfgrep Команди за търсене на PDF файлове Linux терминал

Съдържание

1. Инсталирайте Pdfgrep на Linux
2. Използвайте Pdfgrep в Linux

Операционните системи се основават на командни редове, които ни предлагат множество опции за увеличаване на дистрибуторските възможности, като могат да изпълняват търсения, административни действия, поддръжка и много други.

Точно една от тези опции е свързана с възможността за търсене на определени типове файлове в Linux и по този начин лесен достъп до тяхното съдържание и затова днес ще говорим за pdfgrep, който е фокусиран върху търсенето на PDF файлове.

Какво е pdfgrepPdfgrep е помощна програма за командния ред за търсене на текст в PDF файлове по прост и функционален начин, спестявайки ни време от достъп до всеки файл и търсене на текста с PDF инструменти.
Някои от неговите характеристики са:

Съвместим с Grep, можем да изпълним много параметри на grep като -r, -i, -n или -c.

Възможност за търсене на текст в множество PDF файлове

Представени цветове, тази опция за цвят GNU Grep се поддържа и активира по подразбиране.

Поддържа използването на регулярни изрази.

Безплатен софтуер

1. Инсталирайте Pdfgrep на Linux

Етап 1
В този случай ще използваме Ubuntu, за който е достатъчно да изпълним следния ред. Там въвеждаме буквата S, за да приемем изтеглянето и инсталирането на пакетите.

 sudo apt инсталирате pdfgrep

Стъпка 2
Други опции за инсталиране са:

Изтеглете файла .TAR.GZ на следната връзка.

Стъпка 3

Или изпълнете следната команда:

 git clone https://gitlab.com/pdfgrep/pdfgrep.git

Стъпка 4
След това въведете всеки от следните редове в техния ред:

 ./configure make sudo make install

2. Използвайте Pdfgrep в Linux

Етап 1
След като pdfgrep е инсталиран, това ще бъде синтаксисът за използване:

 pdfgrep [ОПЦИЯ …] ШАБЛОН [ФАЙЛ]

Стъпка 2
Всеки от елементите е:

Опция: Показва атрибутите, които можем да добавим например в търсенето -i или --ignore-case, които пренебрегват разграничаването на главни и малки букви между шаблона, който сме посочили, и този, който трябва да съответства на файла.

Модел: Указва разширен регулярен израз.

Файл: Това е PDF файлът, в който трябва да се извърши търсенето.

Стъпка 3
Ще започнем с просто търсене, например ще търсим думата Solvetic във файла Solvetic.pdf, за това изпълняваме следното:

 pdfgrep Solvetic Solvetic.pdf

Увеличете

Стъпка 4
В този случай този термин съществува само веднъж в споменатия файл, но сега ще търсим термина Windows в официален Microsoft PDF файл и това ще бъде резултатът, който ще видим:

Увеличете

Стъпка 5
Можем да видим, че търсената дума е подчертана, което улеснява нейното местоположение. Сега, ако добавим параметъра -в, Ще бъде възможно да видите резултатите с номера на страницата, където е открит този термин:

Увеличете

Стъпка 6
Друг вариант, който можем да използваме с pdfgrep, е да изброим PDF файловете, които съдържат определен термин, за това изпълняваме следното:

 pdfgrep Solvetic * pdf

Стъпка 7
По този начин PDF файлът, съдържащ термина Solvetic, ще бъде изброен:

Увеличете

Стъпка 8
Ако искаме да отворим PDF файла, можем да изпълним следната команда:

 xdg-open (File.PDF)

Увеличете

Стъпка 9
Общите опции, които ни предлага pdfgrep, са:

-i, --ignore-caseПренебрегвайте различията между малки и главни букви както в изходните, така и във входните файлове.

-F,-фиксирани низовеТълкува PATTERN като списък с фиксирани низове, разделени с нови редове.

-кешИзползвайте кеш за визуализиран текст, за да ускорите работата с големи файлове.

-P, --perl-regexpИнтерпретира PATTERN като Perl-съвместим регулярен израз (PCRE).

-H, --with-filenameОтпечатайте името на файла за всяко съвпадение.

-h, --no-filenameПотиска префикса на името на файла в изхода.

-n, --page-numberПрефикс на всяко съвпадение с номера на страницата, където е намерена думата за търсене.

-c, --countПотиска нормалния изход и вместо това отпечатва броя на съвпаденията за всеки входен файл.

-p, -брой странициОтпечатайте броя на съвпаденията на страница. Това предполага -n.

-ЦвятПозволява маркиране на имена на файлове, номера на страници и съвпадащ текст с различни последователности, за да ги показва цветно в терминала, някои от опциите му са Винаги, тила или автоматични.

-o,-само съвпадениеОтпечатайте само съвпадащата част от ред без заобикалящ контекст.

-r, --рекурсивноПозволява ни да рекурсивно търсим всички файлове (ограничени от --include и --exclude) във всяка директория, следвайки символните връзки само ако са в командния ред.

-R, --recursive-referenceСъщото като -r, но следва всички символни връзки.

-тихо или -qТя ни позволява да излезем от приложението.

С тази pdfgrep се превръща в идеално решение при работа с PDF файлове в Linux среди.