Операционните системи се основават на командни редове, които ни предлагат множество опции за увеличаване на дистрибуторските възможности, като могат да изпълняват търсения, административни действия, поддръжка и много други.
Точно една от тези опции е свързана с възможността за търсене на определени типове файлове в Linux и по този начин лесен достъп до тяхното съдържание и затова днес ще говорим за pdfgrep, който е фокусиран върху търсенето на PDF файлове.
Какво е pdfgrepPdfgrep е помощна програма за командния ред за търсене на текст в PDF файлове по прост и функционален начин, спестявайки ни време от достъп до всеки файл и търсене на текста с PDF инструменти.
Някои от неговите характеристики са:
- Съвместим с Grep, можем да изпълним много параметри на grep като -r, -i, -n или -c.
- Възможност за търсене на текст в множество PDF файлове
- Представени цветове, тази опция за цвят GNU Grep се поддържа и активира по подразбиране.
- Поддържа използването на регулярни изрази.
- Безплатен софтуер
1. Инсталирайте Pdfgrep на Linux
Етап 1
В този случай ще използваме Ubuntu, за който е достатъчно да изпълним следния ред. Там въвеждаме буквата S, за да приемем изтеглянето и инсталирането на пакетите.
sudo apt инсталирате pdfgrep
Стъпка 2
Други опции за инсталиране са:
- Изтеглете файла .TAR.GZ на следната връзка.
Стъпка 3
- Или изпълнете следната команда:
git clone https://gitlab.com/pdfgrep/pdfgrep.gitСтъпка 4
След това въведете всеки от следните редове в техния ред:
./configure make sudo make install
2. Използвайте Pdfgrep в Linux
Етап 1
След като pdfgrep е инсталиран, това ще бъде синтаксисът за използване:
pdfgrep [ОПЦИЯ …] ШАБЛОН [ФАЙЛ]Стъпка 2
Всеки от елементите е:
- Опция: Показва атрибутите, които можем да добавим например в търсенето -i или --ignore-case, които пренебрегват разграничаването на главни и малки букви между шаблона, който сме посочили, и този, който трябва да съответства на файла.
- Модел: Указва разширен регулярен израз.
- Файл: Това е PDF файлът, в който трябва да се извърши търсенето.
Стъпка 3
Ще започнем с просто търсене, например ще търсим думата Solvetic във файла Solvetic.pdf, за това изпълняваме следното:
pdfgrep Solvetic Solvetic.pdf
Увеличете
Стъпка 4
В този случай този термин съществува само веднъж в споменатия файл, но сега ще търсим термина Windows в официален Microsoft PDF файл и това ще бъде резултатът, който ще видим:
Увеличете
Стъпка 5
Можем да видим, че търсената дума е подчертана, което улеснява нейното местоположение. Сега, ако добавим параметъра -в, Ще бъде възможно да видите резултатите с номера на страницата, където е открит този термин:
Увеличете
Стъпка 6
Друг вариант, който можем да използваме с pdfgrep, е да изброим PDF файловете, които съдържат определен термин, за това изпълняваме следното:
pdfgrep Solvetic * pdfСтъпка 7
По този начин PDF файлът, съдържащ термина Solvetic, ще бъде изброен:
Увеличете
Стъпка 8
Ако искаме да отворим PDF файла, можем да изпълним следната команда:
xdg-open (File.PDF)
Увеличете
Стъпка 9
Общите опции, които ни предлага pdfgrep, са:
-i, --ignore-caseПренебрегвайте различията между малки и главни букви както в изходните, така и във входните файлове.
-F,-фиксирани низовеТълкува PATTERN като списък с фиксирани низове, разделени с нови редове.
-кешИзползвайте кеш за визуализиран текст, за да ускорите работата с големи файлове.
-P, --perl-regexpИнтерпретира PATTERN като Perl-съвместим регулярен израз (PCRE).
-H, --with-filenameОтпечатайте името на файла за всяко съвпадение.
-h, --no-filenameПотиска префикса на името на файла в изхода.
-n, --page-numberПрефикс на всяко съвпадение с номера на страницата, където е намерена думата за търсене.
-c, --countПотиска нормалния изход и вместо това отпечатва броя на съвпаденията за всеки входен файл.
-p, -брой странициОтпечатайте броя на съвпаденията на страница. Това предполага -n.
-ЦвятПозволява маркиране на имена на файлове, номера на страници и съвпадащ текст с различни последователности, за да ги показва цветно в терминала, някои от опциите му са Винаги, тила или автоматични.
-o,-само съвпадениеОтпечатайте само съвпадащата част от ред без заобикалящ контекст.
-r, --рекурсивноПозволява ни да рекурсивно търсим всички файлове (ограничени от --include и --exclude) във всяка директория, следвайки символните връзки само ако са в командния ред.
-R, --recursive-referenceСъщото като -r, но следва всички символни връзки.
-тихо или -qТя ни позволява да излезем от приложението.
С тази pdfgrep се превръща в идеално решение при работа с PDF файлове в Linux среди.