Как да извлечете текст от PDF в macOS Sierra

Съдържание

Един от най -използваните съвременни формати за пренос на информация е PDF (Portable Document Format - Portable Document Format), който е разработен от Adobe и ни предлага множество предимства като:

  • По -голяма сигурност на документите
  • Намаляване на оригиналния размер
  • Съвместимост с множество устройства
  • Запазва целостта на съхраняваните данни, наред с други.

Въпросът е, че в определени моменти и поради множество причини трябва да извличаме изключително съдържанието на текста от PDF файла, без да включваме други елементи като изображения или подписи.

Solvetic ще анализира как лесно да извърши този процес в macOS Sierra, без да прибягва до допълнителни инструменти.

Етап 1
Отваряне на документа: Първата стъпка, която трябва да направите, е да отворите PDF документа, съхраняван локално в macOS Sierra, което ще бъде направено автоматично с помощната програма Preview:

Важно е да се изясни, че ако използваме различни инструменти като Adobe Reader, PDF файлът ще бъде отворен с този инструмент.

Стъпка 2
Избор на текст: Сега продължаваме да копираме информацията от PDF файла, която обикновено правим с мишката, но ако имаме няколко PDF файла, това ще отнеме много време.

Можем да използваме един от следните методи, за да направим този процес много по -ефективен:

  • Отидете в менюто Редактиране и там изберете опцията Избери всички
  • Използвайте комбинацията от клавиши ⌘ + A
.

След като изберете тази опция, ще видим избрания текст:

Стъпка 3
Копирайте и поставете съдържанието: След като текстът в PDF файла е избран, продължаваме да го копираме, като използваме една от следните опции.

Копиране на PDF текст

  • Отидете в менюто Редактиране и там изберете Копиране
  • Използвайте комбинацията от клавиши ⌘ + C

След като имаме тази информация в клипборда, ще отворим приложението TextEdit, използвайки някоя от следните опции

  • Въведете текста на думата в Spotlight и там изберете TextEdit
  • Отидете на пътя go / Applications и там изберете TextEdit

Ще се покаже следният прозорец. Там избираме бутона Нов документ.

Стъпка 4
В новия прозорец отиваме в менюто Формат и там избираме опцията Преобразуване в обикновен текст или можем да използваме комбинацията от клавиши ⇧ + ⌘ + T. Резултатът ще бъде следният:

С този прост метод лесно можем да извлечем текста от необходимите PDF файлове.

wave wave wave wave wave