Как да клонирате всеки уебсайт с HTTrack

Съдържание

HTTrack е безплатен и безплатен и мултиплатформен софтуер, чиято цел е улавяне на уеб, тоест изтеглянето на целия или част от уебсайт, за да може по -късно да се движите офлайн. Има версия за Linux, наречена WebHTTrack, и се нарича неговата версия за Windows WinHTTrack. Можем да изтеглим софтуера HTTrack от официалния му уебсайт:

В случая с Linux можем да го инсталираме и от хранилищата, като използваме следната команда.

 sudo apt-get install httrack

Този софтуер използва се много за копиране на уебсайтове и след това да ги качите на друг сървър и да ги използвате, за да пренасочите трафика към страницата за копиране, изпращайки посетителите към фалшива страница. Използва се и от тези, които искат да видят кода или работата на определен уебсайт. Нека разгледаме пример с уебсайта httrack.com, където се хоства приложението.

 httrack "httrack.com"
Тази команда ще изтегли файловете от мрежата в папка www.httrack.com, които можем да видим локално.

HTTrack заема всеки уебсайт и прави копие в папката или устройството, където сме позиционирани. Това може да бъде полезно при търсене на данни в уебсайта офлайн, като имейл адреси, полезна информация за seo или структура на уебсайт. HTTrack идва както в Windows, така и във версия за Linux, като употребата е същата само, че в Windows има визуален интергаз.

Ние можем използвайте Httrack за тестване на проникване и тестване на сигурността, тъй като когато правите реплика на уебсайт, това позволява да се анализира цялото съдържание и кои файлове се изтеглят, за да се определи, че нито един критичен файл не се вижда от нападател. Когато събираме данни и информация, можем да извършваме тестове, да търсим и анализираме код или ключови думи, също така можем да събираме данни, които могат да бъдат използвани по -късно.

Също така по този начин lхакерите използват направените копия, за да го качат на сървър с уеб-подобен домейн, копиран, за да подражава на уебсайтовете и след това да ги използва чрез фишинг, за да открадне данни от нищо неподозиращи потребители или да извърши атаки за социално инженерство. Httrack има много опции и параметри, които да използвате, за да подобрите изтеглянето, за това се използва командата:

 httrack --help

Някои важни параметри, които можем да използваме с инструмента Httrack, са:

  • : показва максималния размер на файла в байтове за изтегляне, например -м 20000000 еквивалент на 20 mb.
  • -мим: използва се за изтегляне само на определен тип файл, който ще посочим с неговото разширение, например с командата
 httrack www.WEB.com -mime: application / * + mime: application / pdf
Използването на httrack е просто, трябва да добавим домейна на уебсайта, който искаме да копираме и след това да започнем сканирането позиционирани в директория на нашия твърд диск, където ще съхраняваме уебсайта. Трябва да вземем предвид колко връзки или съдържание може да има уебсайт поради количеството информация за изтегляне. Проучването на копието на мрежата може да се използва за търсене на недостатъци и уязвимости, които могат да изложат сърфирането в риск, както и за определяне на кои части е удобно да се шифрова или повиши сигурността.

Ако целта на изтеглянето е да се намери информация за компания или списъци с потребители, телефони или други данни, по -специално за социално инженерство, или се опитват да излъжат уебсайт или вход за получаване на потребителски данни, HTTrack е отличен инструмент и за двете задачи.

Графичен интерфейс с WebHTTrack
WebHTTrack е графичен интерфейс за httrack, който се използва от уеб браузър и позволява копия на цели уебсайтове за офлайн достъп и променя връзките автоматично. Инструменти като WebHTTrack могат да помогнат и да позволят актуализирането на копието, без да се налага да помните параметрите за изтегляне или копиране на уебсайт и неговото съдържание. Можем да го инсталираме с командата:

 sudo apt-get install webhttrack
След това до пуснете го ще напишем същата команда:
 webhttrack
Да се стартирайте графичния интерфейс, можем да преминем директно през менюто с приложения и търсим приложението Browse Mirrored Websites.

Друг вариант е просто, както казахме по -рано от прозореца на терминала, напишете командата webhttrack за стартиране на локален уеб сървър на порт 8080, след което отваряме браузъра, като се има предвид, че той не е в инкогнито или частен режим и в браузъра пишем адреса localhost: 8080.

Това ще ни покаже графичния съветник, който ще ни помогне да работим с httrack, за да започнем, ще трябва да конфигурираме езика и щракнете върху Напред. След това ще конфигурираме нов проект, предимството на графичния интерфейс е, че можем да запишем данните на изтеглените уебсайтове и параметрите, използвани в текстов файл.

След това ще назначим уебсайта, който ще копираме:

След това в Определяне на опции ще конфигурираме параметрите и филтрите чрез съветник:

След това след конфигуриране на филтрите, на следващия екран ще започнем със сканирането.

Недостатъци на използването на HttrackИзползването на инструмента Httrack за извършване на този вид сканиране и изтегляне от уебсайт има някои недостатъци като следното:

  • Той не улавя динамично съдържание или скриптовани страници.
  • Изтеглянето на сайтове, които са твърде големи или с големи файлове, може да доведе до срив на сървъра.
  • Ако използваме httrack в твърде много едновременни връзки към един и същ уебсайт, бихме могли да забавим сървъра или да го изключим от услугата.

Урокът, в който се прави код за проследяване на връзки, може да ви заинтересува:

Проследявайте уеб връзки с Python

Хареса ли ви и помогнахте на този урок?Можете да възнаградите автора, като натиснете този бутон, за да му дадете положителна точка

Така ще помогнете за развитието на сайта, сподели с приятелите си

wave wave wave wave wave