Веб-архивы Интернета: как искать удалённую информацию и восстанавливать сайты. Часть 2

Веб-архивы Интернета: как искать удалённую информацию и восстанавливать сайты. Часть 2

Life-Hack [Жизнь-Взлом]/Хакинг

#Обучение

Если вы хотите восстановить удалённый сайт, то вам поможет программа Wayback Machine Downloader

Программа загрузит последнюю версию каждого файла, присутствующего в Архиве Интернета Wayback Machine, и сохранить его в папку вида ./websites/example.com/. Она также пересоздаст структуру директорий и автоматически создаст страницы index.html чтобы скаченный сайт без каких либо изменений можно было бы поместить на веб-сервер Apache или Nginx. 

Об установке программы и дополнительных опциях смотрите на странице https://kali.tools/?p=5211 

Пример скачивания полной копии сайта suip.biz из веб-архива: 

wayback_machine_downloader https://suip.biz

Структура скачанных файлов: 

Локальная копия сайта, обратите внимание на провайдера Интернет услуг: 

Как скачать все изменения страницы из веб-архива 

Если вас интересует не весь сайт, а определённая страница, но при этом вам нужно проследить все изменения на ней, то в этом случае используйте программу Waybackpack

К примеру для скачивания всех копий главной страницы сайта suip.biz, начиная с даты (--to-date 2017), эти страницы должны быть помещены в папку (-d /home/mial/test), при этом программа должна следовать HTTP редиректам (--follow-redirects)

waybackpack suip.biz -d ./suip.biz-copy --to-date 2017 --follow-redirects

Структура директорий: 

Чтобы для указанного сайта (hackware.ru) вывести список всех доступных копий в веб-архиве (--list)

waybackpack hackware.ru --list 

Как узнать все страницы сайта, которые сохранены в веб-архиве 

Для получения ссылок, которые хранятся в Архиве Интернета, используйте программу waybackurls

Эта программа извлекает все URL указанного домена, о которых знает Wayback Machine. Это можно использовать для быстрого составления карты сайта. 

Чтобы получить список всех страниц о которых знает Wayback Machine для домена suip.biz: 

echo suip.biz | waybackurls 

Заключение 

Предыдущие три программы рассмотрены совсем кратко. Дополнительную информацию об их установке и об имеющихся опциях вы сможете найти по ссылкам на карточки этих программ. 

Ещё парочка программ, которые работают с архивом интернета: 

Источник


Report Page