Дорки для нетсталкинга

Дорки для нетсталкинга

wegwarte & CapyB & MeowMoose

Что это?

Из некоторых книг и материалов вы уже можете знать, что у поисковиков есть множество специальных команд для уточнения запросов. Искать можно не только по ключевым словам, но и по фрагментам адресов сайтов, расширениям файлов и т.п. Кроме того, с помощью спецсимволов можно исключать или наоборот обязательно включать какие-то слова или целые фразы.

Дорк - это именно такой запрос: заточенный под конкретную тему, прицельный. 

Обычно дорки ассоциируются с "легальным взломом": позволяют с помощью поисковика обратиться к скрытым разделам сайта, по какой-то причине "торчащим наружу" без специальной защиты. Да, если у вас когда-либо будет свой веб-ресурс - прикрывайте его от таких инцидентов. Обычно статьи по доркам посвящены именно этому - иначе данный пост не было бы смысла писать, но я хочу осветить дорки именно в нетсталкерском контексте. Домашние хакеры сливают себе клиентские базы и рады. Для нас же составление дорка определяется целесообразностью.

Приватных дорок/дорков не существует. Существуют люди, прохававшие их составление лучше вас. Подтягиваетесь до их уровня = получаете "приватную" дорку бесплатно.


Как это выглядит в нетсталкинге?

Можно делать дорки как для делисёрча, так и для нетрандома. Т.е.: как для поиска конкретного объекта, так и для получения доступа к широкому классу объектов, от которого вы пока не знаете, чего конкретно ждать. Пример первого: поиск книги или конкретного документа (какое-нибудь разрешение на строительство, скажем). Пример второго: все Exсel-таблицы с сайтов на домене .gov; все пользователи всех русских форумов на выбранном движке с конкретными интересами в профиле. 

Парочка тематических примеров.

  1. (от hex break) Нетсталкерим в гуглдрайвах: inurl:"/drive/folders/" site:drive.google.com
  2. (От CapyB) По tor есть прикольный дорк "(site:onion.link | site:onion.cab | site:tor2web.ch | site:tor2web.org | site:onion.sh | site:tor2web.fi | site:onion.direct | site:onion.gq | site:onion.top | site:onion.rip | site:onion.guide | site:onion.to | site:onion.gold) тут запрос" позволяющий найти существенную часть onion ресурсов, но не блокируемый tor project, как другие crawler-ы

Также дорки - основной способ поиска по интернету вещей (те же камеры) через предназначенные для этого поисковики типа shodan.io, censys.io.


Как с этим работать?

Где брать дорки? Вопрос вредный, правильный звучит так: Как мне научиться составлять себе дорки?

1. Взять список поисковых команд нескольких основных поисковиков (сами поисковики предоставляют эту инфу). Вспомнить парочку своих последних сложных запросов. Попробовать заформулировать их через эти команды.

2. Порассматривать готовые дорки. Ряд разобранных примеров - прямо в этой статье.

3. Для составления дорка под сайт или движок - посмотреть, из чего состоят адреса страниц/файловых ресурсов на этом сайте/движке. см. инцидент с Trello. Этот пункт тесно связан с парсингом страниц. Т.е. то же самое вам надо уметь для получения и выкачивания/автоматического анализа всех страниц через скрипт на каком-нибуть Python.

4. Идите от большого к малому. Возьмите искомое и определяйте его всё более детально.


Например. Надо вам найти какое-то мороженое из детства, о котором в памяти остался только красный цвет этикетки на английском и то, что оно было красное.

"красное мороженное" - не сработало, много вариантов
"красное мороженное -бабаевское " - снова много вариантов
"красное мороженное -бабаевское -"красный октябрь"" - снова много вариантов
""мороженное красного цвета" 1997 год -бабаевское -"красный октябрь""

...и так далее. (Знак "-" - это исключение, один из спецсимволов, упомянутых в начале)


Или же на примере с более рандомным поиском по адресу сайта:

Меня интересует сайт ааа.com . Нужно пробежаться по его php файлам, но не тем, где лежит основной контент сайта. Php-файлы ищем так: 

site:aaa.com filetype:php

Если много результатов, то отрубаем те страницы, которых больше всего, например:

site:aaa.com filetype:php -index -news -search

Это отсеивает всё, что генерируется на основе страниц index.php, news.php, search.php. В итоге в выдаче остаются более потайные/малопросматриваемые экземпляры.


Такова база для составления дорков. Сложные случаи - это уже вариации на её основе. Внимательно рассматривайте url-ы своего целевого сайта или сайтов, пробуйте разные команды, изощряйтесь при выделении признаков вашего искомого объекта. Постепенно навык составления эффективных поисковых запросов ляжет в руку так же удобно, как корпус мышки.