Что такое парсинг?

Что такое парсинг?

Влад Астахов

И так ребят, возможно вы слышали такое выражение как парсинг сайтов. Но не все знают что это, поэтому предлагаю в этом разобраться.
И да, в этой статье не будет ни строчки программного кода - только теория. А если вы хотите увидеть пример написанного парсера, то жду 10 лайков под постом!

И так определение парсинга гласит, что это автоматизированный сбор неструктурированной информации, ее преобразование и выдача в структурированном виде. Звучит как обычная обработка данных, например какой-нибудь бдшки. Но по факту это используется как воровство контента разного типа с сайтов.

Но вы наверняка думаете, что невероятно сложно. Ведь для этого нужно иметь доступ к базе данных и тд. НО ЭТО НИХУЯ НЕ ТАК достаточно просто посмотреть код элемента через браузер, найти нужный блок, узнать его класс и спиздить его содержание.

Кому это нужно?

Приведу банальный пример. Чтобы написать эту статью я изучал различные уроки и источники, а мог бы просто скопировать текст с какого-нибудь ноунейм сайта и не париться. Только в данном случае парсинг будет проблемно применить, а вот если бы я делал это на свой веб-сайт - было бы легко спиздить какую-нибудь статью.

Другой пример, все вы знаете что такое сайты с 18+ контентом. И неужели вы думаете, что все они заключают договора со студиями или сами все снимают. Нет, они просто парсят контент с сайта со схожим контентом.

Ну или ценовая "разведка". Такие сайты как “Wildberries” или “Lamoda“ свободно предоставляют доступ к ежедневным объемам продажи. И если мне нужно узнать какой сейчас ходовой товар, то я могу просто написать парсер на эти данные и все знать.


В целом это все, что я хотел сегодня рассказать. Напоминаю, хотите увидеть пример написания парсер - 10 лайков под постом.

Report Page