Что такое парсинг?
Влад АстаховИ так ребят, возможно вы слышали такое выражение как парсинг сайтов. Но не все знают что это, поэтому предлагаю в этом разобраться.
И да, в этой статье не будет ни строчки программного кода - только теория. А если вы хотите увидеть пример написанного парсера, то жду 10 лайков под постом!
![](/file/ba62496815e8862c42706.jpg)
И так определение парсинга гласит, что это автоматизированный сбор неструктурированной информации, ее преобразование и выдача в структурированном виде. Звучит как обычная обработка данных, например какой-нибудь бдшки. Но по факту это используется как воровство контента разного типа с сайтов.
Но вы наверняка думаете, что невероятно сложно. Ведь для этого нужно иметь доступ к базе данных и тд. НО ЭТО НИХУЯ НЕ ТАК достаточно просто посмотреть код элемента через браузер, найти нужный блок, узнать его класс и спиздить его содержание.
Кому это нужно?
Приведу банальный пример. Чтобы написать эту статью я изучал различные уроки и источники, а мог бы просто скопировать текст с какого-нибудь ноунейм сайта и не париться. Только в данном случае парсинг будет проблемно применить, а вот если бы я делал это на свой веб-сайт - было бы легко спиздить какую-нибудь статью.
Другой пример, все вы знаете что такое сайты с 18+ контентом. И неужели вы думаете, что все они заключают договора со студиями или сами все снимают. Нет, они просто парсят контент с сайта со схожим контентом.
Ну или ценовая "разведка". Такие сайты как “Wildberries” или “Lamoda“ свободно предоставляют доступ к ежедневным объемам продажи. И если мне нужно узнать какой сейчас ходовой товар, то я могу просто написать парсер на эти данные и все знать.
В целом это все, что я хотел сегодня рассказать. Напоминаю, хотите увидеть пример написания парсер - 10 лайков под постом.