Answer

Answer

t.me/python_tesst

Ответ:

Исследователи связали разработчиков TrickBot с вымогателем Diavol

Из-за взлома в Apex Legends оказался заблокирован поиск матчей

Для уязвимости PrintNightmare появился неофициальный патч

Шифровальщик REvil атаковал поставщика MSP-решений Kaseya. Хакеры потребовали 70 млн долларов

.....................

Лайфхаки для DevOps. Маленькие хитрости и большие инструменты на каждый день

Магия консоли. Подбираем полезные утилиты для работы в терминале

Не App Store единым. Устанавливаем сторонние приложения в iOS без джейла

Разгребаем руины. Как восстановить удаленные файлы на разделах NTFS

Объяснение:

Разбор веб-страниц (scraping) нужен для многих целей: от борьбы с сервисами, которые не предоставляют API, до создания поисковых систем.

Для демонстрации мы извлечем заголовки новостей с главной страницы журнала. C помощью библиотеки requests и парсера HTML BeautifulSoup мы можем сделать это всего в несколько строк.

Установим библиотеки: pip3 install requests beautifulsoup4. Теперь откроем xakep.ru в отладчике браузера и увидим, что заголовки новостей находятся в тэгах <h3 class="entry-title">, но не напрямую, а во вложенных <a> и <span>. К счастью для нас, BeautifulSoup поддерживает селекторы CSS3, а в ее стандарте tag1 tag2 как раз означает «<tag2> вложенный в <tag1>. То есть, наш селектор для заголовков новостей будет h3.entry-title a span. В ответах мы показали только верхнюю и нижнюю части, в Вашем случае уже новостная лента будет несколько иной.

Код:

import requests
from bs4 import BeautifulSoup

response = requests.get("https://xakep.ru")
page = response.text

soup = BeautifulSoup(page, 'html.parser')

headings = map(lambda e: e.text, soup.select("h3.entry-title a span"))
for h in headings:
  print(h)



Report Page