Answer
t.me/python_tesstОтвет:
Исследователи связали разработчиков TrickBot с вымогателем Diavol
Из-за взлома в Apex Legends оказался заблокирован поиск матчей
Для уязвимости PrintNightmare появился неофициальный патч
Шифровальщик REvil атаковал поставщика MSP-решений Kaseya. Хакеры потребовали 70 млн долларов
.....................
Лайфхаки для DevOps. Маленькие хитрости и большие инструменты на каждый день
Магия консоли. Подбираем полезные утилиты для работы в терминале
Не App Store единым. Устанавливаем сторонние приложения в iOS без джейла
Разгребаем руины. Как восстановить удаленные файлы на разделах NTFS
Объяснение:
Разбор веб-страниц (scraping) нужен для многих целей: от борьбы с сервисами, которые не предоставляют API, до создания поисковых систем.
Для демонстрации мы извлечем заголовки новостей с главной страницы журнала. C помощью библиотеки requests и парсера HTML BeautifulSoup мы можем сделать это всего в несколько строк.
Установим библиотеки: pip3 install requests beautifulsoup4. Теперь откроем xakep.ru в отладчике браузера и увидим, что заголовки новостей находятся в тэгах <h3 class="entry-title">, но не напрямую, а во вложенных <a> и <span>. К счастью для нас, BeautifulSoup поддерживает селекторы CSS3, а в ее стандарте tag1 tag2 как раз означает «<tag2> вложенный в <tag1>. То есть, наш селектор для заголовков новостей будет h3.entry-title a span. В ответах мы показали только верхнюю и нижнюю части, в Вашем случае уже новостная лента будет несколько иной.
Код:
import requests
from bs4 import BeautifulSoup
response = requests.get("https://xakep.ru")
page = response.text
soup = BeautifulSoup(page, 'html.parser')
headings = map(lambda e: e.text, soup.select("h3.entry-title a span"))
for h in headings:
print(h)