Практический курс парсинга сайтов на Python

Практический курс парсинга сайтов на Python

P-Notes



Описание:

Максимальное приближение к задачам реального парсинга

Отработка на 13 парсерах разной сложности

14 Видео:

Как анализировать верстку и запросы к сайтам разной сложности. Как писать парсеры

13 Парсеров:

Для сайтов разной сложности, которые вы напишете по мере прохождения курса

Программа курса

То, что нужно начинающему питонисту для начала профессиональной деятельности

  • Основы BeautifulSoup
  • Парсинг табличных данных
  • Работа с пагинацией (2 вида)
  • Чтение и запись данных в CSV
  • Запись данных в PostgreSQL
  • Продвинутые методы работы с BeautifulSoup
  • Парсинг данных, подгружаемых при помощи AJAX (2 видео)
  • Парсинг в несколько процессов
  • Использование прокси
  • Парсинг данных, подгружаемых JQuery
  • Смена User-Agent


Все делается при помощи библиотек Requests и Beautiful Soup 4, Lxml. Даже парсинг данных, подгружаемых AJAX и JQuery.

Здесь НЕ используются Selenium, Grab, Scrapy и другие средства.

Report Page