Программа курса Python для анализа данных

Программа курса Python для анализа данных

БАШНЯ

Уже 4-ого марта стартует первое занятие нашего бесплатного курса по анализу данных на Python!
Предлагаем вам ознакомиться с программой курса подробнее 👀


Вводное занятие курса

Узнаем, где искать данные для проектов (платформа Kaggle), научимся загружать, читать и приводить их к нужному виду. Разберем, что такое нормализация и зачем она нужна, и на простых примерах отработаем базовые приёмы подготовки данных к анализу.

📌 Ключевые темы:

  • Установка и структура Pandas
  • Загрузка данных из различных источников
  • Первичный осмотр данных
  • Обработка пропусков и приведение типов
  • Нормализация числовых признаков

Дата: 4 марта

Время: 18:00-19:30


Решение аналитических задач

Повторим и закрепим приёмы нормализации и трансформации данных из первого занятия. В формате лайфкодинга вместе с преподавателем напишем код для обработки датафрейма и получим первые осмысленные результаты.

📌 Ключевые темы:

  • Фильтрация и выборка по условиям
  • Приведение данных к нужному виду
  • Решение аналитических задач
  • Совместный разбор кода (лайфкодинг)

Дата: 6 марта

Время: 18:00-19:30


Введение в рекомендательные системы

Узнаем, какие бывают рекомендательные системы и как готовить данные для их построения. Рассмотрим основные алгоритмы, метрики качества и поговорим о том, какие архитектуры реально работают на продакшене.

📌 Ключевые темы:

  • Подготовка данных для рекомендательных систем
  • Виды рекомендательных систем и их особенности
  • Метрики качества рекомендаций
  • Обзор современных архитектур на проде

Дата: 11 марта

Время: 19:00-20:30


Изучение алгоритмов Жаккарда и Евклида

Разберём математические метрики, которые лежат в основе поиска похожих объектов, а также применим их на своём датафрейме, чтобы понять, как работают рекомендации.

📌 Ключевые темы:

  • Метрики сходства для категориальных и количественных признаков
  • Алгоритмы Жаккарда и Евклида: когда и как применять
  • Манхэттенское расстояния
  • Сравнение метрик и выбор подходящей под задачу
  • Расчёт метрик на реальных данных

Дата: 18 марта

Время: 18:00-19:30


Применение Pandas и Seaborn

На основе изученных метрик построим матрицу схожести – таблицу, показывающую, насколько каждый объект похож на другой. Затем визуализируем её с помощью библиотеки Seaborn и научимся интерпретировать полученные карты. Это ключевой шаг для создания рекомендательных систем и кластеризации.

📌 Ключевые темы:

  • Построение матриц расстояний и сходства
  • Использование Pandas для расчёта попарных метрик
  • Визуализация матрицы с помощью Seaborn
  • Интерпретация результатов

Дата: 20 марта

Время: 18:00-19:30


Система лайков и дизлайков в рекомендательных системах

Изучим использование использование обратной связи пользователей в рекомендательных системах. Разберем, как учитывать явные и неявные сигналы, обновлять модели в реальном времени и избегать типичных проблем.

📌 Ключевые темы:

  • Способы интеграции лайков/дизлайков в рекомендательные алгоритмы
  • Обновление рекомендаций с учётом новых предпочтений
  • Примеры из реальных сервисов

Дата: 25 марта

Время: 18:00-19:30


📍 Адрес занятий: Бригадирский переулок, 13с1

На курсе вы не только научитесь анализировать данные с помощью Pandas, но и создадите свой пет-проект!

✔️ Регистрируйтесь на курс в нашем Mini App


Report Page