Программа курса Python для анализа данных
БАШНЯУже 4-ого марта стартует первое занятие нашего бесплатного курса по анализу данных на Python!
Предлагаем вам ознакомиться с программой курса подробнее 👀
Вводное занятие курса
Узнаем, где искать данные для проектов (платформа Kaggle), научимся загружать, читать и приводить их к нужному виду. Разберем, что такое нормализация и зачем она нужна, и на простых примерах отработаем базовые приёмы подготовки данных к анализу.
📌 Ключевые темы:
- Установка и структура Pandas
- Загрузка данных из различных источников
- Первичный осмотр данных
- Обработка пропусков и приведение типов
- Нормализация числовых признаков
Дата: 4 марта
Время: 18:00-19:30
Решение аналитических задач
Повторим и закрепим приёмы нормализации и трансформации данных из первого занятия. В формате лайфкодинга вместе с преподавателем напишем код для обработки датафрейма и получим первые осмысленные результаты.
📌 Ключевые темы:
- Фильтрация и выборка по условиям
- Приведение данных к нужному виду
- Решение аналитических задач
- Совместный разбор кода (лайфкодинг)
Дата: 6 марта
Время: 18:00-19:30
Введение в рекомендательные системы
Узнаем, какие бывают рекомендательные системы и как готовить данные для их построения. Рассмотрим основные алгоритмы, метрики качества и поговорим о том, какие архитектуры реально работают на продакшене.
📌 Ключевые темы:
- Подготовка данных для рекомендательных систем
- Виды рекомендательных систем и их особенности
- Метрики качества рекомендаций
- Обзор современных архитектур на проде
Дата: 11 марта
Время: 19:00-20:30
Изучение алгоритмов Жаккарда и Евклида
Разберём математические метрики, которые лежат в основе поиска похожих объектов, а также применим их на своём датафрейме, чтобы понять, как работают рекомендации.
📌 Ключевые темы:
- Метрики сходства для категориальных и количественных признаков
- Алгоритмы Жаккарда и Евклида: когда и как применять
- Манхэттенское расстояния
- Сравнение метрик и выбор подходящей под задачу
- Расчёт метрик на реальных данных
Дата: 18 марта
Время: 18:00-19:30
Применение Pandas и Seaborn
На основе изученных метрик построим матрицу схожести – таблицу, показывающую, насколько каждый объект похож на другой. Затем визуализируем её с помощью библиотеки Seaborn и научимся интерпретировать полученные карты. Это ключевой шаг для создания рекомендательных систем и кластеризации.
📌 Ключевые темы:
- Построение матриц расстояний и сходства
- Использование Pandas для расчёта попарных метрик
- Визуализация матрицы с помощью Seaborn
- Интерпретация результатов
Дата: 20 марта
Время: 18:00-19:30
Система лайков и дизлайков в рекомендательных системах
Изучим использование использование обратной связи пользователей в рекомендательных системах. Разберем, как учитывать явные и неявные сигналы, обновлять модели в реальном времени и избегать типичных проблем.
📌 Ключевые темы:
- Способы интеграции лайков/дизлайков в рекомендательные алгоритмы
- Обновление рекомендаций с учётом новых предпочтений
- Примеры из реальных сервисов
Дата: 25 марта
Время: 18:00-19:30
📍 Адрес занятий: Бригадирский переулок, 13с1
На курсе вы не только научитесь анализировать данные с помощью Pandas, но и создадите свой пет-проект!
✔️ Регистрируйтесь на курс в нашем Mini App