Аналитик Данных

Аналитик Данных


Яндекс Диск

Стартовая страница когорты в Notion 

Конспекты и дополнительные материалы

Изменения в «Юпитере» и оформлении проектов

Как называть учебные (и не только) файлы

Как оформлять проект

Отправить проект на повторную проверку

Как встроить сторонний файл с данными в проект

Jupyter Hub

https://jupyterhub.praktikum-services.ru/user/user-0-198652462/notebooks/5d78e836-ea57-4fba-a0cb-5591f82a1db0.ipynb

https://jupyterhub.praktikum-services.ru/user/user-0-198652462/notebooks/a7b2c524-eef0-46af-b065-044492a4f4c0.ipynb

https://jupyterhub.praktikum-services.ru/user/user-0-198652462/notebooks/morozov_project_5_v_0.ipynb


1 — Базовый Python

2021-11-07 Будни аналитика и работа со списками - Константин Башевой 0.25

2021-11-13 Функции, классы + читаем ошибки - Леонид Медников

https://python-scripts.com/f-strings


2 — Предобработка данных

https://code.s3.yandex.net/data-analyst/conspects/description_project_course1.pdf

https://loginom.ru/blog/missing

https://habr.com/ru/company/ruvds/blog/442516/

https://habr.com/ru/post/275937/

https://proglib.io/p/pandas-tricks

см. книгу Джозефа О'Коннора «Искусство системного мышления»

ознакомьтесь с теорией Нассима Талеба о «чёрных лебедях». А ещё лучше, прочитайте его книгу, которая так и называется

2021-11-21 - Фильтры и как чинить ошибки - Константин Башевой

2021-11-27 Базовый обзор данных и groupby - Леонид Медников


3 — Исследовательский анализ данных

2021-12-05 - Группировки и объединения - Константин Башевой

2021-12-11 Гистограммы - Леонид Медников


Гистограммы

Описательные статистики: среднее, медиана, стандартное отклонение, перцентили

Сводные таблицы

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.hist.html


Индексация и селекция

Индексы и срезы по индексам

Индексация с использованием логических выражений


Объединение датафреймов


Диаграммы рассеяния (и другие графики)

Визуализация данных

Построение графиков в Python при помощи Matplotlib

Иллюстрации про корреляцию


Группировка с groupby, раздел «Группировка данных»

Примеры groupby


4 — Статистический анализ данных

2021-12-19 - Задачки на статистику и list comprehension - Константин Башевой

Математическое ожидание и дисперсия случайной величины

Как вычислить математическое ожидание?

Электронный учебник по статистике


Основные понятия теории вероятностей.


Статистические гипотезы

Проверка статистических гипотез



5 — Сборный проект №1


Бесплатный тренажёр «Основы математики для цифровых профессий»


Проект глазами ревьюера

https://disk.yandex.ru/d/VP9C9oU1pTcvlQ/0%20%E2%80%94%20%D0%94%D0%BE%D0%BF%D0%BE%D0%BB%D0%BD%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%B5%20%D0%B2%D0%B5%D0%B1%D0%B8%D0%BD%D0%B0%D1%80%D1%8B/%D0%93%D0%BE%D1%80%D0%BB%D0%B5%D0%BD%D0%BA%D0%BE%20-%20%D0%9F%D1%80%D0%BE%D0%B5%D0%BA%D1%82%20%D0%B3%D0%BB%D0%B0%D0%B7%D0%B0%D0%BC%D0%B8%20%D1%80%D0%B5%D0%B2%D1%8C%D1%8E%D0%B5%D1%80%D0%B0


6 — Базовый SQL

7 — Анализ бизнес-показателей

Когортный анализ

Немного про суть изучаемых нами графиков. Основа это когортный анализ: Каждый конкретный день пользователи нашего приложения состоят из тех, кто только начал его использовать и тех кто уже использовал его ранее - вчера, неделю назад, месяц назад и т.д. Выводы по всей этой куче пользователей сделать нереально! Идея когортного анализа состоит в том, чтобы разделить пользователей на группы по определенным признакам, и отслеживать поведение этих групп во времени. Обычно группы пользователей (когорты) выделяют на основе недели, двух недель, месяца - когда пользователи зарегистрировались в приложении. Выделив такие группы пользователей (когорты) можно следить за ними в течение времени и измерять ключевые метрики для каждой отдельной когорты. Таким образом, сравнивая показатели разных когорт пользователей можно наглядно сравнивать соответствующие этим периодам времени метрики.

Вот тут можно почитать подробней:

https://blog.ohmystats.com/cohort-analysis/

https://gopractice.ru/cohort_analysis/

https://smysl.io/blog/pandas-cohorts/

Юнит-экономика

  1. Цикл статей на Medium о комплексной оценке компаний от фонда Social Capital:
  2. Diligence at Social Capital Part 1: Accounting for User Growth,
  3. Diligence at Social Capital Part 2: Accounting for Revenue Growth,
  4. Diligence at Social Capital Part 3: Cohorts and (revenue) LTV,
  5. Diligence at Social Capital Part 4: Cohorts and (engagement) LTV.
  6. Статья «Гайд: разобраться в юнит-экономике за один день» на VC.ru.
  7. Статья «Юнит-экономика за 30 слов. Расчёт юнит-экономики без калькулятора» на GoPractice.

Пользовательские метрики

8 — Принятие решений в бизнесе

Основы проверки гипотез в бизнесе

Что почитать:

Олег Якубенков, статья «Когортный анализ: Метрики роста против метрик продукта»: https://vc.ru/flood/4242-cohort-analysis

Видео с ProductCampNsk Наталья Кунгурова, «Декомпозиция годовых целей, формирование метрик для продукта» https://www.youtube.com/watch?v=weU2tzDE6Ko

Мозговой штурм

https://4brain.ru/blog/мозговой-штурм/

ТРИЗ

https://4brain.ru/triz/

https://www.altshuller.ru/triz/

User Journey

https://medium.com/начинающему-ux-дизайнеру/что-строить-в-первую-очередь-user-journey-map-или-user-flow-4ece3ed60fb5

UX-исследование

https://medium.com/@grifer163/полное-руководство-новичка-по-ux-исследованию-319d69c928cb

https://habr.com/ru/post/347994/

https://askusers.ru/blog/pravila/testirovanie-saytov/

Customer Development

https://vc.ru/marketing/53090-vvedenie-v-customer-development

https://vc.ru/flood/42281-gid-po-customer-development-dlya-produktovyh-menedzherov

Выбор метода проведения эксперимента

https://vc.ru/design/39449-problemnoe-intervyu-ili-kak-proverit-svoyu-ideyu-na-polzovatelyah

https://vc.ru/marketing/33082-customer-development-50-voprosov-dlya-intervyu

Приоритизация гипотез

Матрица Эйзенхауэра

https://4brain.ru/blog/матрица-эйзенхауэра/

WSJF

https://medium.com/agiletransformation/wsjf-или-приоритезация-когда-все-вокруг-сложно-9ed97ff479be

ICE/RICE

https://habr.com/ru/company/hygger/blog/422131/

https://habr.com/ru/company/hygger/blog/424323/

Подготовка к проведению A/B-теста

https://gopractice.ru/how-not-to-analyze-abtests/

Анализ результатов A/B-теста

https://indicator.ru/mathematics/udovolstvie-ot-x-stiven-strogac.htm


9 — Как рассказать историю с помощью данных

Сезонность и внешние факторы

Познакомьтесь с исследованием Яндекса «Как меняется спрос на товары и услуги в течение года»

Есть и другие известные парадоксы. Их часто спрашивают на собеседованиях. Например,

Где ещё почитать про презентацию результатов исследования:

Школа менеджеров Яндекса — про презентации

Как понять когда слайд нужен

Библиотека seaborn

Самостоятельно изучите применение встроенных стилей в matplotlib в документации: https://matplotlib.org/tutorials/introductory/customizing.html

Библиотека seaborn

Странные корреляции в данных

Как работать со странными корреляциями в данных

Подборка цветовых палитр для визуализации данных

Библиотека plotly

Немного про кино или как делать интерактивные визуализации в python

Качественно новый уровень визуализации данных в Python

Событийная аналитика

Как настроить систему аналитики для мобильного приложения

Как создать трекинг план

Data Taxonomy Playbook

10 — Автоматизация

Что такое дата-пайплайны и зачем они нужны

Дата пайплайн на python

Про ETL системы


Проектирование и разработка дашбордов в dash

Прочитайте про SQLite подробнее здесь: https://habr.com/en/post/149356/.


Проектирование и разработка дашбордов в dash

Краткое руководство по dash

Как построить дашборд в dash

11 — Основы машинного обучения

Вот ссылки на материалы, которые помогут вам закрепить полученные знания, узнать про ML-сообщество или просто разнообразить досуг занимательным чтением:

  • «Стартовая» страница профессионального ресурса про машинное обучение (на русском языке) — определения и формулы:

http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение

  • Курс в формате статей на Хабр от OpenDataScience-сообщества и ссылка на их страницу:

https://habr.com/ru/company/ods/blog/322626/

https://ods.ai/

  • Конспект на русском языке книги Machine Learning Yearning, Andrew Ng)

https://habr.com/ru/post/321368/

  • Блог Дьяконова:

https://dyakonov.org/map/

https://alexanderdyakonov.files.wordpress.com/2018/12/intro2datamining.pdf

  • Вместо библии для начинающих строителей моделей:

https://scikit-learn.org/stable/



Материалы, которые помогут вам закрепить и детализировать полученные знания:


Однако мы приводим источники, которые, при необходимости, помогут вам разобраться с ними:



“Y,M,R” Шорткаты для конвертации типов ячеек

  • Y — code
  • M — markdown
  • R — raw


https://github.com/konicaRu/i_am_data_analyst

https://github.com/Higem11/Yandex-Data-Analysis

https://github.com/alexeiveselov92/Yandex-Data-Analysis

https://github.com/KuzmichVK/Yandex.Practicum_projects

https://github.com/Drewleks/yandex_praktikum


https://re-thought.com/how-to-suppress-scientific-notation-in-pandas/


https://github.com/konicaRu/i_am_data_analyst/blob/master/2_project_research_data_analysis/2_project_flat_for_sale.ipynb



Чтобы пройти программу необходимо заполнить  форму

 Несколько важных моментов:

  • при заполнении формы, мы просим указать 2 ваши почты: 1 почта, которая закреплена за вами в тренажере Яндекс.Практикума; 2 почта, которую используете для входа в Slack. Если указанные почты будут некорректными, то добавление не произойдет.
  • в день запуска вам придет приглашение в Slack-канал da_ds_employment_28_n (где n – номер группы) в этом канале появится ссылка, при переходе вам будет открыт доступ карьерному треку в тренажере
  • в начале каждого месяца открывается регистрация на новые потоки трудоустройства, поэтому если не удаётся пройти в феврале, то можно будет пройти в любой другой месяц.
  • в программе трудоустройства можно будет участвовать и после окончания курса, 
  • но только в течении первых 6 месяцев
Программа полностью бесплатная. Мы поможем подготовить резюме, собрать портфолио, написать сопроводительное письмо, пройти видео-интервью и составить небольшой карьерный план.
Карьерный трек проходит в тренажере, в Slack-канале же можно задавать вопросы и просить помощь в случае проблем или сложностей.
В улучшении карьерных артефактов вам будет помогать обратная связь от команды HR-экспертов, с реальным рекрутёрским опытом в Яндексе, ManyChat, EPAM и других IT-компаниях
Успешное прохождение программы обеспечит вас артефактами, пригодными для реальной рассылки работодателям.


Программа трудоустройства состоит из 4 спринтов:

 Резюме (2 недели) Упаковка опыта работы и правильно представляем обучение в Яндекс.Практикуме, для прохождения скрининга рекрутером.

 Портфолио (2 недели) Собираем проекты выполненные за обучение и упаковываем в портфолио на Github, для прохождения скрининга техническим экспертом. 

Сопроводительное письмо (2 недели) Правильно формулируем сопроводительное письмо, чтобы отклик был замечен рекрутером или представителем компании.

Публичное собеседование (2 недели) 2 раза в месяц мы будем проводить публичные собеседования в которых можно принять участие как Зритель (посмотреть и послушать со стороны, сделать пометки, задать вопросы) или Участник (лично пройти собеседование у рекрутера, получить обратную связь по ответам на вопросы рекрутера и предоставленном резюме, задать вопросы).

Публичные собеседования будут доступны как в Программе Трудоустройства, так и в Акселерации.После выполнения 4 спринта в в Slack-канале потока появится форма для регистрации в программу Акселерации.Акселерация - это практика поиска работы под нашим наставничеством. Мы поддержим вас на протяжении всего процесса поиска работы, проконсультируем по сложным вопросам. Но результат полностью зависит от ваших усилий и мотивации.Акселерация проходит в отдельном слак-пространстве и телеграм-канале.

  • Вы делаете регулярные отклики на вакансии, решаете тестовые задания, проходите собеседования.
  • Мы делимся вакансиями партнеров, а также помогаем находить инсайты в формате сессий Q&A и вебинаров с HR тематикой и приглашенными гостями в числе которых лиды аналитики и рекрутеры.

По любым вопросам, касающимся программы трудоустройства и любым техническим вопросам — @Ekaterina Efremova


Report Page