Визуализация данных

Визуализация данных


"Трамп уничтожил Байдена в Джорджии!" - пример небольшой манипуляции с графиками для убедительности. Разберем его в статье


Редко писал статьи о конкретных навыках аналитика. Сегодня разберем один из самых важных - визуализация даннызх.

После того как вы получили результаты исследований, часто нужно презентовать их другим людям, создать для них график, на который они смогут смотреть. Для этого нужно уметь правильно изобразить данные визуально.

Пример хорошего графика

На графике выше, например, отображена конверсия в заказ по 2 вариантам сайта. На каждый день разные значения, каждый день на график можно заходить, следить за изменениями, оперативно на них реагировать.


Типы графиков

Есть несколько основных видов графика, используемых для разных задач

  • Линейный график (Line Chart)
линейный график

Линейный график отображает данные в виде точек, соединенных линиями. Эти точки обычно представляют значения в определенные моменты времени.

  • Столбчатый график (Bar Chart)
  • Диаграмма с областями (Area Chart)

Диаграмма с областями похожа на линейный график, но пространство под линиями заполнено цветом. Подходит для сравнения разбиения общего показателя по нескольким группам.

Некоторые графики подходят для одних задач лучше чем другие. Например, конверсию обычно отображают с помощью линейного графика. И многие другие показатели, которые изменяются со временем. Если нужно сравнить несколько значений и визуально видеть разницу между столбиками, лучше использовать bar chart. Возможно даже без оси времени:

Это основные графики, которые вам будут нужны.

Основные принципы построения графиков

Корректность отображения

Разные форматы графиков могут по-разному влиять на восприятие. Допустим, конверсия в заказ у онлайн магазина около 17%. Мы можем построить график, отображая на оси значения от 16 до 18:

В таком случае будет казаться, что конверсия сильно выросла - почти в 2 раза за неделю.

Или можно отобразить ось y, начиная с 0:

Тогда изменения кажутся не такими большими. Какой вариант лучше - зависит от задачи. Если мы хотим видеть небольшие изменения, но наверное первый. Но в таком случае стоит добавить подписи на оси, чтобы люди не подумали, что конверсия резко выросла или упала в 2 раза.


Недавно наткнулся в твиттере на веселую картинку выше. Ее правда использовал в агитации Трамп, т.е. это не фейк.
На ней изображен "разгром" Байдена Трампом, хотя если обратить значения на цифры, перевес составил всего 2% голосов (49 против 51). Возможно это вообще стат погрешность.
Но обрезав нижнюю часть столбиков, Трамп создает впечатление, будто одержал решительную победу. Красный столбик нарисован в 2 раза выше.


Легкость восприятия

Каждый график должен понятно и просто выглядеть, чтобы его легко было читать.

Со слов моего первого ученика, когда он рассказывал про первую работу:

Первый чарт, который я сделал, был полной хуйнёй. О чём мне сразу и сказали. Мне тогда казалось, что нужно нагромоздить как можно больше информации, сделать несколько разных цветов и т.п. Потом понял, что желательно делать как можно более простые чарты, желательно монохромные. Один чарт - один показатель и один цвет. А усложнения - если этого прям требует задача.


Пример плохого графика:

Куча разных цветов, разные форматы графика (столбики, линии, пунктирные линии). Что происходит разобраться очень сложно. Такие графики лучше не создавать.


Информативность

Каждый график занимает место на дешборде и должен содержать максимум информации на единицу площади (оставаясь при этом понятным и читаемым). Допустим, мы хотим смотреть разбиение по числу пользователей сервиса по платформам - сайт, андроид, ios. Когда у меня была похожая задача во время работы джуном в Авито, я создал график вроде такого:

Тип этого графика - Круговая диаграмма. Pie chart

Он занимает много место и показывает только общую картину. Но при этом нет понимания - это распределение всегда такое или меняется? Насколько оно стабильное? Лучше было бы создать следующий график ниже. Он занимает столько же места, но несет больше информации. В случае если что-то сломается - например, завтра доля сайта резко упадет - мы сможем быстро заметить это и починить.

Эту обратку дал мне на испытательном сроке тимлид в Авито.



Это основные идеи про графики, которые я понял, дойдя примерно до миддла.

Подписывайтесь на блог в телеграм - Аналитика от Тимура

Report Page