Самое время! Визуализируем временные ряды правильно

Помню, как однажды мне позвонила PR-директор и заметила, что данные на свежем слайде не соответствуют аналитическим данным, предоставленным PR-отделу ранее.

Схематическое изображение слайда, чтобы было (не)понятно

Но данные были верными. Где действительно наблюдалось расхождение, так это между формой и содержанием – стороннему пользователю казалось, что такая фундаментальная категория, как производство напитков, должна воспроизводиться в виде столбиков. Только понял я это через несколько дней, когда сам попал на тот же крючок, с тем же самым графиком. В такие моменты понимаешь, что с визуализацией не всё так просто.

Проблема коротко: даже если на слайде нет фактологических ошибок, он всё равно может быть воспринят неверно.

Причина: на восприятие информации влияет наш предыдущий опыт. И если мы привыкли видеть одно и то же явление в неизменной форме, очень скоро в нашей голове возникает ассоциативная связь.

Решение: если есть чёткое понимание того, что идёшь верной дорогой, – ломай устоявшийся паттерн (и не ленись вдаваться в пояснения). Нет – получше изучи свою аудиторию и начни говорить на её языке.

В целом, временные ряды, о которых мы сегодня поговорим, можно поделить на дискретные и непрерывные. Такое деление позволяет применить к данным нужный тип визуализации. Посмотрим, для начала, на дискретные.

Дискретные ряды

В случае с дискретными данными значения относятся к конкретным моментам или периодам времени, и существует конечное число этих значений. Например, число людей на канале дискретно.

Как визуализировать дискретные ряды

Для того, чтобы визуально представить дискретные ряды мы с тобой можем прибегнуть к гистограммам (обычным столбикам или стакнутым), диаграммам рассеяния (точкам) или даже таким экзотическим штукам, как диаграмма Флоренс Найтингейл (сама она называла такой тип диграммы "петушиным гребнем" (coxcomb)). Азазазазаза, петушиный гребень))0)00 v_v

Диаграмма Флоренс Найтингейл. Красиво, но далеко не всегда оправданно

Гистограммы

Не имеет смысла представлять столбцы – ты их знаешь. Давай лучше посмотрим на структуру этого типа диаграммы.

Первый важный пункт – это ось времени. Кажется, что с осью времени всё просто – обозначаешь моменты времени, выстроенные в хронологическом порядке, и готово. Но Путин (или тот, кто ему презентацию пилил) показал, что даже это можно сделать хреново.

А хреново потому, что первые три столбца используют отрезки в 5 лет, затем у нас разница в 6 лет, в 1 год и, наконец, прогноз "ушёл" на 3 года. What the fuck?

Так делать плохо – в этом не чувствуется заботы по отношению к пользователю презентации. Он посмотрит на первые три подписи, подумает "ага, значит, интервал везде – 5 лет" и ошибётся. Нельзя этого допускать, особенно если принимать во внимание современный паттерн считывания информации.

Если твой временной ряд содержит подобные разрывы, используй между ними интервал в ~4 раза больше обычного. А обычный интервал я рекомендую устанавливать на отметке в ~50% от ширины столбца. Всё-таки на диаграмме более важную роль имеют столбцы, а не интервалы.

Далее, взаимосвязанные ось значений и высота столбца. Когда-то давно я любил манипулировать данными, начиная ось значений не от нуля, а от какого-нибудь более высокого значения. Но так делать тоже плохо, потому что это искажает пропорции между столбцами. В некоторых случаях столбцы просто "исчезают", как на примере снизу.

Отсчёт начинается с двойки. 2020F равен двум, поэтому его и не видно на графике

Всегда начинай ось значений гистограммы с нуля, иначе это вызовет затруднение в визуальном сравнении столбцов по высоте.

Точки

Число подписчиков на канале дискретно. Это мы уже выяснили. А графически представить это можно в виде точек. Давай взглянем на график ниже:

Что сразу бросается в глаза?

Нуу...ось значений ведёт отсчёт от 590. Верно. Вообще, точечные диаграммы часто используют для демонстрации зависимости между двумя переменными (кстати, разберём это в одном из будущих материалов). Это несложно благодаря тому, что в точечных диаграммах (или диаграммах рассеяния) значение имеет не высота столбика, а положение точки, задаваемое x- и y-координатами. Т.е. ось значений не обязательно должна начинаться от нуля.

Стоит заметить, что на графике точки соединены кривой. Вероятно, создатели бота хотели придать графику непрерывный характер, но такое движение мало похоже на правду.

Как помочь аудитории с мелкими деталями

Нередко случается так, что на графике появляется большое кол-во мелких деталей, которые тебе хотелось бы пояснить. Или ты знаешь, что бренд-директор об этом спросит. Что делать?

Скажем, у нас есть стакнутый график с небольшими сегментами.