Интерактивная визуализация данных

Интерактивная визуализация данных

https://t.me/ai_machinelearning_big_data


Визуализация данных

Визуализация данных - это действительно важный шаг при анализе набора данных. Если выполнено точно, оно может:

  • Помогите нам получить глубокое понимание динамики, лежащей в основе нашего набора данных.
  • Ускорить машинное обучение стороне анализа.
  • Сделайте так, чтобы другим было проще понять наше исследование набора данных.

В этой статье я познакомлю вас с некоторыми из наиболее часто используемых библиотек визуализации Python, используя практические примеры и причудливые методы визуализации / виджеты. Весь код, который я использовал для этой статьи, доступен в этом GitHub репозиторий,

Matplotlib

Matplotlib, вероятно, самая известная библиотека визуализации данных Python. В этом примере я расскажу вам, как создать анимированный GIFPCA дисперсионный график,

Прежде всего, мы должны загрузить Iris Datasetс помощью Seaborn и выполнить PCA. Затем мы строим 20 графиков PCA дисперсионный график при этом изменяя угол наблюдения от оси. Чтобы создать график результатов 3D PCA, я следовал Python Graph Gallery в качестве ссылки.

Наконец, мы можем сгенерировать GIF из 20 графиков, которые мы создали, используя следующую функцию.

Полученный результат должен быть таким же, как на рисунке 1. Этот же механизм может быть применен во многих других приложениях, таких как: анимированные распределения, контуры и классификация моделей машинного обучения,

Рисунок 1: Диаграмма дисперсии PCA

Другим способом создания анимированных графиков в Matplotlib может быть использование API анимации Matplotlib. Этот API может позволить как сделать несколько простых анимаций так и живых графиков. Некоторые примеры можно найтиВот,

Целлулоид

Целлулоидная библиотека может быть использована для облегчения анимации в Matplotlib. Это делается путем создания камеры, предназначенной для создания снимков графика каждый раз, когда изменяется один из его параметров. Все эти картинки затем на мгновение сохраняются и объединяются для создания анимации.

В следующем примере снимок будет создан для каждой итерации цикла, а анимация будет создана с использованием одушевленные ()функция.

Затем также можно сохранить сгенерированную анимацию в формате GIF, используя ImageMagick, Полученная анимация показана на рисунке 2.

Рисунок 2: Пример целлулоида

Plotly

Plotly - это библиотека Python с открытым исходным кодом, построенная на plotly.js. Plotly доступен в двух разных режимах: онлайн и оффлайн. Используя эту библиотеку, мы можем создавать неограниченное количество графиков в автономном режиме и максимум 25 графиков в режиме онлайн. При установке Plotly необходимо зарегистрироваться на их веб-сайте и получить ключ API, чтобы начать работу (вместо того, чтобы просто использовать установка pip как и для любых других библиотек, рассмотренных в этой статье).

В этом посте я покажу вам пример использования автономного режима для построения графиков высоких и низких цен на фондовом рынке Тесла за широкий период времени. Данные, которые я использовал для этого примера, можно найти Вот,

Прежде всего нам нужно импортировать необходимые библиотеки Plotly.

Затем я импортировал набор данных и предварительно обработал его, чтобы затем реализовать окончательный график. В этом случае я убедился, что столбцы, которые я хотел использовать для графика, имели правильный тип данных, а даты были в формате (ГГГГ-ММ-ДД). Для этого я преобразовал столбцы Высокие и Низкие цены в двойные типы данных, а столбец Дата - в строковый формат. Последовательно я преобразовал столбец Дата из формата ДД / ММ / ГГГГ в ГГГГ / ММ / ДД и, наконец, в ГГГГ-ММ-ДД.

Рисунок 3: Набор данных Тесла

В конечном итоге я использовал библиотеку Plotly для составления графика временных рядов цен на фондовом рынке Теслы. Благодаря Plotly этот график будет интерактивным. Поместив курсор в любую точку временного ряда, мы можем получить цены High и Low и, используя кнопки или ползунок, мы можем решить, на каком таймфрейме мы хотим сосредоточиться.

На рисунке 4 показан окончательный результат. Подробная документация предлагает широкий спектр примеров того, как извлечь максимальную пользу из этой библиотеки, некоторые из них можно найтиВот,

Рисунок 4: Пример графика

Кроме того, также можно вставлять онлайн графики Plotly, используя Plotly Chart Studio, Ниже показан пример интерактивного встраивания Plotly (не стесняйтесь играть с этим графиком прямо сейчас на вашем устройстве!).


Bokeh

Библиотека Bokeh доступна для Python и JavaScript. Большинство его графиков, взаимодействий и виджетов могут быть реализованы только с использованием Python, но в некоторых случаях может быть необходимо использовать также Javascript.

При использовании Bokeh графики строятся путем наложения одного слоя поверх другого. Сначала мы создаем фигуру, а затем добавляем к ней элементы (глифы). В зависимости от сюжета, который мы пытаемся сделать, глифы могут быть любой формы и формы (например, линии, полосы, круги).

При создании графиков с помощью Boker некоторые инструменты автоматически генерируются вместе с графиком. Это ссылка на документацию Bokeh, панорамирование, масштабирование окна, масштабирование колес, опция сохранения и кнопка сброса графика (такая же, как у Plotly).

В качестве практического примера я сейчас расскажу, как создать интерактивный график временных рядов, используя тот же набор данных, который использовался в примере Plotly.

Для этой демонстрации будут построены четыре разных временных ряда (максимум / минимум / цена открытия и закрытия) и будут созданы четыре флажка. Таким образом, пользователь будет иметь возможность установить / снять флажки, чтобы любой из четырехкратных рядов исчез из графика.

В этом примере для реализации функциональных возможностей флажков вместо Python был использован Javascript.

Полученный график показан на рисунке 5.

Рисунок 5: Демонстрация Боке

Как показано в приведенном выше коде, график дополнительно был сохранен в виде файла HTML. Эта же опция может быть применена и к графам Plotly. Если вы заинтересованы в тестировании самих графиков, реализованных с помощью Plotly и Bokeh, они доступны Вот,

И Plotly, и Bokeh могут быть дополнительно использованы в качестве инструментальных панелей для Python, что дает довольно удивительные результаты [1, 2].

рожденное море

Seaborn - это библиотека Python, основанная на Matplotlib, используемая для создания статистических графиков. Согласно официальному сайту Seaborn:

Если Matplotlib «пытается сделать легкие вещи легкими, а тяжелые - возможными», Seaborn также пытается упростить четкий набор сложных вещей.

Сейчас я приведу простой пример с использованием Seaborn. Если вы хотите узнать больше об этой библиотеке, Seaborn пример галереи отличное место, с чего можно начать.

В следующем примере я сначала загрузил Iris Dataset используя Seaborn, а затем создал парный сюжет.

Парный график - это функция, которая может предоставить графическую сводку пар переменных в наборе данных. Это делается с помощью диаграмм рассеяния и одномерного представления распределения диагонали матрицы. На рисунке 6 показаны результаты этого анализа.

Рисунок 6: Морской парный сюжет

nbinteract

nbinteract позволяет нам создавать интерактивные виджеты в блокноте Юпитера. Эти виджеты также могут быть экспортированы в HTML, если требуется. Пример онлайн-реализации nbinteract можно найти Вот,

В качестве простой реализации здесь будет создано выпадающее меню. Изменяя выбор количества автомобилей или имени владельца, вы в реальном времени обновите строку (рисунок 7).

Рисунок 7: Пример NBInteract

Дополнительные библиотеки

В дополнение к уже упомянутым библиотекам, такжеPygalа такжеAltairдругие две широко используемые библиотеки Python. Они оба предоставляют графики, аналогичные показанным ранее, но могут дополнительно использоваться для создания других форм графиков, таких как: пирамиды, древовидные карты, карты и диаграммы Ганта.

https://t.me/sqlhub

источник

Report Page