Подборка пакетов R, которые сделают Вашу жизнь лучше

Подборка пакетов R, которые сделают Вашу жизнь лучше

IT Resume


Фото Сафара Сафарова на Unsplash

Как пользователь R, я встречал множество разных рекомендованных пакетов и тщательно отобранных списков. Некоторые из них есть в моих закладках, например, большой список awesome-R или в ежемесячном списке «best of», созданным R studio.

В этой статье я хотел бы показать Вам кое-что еще. Некоторые из перечисленных ниже пакетов действительно уникальны, а некоторые просто забавны в использовании.

Давайте начнем!

💥Полезные и странные 💥

  • BRRR и beepr: Вы когда-нибудь хотели, чтобы R выдавал Вам радостную новость о том, что Ваш код отработал? Да чтобы не просто писал, а чтобы Flavor Flav (американский репер) кричал "дааааа, бой!!", как только он успешно завершится? Или Вы когда-нибудь хотели получать сообщение об ошибке от DJ Khaled, который кричит: "Они не хотят видеть, как мы побеждаем!" Думаем, что нет. Но с BRRR это возможно!
  • calendR: помогает подготовить к печати ежемесячные и годовые календари, созданные с помощью ggplot2. Выглядит довольно симпатично!
  • checkpoint: позволяет устанавливать предыдущие версии пакетов, как если бы у вас была машина времени CRAN.
  • DataEditR: легкий пакет для интерактивного просмотра, ввода или редактирования данных в R.
  • Drake: если Ваш код очень сложный или просто долго выполняется, то Вам нет необходимости запускать его каждый раз, когда Вы вносите какие-то изменения. Drake анализирует последовательность действий в Вашем коде, оставляет актуальные куски нетронутыми и вносит коррективы только в нужные места.
  • flow: визуализирует в виде блок-схем функции, выражения или скрипты и, тем самым, упрощает отладку.
  • here: Цель пакета - обеспечить простую ссылку на файлы. В отличие от использования setwd(), которое является хрупким и зависит от способа организации файлов, здесь используется каталог верхнего уровня проекта, чтобы легко создавать пути к файлам.
  • installr: позволяет пользователям обновлять R и все установленные пакеты с помощью одной команды.
  • mailR: отправка электронной почты из R.
  • plumber: пакет R, который преобразует существующий код R в веб-API.
  • pushoverr: отправляйте push-уведомления из R на мобильные устройства или рабочий стол.
  • usethis: пакет автоматизирует повторяющиеся задачи, возникающие во время наладки и разработки проекта, как для пакетов R, так и для проектов, не являющихся пакетами.


✨Визуализация данных ✨

  • bayesplot: пакет R, предоставляющий обширную библиотеку функций построения графиков для использования после подгонки байесовских моделей (обычно с MCMC). Графики, созданные в Bayesplot, являются объектами ggplot, т.е. после создания графика его можно дополнительно настроить с помощью различных функций из пакета ggplot2.
  • cowplot: предоставляет различные функции, помогающие создавать темы, выравнивать графики и упорядочивать их в сложные составные фигуры, а также функции, облегчающие комментирование графиков.
  • Esquisse: создает графический интерфейс для ggplot
  • gganatogram: создание анатограмм для разных организмов с помощью ggplot2.
  • ggannotate: инструмент «укажи и щелкни», который поможет Вам разместить аннотации именно там, где вы хотите.
  • golem: пакет для создания приложений с детскими играми.
  • Rayshader: создает очень красивые 3D-сюжеты.
  • sjplots: функции построения графиков и вывода таблиц.
  • tmap: тематические карты в R.
  • vaporwave: темы для графики из 80-ых.

🛁 Очистка и обработка данных 🛁

  • janitor: простые функции для изучения и очистки грязных данных. Пакет оптимизирован для данных, поступающих вместе с пакетами readr и readxl
  • sqldf: управление данными с использованием синтаксиса SQL. Это удобно, если Вам нужно загрузить данные, размер которых много больше того, с чем может работать Ваша машина. Поэтому, Вы можете отфильтровать их и загрузить в R только результат запроса.
  • naniar: предоставляет аккуратные способы суммирования, визуализации и манипулирования недостающими данными с минимальными отклонениями
  • Tidylog: предоставляет отзывы об основных операциях dplyr и tidyr.


💻 Исследование и моделирование данных 💻

  • dlookr: Несколько пользовательских функций для диагностики качества данных.
  • DHARMa: интересный пакет R для остаточной диагностики GLMM.
  • finalfit: пакет предоставляет функции, которые помогут Вам быстро создавать элегантные таблицы и графики при моделировании в R. Это могут быть экспортированые документы Word, PDF или HTML файлы. Пример ниже.

Результат - чистая, готовая к публикации таблица:

  • LongCatEDA: полезно для визуализации продольных изменений категориальных переменных.
  • jtools: этот пакет состоит из ряда функций, созданных для автоматизации утомительных исследовательских задач. На данном этапе объединяющей темой является более эффективное представление регрессионного анализа.
  • modelbased: это легкий пакет, помогающий с оценками на основе моделей, которые используются при вычислении маржинальных средних, анализе контраста и прогнозах.
  • performance: основная цель пакета - предоставить служебные программы для вычисления показателей качества модели и степени соответствия. Сюда входят такие меры, как r-квадрат (R2), среднеквадратичная ошибка (RMSE) или коэффициент внутриклассовой корреляции (ICC), так и функции для проверки смешанных моделей на избыточную дисперсию, нулевую инфляцию, сходимость или сингулярность.
  • skimr: конвейерный подход к работе со сводной статистикой.
  • syuzhet: Простой анализ настроений в R.


Эпилог

Надеемся, Вы нашли что-то полезное или интересное для своих проектов. Возможно, у Вас на примете есть еще пакеты, которые кажутся Вам очень полезными, но по каким-то причинам недооцененными, или же просто забавные библиотеки. Пишите в комментариях и мы выпустим дополнительный список.

Забирайте себе, чтобы не потерять!

Источник здесь




Report Page