Архитектура HBase
#HadoopАрхитектура HBase имеет 3 основных компонента: HMaster, Region Server, Zookeeper.

Рисунок — Архитектура HBase
Все 3 компонента описаны ниже:
- HMaster —
- Реализация Master Server в HBase — это HMaster. Это процесс, в котором регионы назначаются серверу регионов, а также операциям DDL (создание, удаление таблицы). Он контролирует все экземпляры Region Server, присутствующие в кластере. В распределенной среде Мастер запускает несколько фоновых потоков. HMaster имеет множество функций, таких как управление балансировкой нагрузки, отработка отказа и т. Д.
- Региональный сервер —
- Таблицы HBase разделены по диапазону ключей строк по горизонтали на области. Регионы являются основными строительными элементами кластера HBase, который состоит из распределения таблиц и состоит из семейств столбцов. Region Server работает на HDFS DataNode, который присутствует в кластере Hadoop. Регионы Region Server отвечают за несколько вещей, таких как обработка, управление, выполнение, а также чтение и запись операций HBase в этом наборе регионов. Размер области по умолчанию составляет 256 МБ.
- Работник зоопарка —
- Это как координатор в HBase. Он предоставляет такие услуги, как поддержание информации о конфигурации, присвоение имен, обеспечение распределенной синхронизации, уведомление о сбое сервера и т. Д. Клиенты связываются с серверами региона через zookeeper.
Преимущества HBase —
- Может хранить большие наборы данных
- База данных может быть общей
- Экономичный от гигабайтов до петабайтов
- Высокая доступность благодаря отказоустойчивости и репликации
Недостатки HBase —
- Нет поддержки структуры SQL
- Нет поддержки транзакций
- Отсортировано только по ключу
- Проблемы с памятью в кластере
Кампарисон между HBase и HDFS :
- HBase обеспечивает доступ с низкой задержкой, в то время как HDFS обеспечивает операции с высокой задержкой.
- HBase поддерживает произвольное чтение и запись, в то время как HDFS поддерживает запись один раз для чтения много раз.
- Доступ к HBase осуществляется через команды оболочки, Java API, REST, Avro или Thrift API, а HDFS — через задания MapReduce.
Примечание. HBase широко используется для аналитических операций в Интернете, например, в банковских приложениях, таких как обновления данных в банкоматах в режиме реального времени, может использоваться HBase.