В KUMA можно настроить перенос устаревших данных с кластера ClickHouse на холодное хранение. Для холодного хранения могут использоваться смонтированные в операционной системе локальные диски или распределенная файловая система Hadoop Distributed File System (HDFS). Функция холодного хранения включается, если указан хотя бы один диск холодного хранения.
После изменения параметров холодного хранения сервис хранилища необходимо перезапустить. Если сервис не запускается, причина будет указана в журнале хранилища.
Если указанный в параметрах хранилища диск холодного хранения стал недоступен (например, вышел из строя), это может привести к ошибкам в работе сервиса хранилища. В этом случае необходимо воссоздать диск с таким же путем (для локальных дисков) или таким же адресом (для HDFS-дисков), а затем удалить его из параметров хранилища.
Правила переноса данных на диски холодного хранения
При задействованном холодном хранении KUMA раз в час проверяет сроки хранения пространств:
Если срок хранения пространства на кластере ClickHouse истек, данные переносятся на диски холодного хранения. Если диск холодного хранения настроен неверно, данные удаляются.
Если срок хранения пространства на диске холодного хранения истек, данные удаляются.
Если диски кластера ClickHouse заполнены на 90%, самые старые данные кластера автоматически переносятся на диски холодного хранения. Это действие может происходить больше одного раза в час.
При начале и окончании переноса данных создаются события аудита.
Во время переноса данных сервис хранилища продолжает работать, при этом в разделе консоли KUMA Ресурсы → Активные сервисы для него отображается желтый статус. При наведении указателя мыши на значок статуса отображается сообщение о переносе данных.
Особенности хранения событий и доступа к ним
При использовании для холодного хранения HDFS-дисков необходимо обеспечить защиту данных одним из следующих способов:
Настроить отдельный физический интерфейс в сети VLAN, в котором будут расположены только HDFS-диски и кластер ClickHouse.
Настроить правила сегментации сети и фильтрации трафика, исключающие прямой доступ к HDFS-диску или перехват трафика к диску со стороны ClickHouse.
События, находящиеся в кластере ClickHouse и на дисках холодного хранения, одинаково доступны в консоли KUMA. Например, при поиске событий или при просмотре событий, относящихся к обнаружениям.
Допускается не хранить события или события аудита на дисках холодного хранения: для этого в параметрах хранилища в поле Срок холодного хранения или Срок холодного хранения событий аудита необходимо указать 0 (дней).
Особенности использования HDFS-дисков
Перед подключением HDFS-дисков на них необходимо создать директории для каждого узла кластера ClickHouse в формате <хост HDFS-диска>/<идентифика тор шарда>/<идентификатор реплики>. Например, если кластер состоит из двух узлов, где на которых расположены две реплики одного шарда, необходимо создать следующие директории:
hdfs://hdfs-example-1:9000/clickhouse/1/1/
hdfs://hdfs-example-1:9000/clickhouse/1/2/
События из узлов кластера ClickHouse будут переноситься в директории, в названии которых указаны идентификаторы их шарда и реплики. Если изменить эти параметры узла и при этом не создать соответствующую директорию на HDFS-диске, события при переносе могут быть потеряны.
HDFS-диски, добавленные к хранилищу, работают в режиме JBOD. Это означает, что при отказе одного из дисков будет потерян доступ к хранилищу. При использовании HDFS следует учитывать необходимость отказоустойчивости и настроить RAID, а также хранение данных из разных реплик на различных устройствах.
Скорость записи событий в HDFS, как правило, ниже скорости записи событий на локальные диски. Скорость доступа к событиям в HDFS, как правило, значительно ниже скорости доступа к событиям на локальных дисках. При использовании одновременно локальных дисков и HDFS-дисков запись будет происходить в них по очереди.