Сбор метрик о состоянии системы

Приложение Kaspersky Endpoint Security во время своей работы оказывает влияние на операционную систему. Для анализа происходящего предусмотрена возможность сбора метрик, связанных с производительностью приложения.

Чтобы настроить сбор метрик о ресурсах операционной системы, используемых приложением, выполните следующую команду:

kesl-control [-J] --export-metrics [--period <интервал времени между выводами в секундах>|--interactive]

где:

В результате будет выведен список метрик.

Список метрик

Внутреннее название метрики и метка

Тип метрики

Описание

Рекомендуемое пороговое значение

lfs_system_descriptor_opened_count

Sensor

Количество дескрипторов, открытых в данный момент процессом kesl.

Если рост количества дескрипторов превышает 250 за час, рекомендуется обратиться в Службу технической поддержки.

lfs_system_uptime_milliseconds

Counter

Количество миллисекунд, прошедшее от запуска операционной системы до настоящего момента.

 

lfs_system_memory_usage_bytes

метка type=virtual

Sensor

Количество виртуальной памяти, используемой в данный момент процессом kesl.

Рекомендуется выставить пороговое значение самостоятельно на основе данных системы. Получить данные можно самостоятельно или с помощью скрипта для сбора информации. За примером скрипта вы можете обратиться в Службу технической поддержки.

lfs_system_memory_usage_bytes

метка type=resident

Sensor

Количество резидентной памяти, используемой в данный момент процессом kesl.

Рекомендуется выставить пороговое значение самостоятельно на основе данных системы. Получить данные можно самостоятельно или с помощью скрипта для сбора информации. За примером скрипта вы можете обратиться в Службу технической поддержки.

lfs_system_memory_usage_bytes

метка type=swap

Sensor

Количество памяти из файла подкачки, используемой в данный момент процессом kesl.

Рекомендуется выставить пороговое значение самостоятельно на основе данных системы. Получить данные можно самостоятельно или с помощью скрипта для сбора информации. За примером скрипта вы можете обратиться в Службу технической поддержки.

lfs_system_cpu_usage_milliseconds

метка type=user

Counter

Количество миллисекунд процессорного времени, потребленное процессом kesl в пользовательском пространстве, от начала запуска процесса kesl и до настоящего момента.

Рекомендуется выставить пороговое значение самостоятельно на основе данных системы. Получить данные можно самостоятельно или с помощью скрипта для сбора информации. За примером скрипта вы можете обратиться в Службу технической поддержки.

lfs_system_cpu_usage_milliseconds

метка type=kernel

Counter

Количество миллисекунд процессорного времени, потребленное процессом kesl в пространстве ядра, от начала запуска процесса kesl и до настоящего момента.

Рекомендуется выставить пороговое значение самостоятельно на основе данных системы. Получить данные можно самостоятельно или с помощью скрипта для сбора информации. За примером скрипта вы можете обратиться в Службу технической поддержки.

lfs_system_cpu_usage_milliseconds

метка type=total

Counter

Количество миллисекунд процессорного времени, потребленное процессом kesl в пользовательском пространстве и в пространстве ядра, от начала работы процесса kesl и до настоящего момента.

Если процессорное время процесса kesl превышает всю остальную нагрузку, рекомендуется обратиться в Службу технической поддержки.

lfs_tcpSynInterceptor_connection_hanging_count

Counter

Общее количество зависших сетевых соединений на этапе установления соединения в сети TCP между сервером и клиентом от начала работы процесса kesl до настоящего момента (зависшими считаются сетевые соединения, ожидающие решение удаленного сервера по разрешению подключения от 1 секунды до 2 минут в зависимости от системного параметра /proc/sys/net/ipv4/tcp_syn_retries).

Рост может быть обусловлен тем, что удаленный сервер недоступен или отсутствует. Если прирост количества зависших сетевых соединений больше 10 в минуту, рекомендуется обратиться в Службу технической поддержки.

lfs_tcpSynInterceptor_connection_count

Sensor

Количество сетевых соединений, в данный момент ожидающих подключения к удаленному серверу.

 

lfs_tcpSynInterceptor_verdict_count

метка verdict=allow

Counter

Общее количество перехваченных соединений, которые удалось установить, от начала работы процесса kesl до настоящего момента.

 

lfs_tcpSynInterceptor_verdict_count

метка verdict=drop

Counter

Общее количество перехваченных соединений, для которых не удалось установить соединение, от начала работы процесса kesl до настоящего момента.

 

lfs_tcpSynInterceptor_verdict_count

метка verdict=unknown

Counter

Общее количество сетевых соединений от начала работы процесса kesl до настоящего момента с необрабатываемым решением удаленного сервера по разешению подключения.

 

lfs_tcpSynInterceptor_verdict_latency_milliseconds

Histogram

Гистограмма по времени принятия решения удаленного сервера по разрешению подключения от момента перехвата SYN-пакета до принятия решения для него.

 

lfs_tproxy_connection_count

метка direction=inbound

Sensor

Текущее количество входящих перехваченных сетевых соединений в данный момент.

 

lfs_tproxy_connection_count

метка direction=outbound

Sensor

Текущее количество исходящих перехваченных сетевых соединений в данный момент.

 

lfs_tproxy_connection_orphaned_count

Counter

Общее количество соединений (от начала работы компонентов Защита от веб-угроз, Защита от сетевых угроз и Веб-Контроль), перехваченных приложением Kaspersky Endpoint Security, хотя их перехват не планировался (например, из-за несовместимой конфигурации iptables или по причине того, что приложение не успело обработать новую конфигурацию перехвата). Такие соединения будут отклонены.

Если общее количество таких соединений превышает 10, это может свидельствовать о некорректной работе приложения или системы, рекомендуется обратиться в Службу технической поддержки.

lfs_tproxy_threadPool_task_count

Counter

Общее количество задач (новое соединение, новая порция данных, данные отправлены и так далее), поступивших в пул потоков от начала работы компонентов Защита от веб-угроз, Защита от сетевых угроз и Веб-Контроль.

Если разница между общим количеством задач и количеством выполненных задач неснижаемо растет, требуется добавить ресурсов, настроить исключения или обратиться в Службу технической поддержки.

lfs_tproxy_threadPool_task_duration_milliseconds

Histogram

Гистограмма по времени выполнения задач обработки перехваченных соединений.

Если время выполнения 95% задач превышает 1 секунду, требуется добавить ресурсов, настроить исключения или обратиться в Службу технической поддержки.

lfs_tproxy_socket_count

Sensor

Текущее количество сокетов (слушающие сокеты и сокеты соединений). Перехваченное соединение имеет 2 сокета соединений.

 

lfs_trafficScanning_object_hanging_count

Sensor

Текущее количество зависших проверок объектов в перехваченном трафике (зависшими считаются проверки, длительность которых превышает 1 минуту).

Если общее количество зависших проверок объектов больше 35, имеется проблема с базами приложения, рекомендуется обратиться в Службу технической поддержки.

lfs_trafficScanning_object_duration_milliseconds

Histogram

Гистограмма по времени проверок объектов в перехваченном трафике.

Если время проверок 95% объектов превышает 1 секунду, требуется добавить ресурсов, обновить базы приложения или обратиться в Службу технической поддержки.

Если скорость прироста проверок пакетов в перехваченном трафике равна 0 и значение метрики lfs_tproxy_threadPool_task_count не равно 0, требуется обновить базы приложения или обратиться в Службу технической поддержки.

lfs_fileMonitor_cache_size

Sensor

Текущий размер кеша File Monitor (кеш ревизий файлов), который отслеживает изменения файлов.

Если текущий размер кеша File Monitor больше 50000, рекомендуется обратиться в Службу технической поддержки.

lfs_fileMonitor_cache_hit_count

Counter

Число попаданий в кеш File Monitor (кеш ревизий файлов), который отслеживает изменения файлов.

 

lfs_fileMonitor_cache_miss_count

Counter

Число кеш-промахов File Monitor (кеш ревизий файлов), который отслеживает изменения файлов.

 

lfs_faCache_file_count

Sensor

Текущий размер кеша файлов перехватчика fanotify, не нуждающихся в проверке.

Если текущий размер кеша файлов больше 100000, рекомендуется обратиться в Службу технической поддержки.

lfs_faCache_file_hit_count

Counter

Число попаданий в кеш файлов перехватчика fanotify, не нуждающихся в проверке.

 

lfs_faCache_file_miss_count

Counter

Число кеш-промахов файлов перехватчика fanotify, не нуждающихся в проверке.

 

lfs_faCache_volume_count

Sensor

Текущий размер кеша точек монтирования перехватчика fanotify.

 

 lfs_oas_cache_file_count

Sensor

Текущий размер кеша файлов Защиты от файловых угроз, не нуждающихся в проверке.

Если текущий размер кеша файлов больше 100000, рекомендуется обратиться в Службу технической поддержки.

lfs_oas_cache_file_hit_count

Counter

Число попаданий в кеш файлов Защиты от файловых угроз, не нуждающихся в проверке.

 

lfs_oas_cache_file_miss_count

Counter

Число кеш-промахов файлов Защиты от файловых угроз, не нуждающихся в проверке.

 

 lfs_oas_cache_volume_count

Sensor

Текущий размер кеша точек монтирования Защиты от файловых угроз.

 

lfs_processManager_cache_size

Sensor

Текущее количество активных процессов в системе, находящихся в кеше.

 

lfs_processManager_сache_hit_count

Counter

Число попаданий в кеш процессов в системе.

 

lfs_processManager_cache_miss_count

Counter

Число кеш-промахов процессов в системе.

 

lfs_blockingProcessInterceptor_cache_size

Sensor

Текущий размер кеша интерпретаторов, с помощью которых могут быть запущены процессы.

Количество зависит от интенсивности запуска интерпретаторов на конкретном устройстве. Если текущий размер кеша файлов больше 10000, рекомендуется обратиться в Службу технической поддержки.

lfs_blockingProcessInterceptor_cache_hit_count

Counter

Число попаданий в кеш интерпретаторов.

 

lfs_blockingProcessInterceptor_cache_miss_count

Counter

Число кеш-промахов интерпретаторов.

 

 lfs_prevention_cache_file_count

Sensor

Текущий размер кеша файлов задачи Запрет запуска объектов, не нуждающихся в проверке.

 

lfs_prevention_cache_file_hit_count

Counter

Число попаданий в кеш файлов задачи Запрет запуска объектов, не нуждающихся в проверке.

 

lfs_prevention_cache_file_miss_count

Counter

Число кеш-промахов файлов задачи Запрет запуска объектов, не нуждающихся в проверке.

 

 lfs_prevention_cache_volume_count

Sensor

Текущий размер кеша точек монтирования задачи Запрет запуска объектов.

 

eka_telemetry_metrics_registry_callbacks_exec_duration_milliseconds

Sensor

Период времени, который заняло текущее обновление метрик всеми зарегистрированными в реестре клиентами (в миллисекундах).

 

eka_telemetry_metrics_registry_registered_callbacks

Sensor

Текущее количество вызовов функций обновления метрик, которые выполнили MetricsRegistry для всех зарегистрированных клиентов.

 

eka_telemetry_metrics_registry_scrape_duration_milliseconds

Sensor 

Период времени, который занял сбор значений всех метрик реестра (в миллисекундах).

Если 99% значений этой метрики больше 1 секунды в течение 10 минут, рекомендуется обратиться в Службу технической поддержки.

Рекомендуется анализировать метрики в системах визуализации данных, например Grafana.

Для получения информации о характеристиках операционной системы и вашего устройства можно использовать скрипт. За примером скрипта и интеграции c системой Grafana вы можете обратиться в Службу технической поддержки.

Экспортированные метрики можно публиковать в основные системы мониторинга, например Prometheus и Zabbix. Для интеграции с системами мониторинга можно использовать скрипт, который будет получать информацию от приложения и публиковать ее в систему мониторинга. Для получения скрипта вы можете обратиться в Службу технической поддержки.

В начало