Collecte de métriques d’état du système

L'application Kaspersky Endpoint Security affecte le système d'exploitation lors de son fonctionnement. Pour analyser ce qui se passe, il est possible de collecter des métriques liées aux performances des applications.

Pour configurer la collecte de mesures sur les ressources du système d’exploitation utilisées par une application, exécutez la commande suivante :

kesl-control [-J] --export-metrics [--period <intervalle de temps entre les affichages en secondes>|--interactive]

où :

Cela affichera une liste de métriques.

Liste des métriques

Nom interne de la métrique et étiquette

Type de métrique

Description

Valeur de seuil recommandée

lfs_system_descriptor_opened_count

Sensor

Le nombre de descripteurs actuellement ouverts par le processus kesl.

Si la croissance du nombre de descripteurs dépasse 250 par heure, il est recommandé de contacter le Support Technique.

lfs_system_uptime_milliseconds

Counter

Le nombre de millisecondes qui se sont écoulées depuis le démarrage du système d'exploitation jusqu'à présent.

 

lfs_system_memory_usage_bytes

étiquette type=virtual

Sensor

La quantité de mémoire virtuelle actuellement utilisée par le processus kesl.

Il est recommandé de définir vous-même la valeur de seuil en fonction des données du système. Vous pouvez obtenir les données vous-même ou utiliser un script pour collecter des informations. Pour un exemple de script, vous pouvez contacter le Support Technique.

lfs_system_memory_usage_bytes

étiquette type=resident

Sensor

La quantité de mémoire résidente actuellement utilisée par le processus kesl.

Il est recommandé de définir vous-même la valeur de seuil en fonction des données du système. Vous pouvez obtenir les données vous-même ou utiliser un script pour collecter des informations. Pour un exemple de script, vous pouvez contacter le Support Technique.

lfs_system_memory_usage_bytes

étiquette type=swap

Sensor

La quantité de mémoire de fichier de pagination actuellement utilisée par le processus kesl.

Il est recommandé de définir vous-même la valeur de seuil en fonction des données du système. Vous pouvez obtenir les données vous-même ou utiliser un script pour collecter des informations. Pour un exemple de script, vous pouvez contacter le Support Technique.

lfs_system_cpu_usage_milliseconds

étiquette type=user

Counter

Le nombre de millisecondes de temps CPU consommées par le processus kesl dans l'espace utilisateur, depuis le démarrage du processus kesl jusqu'à maintenant.

Il est recommandé de définir vous-même la valeur de seuil en fonction des données du système. Vous pouvez obtenir les données vous-même ou utiliser un script pour collecter des informations. Pour un exemple de script, vous pouvez contacter le Support Technique.

lfs_system_cpu_usage_milliseconds

étiquette type=kernel

Counter

Le nombre de millisecondes de temps CPU consommées par le processus kesl dans l'espace noyau, depuis le démarrage du processus kesl jusqu'à maintenant.

Il est recommandé de définir vous-même la valeur de seuil en fonction des données du système. Vous pouvez obtenir les données vous-même ou utiliser un script pour collecter des informations. Pour un exemple de script, vous pouvez contacter le Support Technique.

lfs_system_cpu_usage_milliseconds

étiquette type=total

Counter

Le nombre de millisecondes de temps CPU consommées par le processus kesl dans l'espace utilisateur et l'espace noyau, depuis le début du processus kesl jusqu'à maintenant.

Si le temps CPU du processus kesl dépasse toute autre charge, il est recommandé de contacter le Support Technique.

lfs_tcpSynInterceptor_connection_hanging_count

Counter

Nombre total de connexions réseau gelées au stade d'établissement de la connexion réseau TCP entre le serveur et le client depuis le début du processus kesl jusqu'à maintenant (les connexions gelées sont celles qui ont attendu que le serveur à distance décide d'autoriser ou non la connexion de 1 seconde à 2 minutes, selon le paramètre système /proc/sys/net/ipv4/tcp_syn_retries).

L'augmentation peut être due au fait que le serveur à distance n'est pas disponible ou est absent. Si l'augmentation du nombre de connexions réseau gelées est supérieure à 10 par minute, il est recommandé de contacter le Support Technique.

lfs_tcpSynInterceptor_connection_count

Sensor

Le nombre de connexions réseau actuellement en attente de connexion au serveur distant.

 

lfs_tcpSynInterceptor_verdict_count

étiquette verdict=allow

Counter

Nombre total de connexions interceptées qui ont été établies avec succès, depuis le début du processus kesl jusqu'à maintenant.

 

lfs_tcpSynInterceptor_verdict_count

étiquette verdict=drop

Counter

Le nombre total de connexions interceptées qui n'ont pas réussi à établir une connexion, depuis le début du processus kesl jusqu'à maintenant.

 

lfs_tcpSynInterceptor_verdict_count

étiquette verdict=unknown

Counter

Nombre total de connexions réseau depuis le début du processus kesl jusqu'à présent avec une décision non traitée du serveur à distance pour autoriser la connexion.

 

lfs_tcpSynInterceptor_verdict_latency_milliseconds

Histogram

Histogramme du temps nécessaire à un serveur à distance pour prendre une décision concernant l'autorisation d'une connexion à partir du moment où un paquet SYN est intercepté jusqu'à ce qu'une décision soit prise à son sujet.

 

lfs_tproxy_connection_count

étiquette direction=inbound

Sensor

Le nombre actuel de connexions réseau entrantes interceptées à ce moment.

 

lfs_tproxy_connection_count

étiquette direction=outbound

Sensor

Le nombre actuel de connexions réseau sortantes interceptées à ce moment.

 

lfs_tproxy_connection_orphaned_count

Counter

Nombre total de connexions (depuis le démarrage des modules Protection contre les menaces Internet, Protection contre les menaces réseau et Contrôle Internet) interceptées par l'application Kaspersky Endpoint Security, bien que leur interception n'ait pas été planifiée (par exemple, en raison d'une configuration iptables incompatible ou parce que l'application n'a pas eu le temps de traiter la nouvelle configuration d'interception). De telles connexions seront rejetées.

Si le nombre total de ces connexions dépasse 10, cela peut indiquer un dysfonctionnement de l'application ou du système. Il est recommandé de contacter le Support Technique.

lfs_tproxy_threadPool_task_count

Counter

Nombre total de tâches (nouvelle connexion, nouvelle partie de données, données envoyées, etc.) qui sont entrées dans le pool de threads depuis que les modules Protection contre les menaces Internet, Protection contre les menaces réseau et Contrôle Internet ont commencé à fonctionner.

Si la différence entre le nombre total de tâches et le nombre de tâches terminées augmente régulièrement, vous devez ajouter des ressources, configurer des exclusions ou contacter le Support Technique.

lfs_tproxy_threadPool_task_duration_milliseconds

Histogram

Histogramme du temps d'exécution des tâches traitant les connexions interceptées.

Si 95 % des tâches prennent plus d’une seconde à s’exécuter, vous devrez peut-être ajouter des ressources, configurer des exclusions ou contacter le Support Technique.

lfs_tproxy_socket_count

Sensor

Nombre actuel de sockets (sockets d'écoute et sockets de connexion). La connexion interceptée possède 2 sockets de connexion.

 

lfs_trafficScanning_object_hanging_count

Sensor

Le nombre actuel de vérifications d'objets gelées dans le trafic intercepté (les vérifications gelées sont celles qui durent plus d'une minute).

Si le nombre total de vérifications d'objets gelées est supérieur à 35, il y a un problème avec les bases de données de l'application, il est recommandé de contacter le Support Technique.

lfs_trafficScanning_object_duration_milliseconds

Histogram

Histogramme du temps de vérification des objets dans le trafic intercepté.

Si le temps de vérification de 95 % des objets dépasse 1 seconde, vous devez ajouter des ressources, mettre à jour les bases de données de l'application ou contacter le Support Technique.

Si le taux de croissance des contrôles de paquets dans le trafic intercepté est de 0 et que la valeur de la métrique lfs_tproxy_threadPool_task_count n'est pas égale à 0, vous devez mettre à jour les bases de données de l'application ou contacter le Support Technique.

lfs_fileMonitor_cache_size

Sensor

La taille actuelle du cache de File Monitor (cache de révision de fichiers), qui suit les modifications des fichiers.

Si la taille actuelle du cache de File Monitor est supérieure à 50 000, nous vous recommandons de contacter le Support Technique.

lfs_fileMonitor_cache_hit_count

Counter

Le nombre de hits dans le cache de File Monitor (cache de révision de fichiers), qui suit les modifications des fichiers.

 

lfs_fileMonitor_cache_miss_count

Counter

Le nombre d'échecs de cache de File Monitor (cache de révision de fichiers), qui suit les modifications des fichiers.

 

lfs_faCache_file_count

Sensor

Taille actuelle du cache des fichiers de l'intercepteur fanotify qui n'ont pas besoin d'être vérifiés.

Si la taille actuelle du cache des fichiers est supérieure à 100 000, il est recommandé de contacter le Support Technique.

lfs_faCache_file_hit_count

Counter

Le nombre de hits dans le cache des fichiers de l'intercepteur fanotify qui n'ont pas besoin d'être vérifiés.

 

lfs_faCache_file_miss_count

Counter

Le nombre d'échecs de cache des fichiers de l'intercepteur fanotify qui n'ont pas besoin d'être vérifiés.

 

lfs_faCache_volume_count

Sensor

Taille actuelle du cache du point de montage de l'intercepteur fanotify.

 

lfs_oas_cache_file_count

Sensor

La taille actuelle du cache des fichiers de la Protection contre les fichiers malicieux qui n'ont pas besoin d'être analysés.

Si la taille actuelle du cache des fichiers est supérieure à 100 000, il est recommandé de contacter le Support Technique.

lfs_oas_cache_file_hit_count

Counter

Le nombre de hits dans le cache des fichiers de la Protection contre les fichiers malicieux qui n'ont pas besoin d'être analysés.

 

lfs_oas_cache_file_miss_count

Counter

Le nombre d'échecs du cache des fichiers de la Protection contre les fichiers malicieux qui n'ont pas besoin d'être analysés.

 

lfs_oas_cache_volume_count

Sensor

La taille actuelle du cache du point de montage de la Protection contre les fichiers malicieux.

 

lfs_processManager_cache_size

Sensor

Le nombre actuel des processus actifs dans le système qui sont dans le cache.

 

lfs_processManager_sache_hit_count

Counter

Le nombre de hits du cache des processus dans le système.

 

lfs_processManager_cache_miss_count

Counter

Le nombre d'échecs du cache des processus dans le système.

 

lfs_blockingProcessInterceptor_cache_size

Sensor

La taille actuelle du cache des interpréteurs qui peuvent être utilisés pour exécuter des processus.

La quantité dépend de l'intensité d'exécution des interprètes sur un appareil particulier. Si la taille actuelle du cache des fichiers est supérieure à 10 000, il est recommandé de contacter le Support Technique.

lfs_blockingProcessInterceptor_cache_hit_count

Counter

Le nombre de hits dans le cache de l'interpréteur.

 

lfs_blockingProcessInterceptor_cache_miss_count

Counter

Le nombre d'échecs du cache des interprètes.

 

lfs_prevention_cache_file_count

Sensor

Taille actuelle du cache des fichiers de la tâche Prévention du lancement des objets qui n'ont pas besoin d'être vérifiés.

 

lfs_prevention_cache_file_hit_count

Counter

Nombre de hits dans le cache des fichiers de la tâche Prévention du lancement des objets qui n'ont pas besoin d'être vérifiés.

 

lfs_prevention_cache_file_miss_count

Counter

Nombre d'échecs de cache des fichiers de la tâche Prévention du lancement des objets qui n'ont pas besoin d'être vérifiés.

 

lfs_prevention_cache_volume_count

Sensor

La actuelle du cache du point de montage pour la tâche Prévention du lancement des objets.

 

eka_telemetry_metrics_registry_callbacks_exec_duration_milliseconds

Sensor

Le temps nécessaire à la mise à jour actuelle des métriques pour être effectuée par tous les clients enregistrés dans le registre (en millisecondes).

 

eka_telemetry_metrics_registry_registered_callbacks

Sensor

Le nombre actuel d'appels de fonction de mise à jour de métrique que MetricsRegistry a effectués pour tous les clients enregistrés.

 

eka_telemetry_metrics_registry_scrape_duration_milliseconds

Sensor

Le temps nécessaire pour collecter les valeurs de toutes les métriques du registre (en millisecondes).

Si 99 % des valeurs de cette métrique sont supérieures à 1 seconde pendant 10 minutes, nous vous recommandons de contacter le Support Technique.

Il est recommandé d'analyser les métriques dans les systèmes de visualisation de données tels que Grafana.

Vous pouvez utiliser un script pour obtenir des informations sur les caractéristiques du système d'exploitation et de votre appareil. Pour un exemple de script et d'intégration avec le système Grafana, vous pouvez contacter le Support Technique.

Les métriques exportées peuvent être publiées vers les principaux systèmes de surveillance, tels que Prometheus et Zabbix. Pour intégrer les systèmes de surveillance, vous pouvez utiliser un script qui recevra les informations de l'application et les publiera sur le système de surveillance. Pour obtenir le script, vous pouvez contacter le Support Technique.

Haut de page