Kaspersky Security 9.x for SharePoint Server

Modèles de documents

18 mai 2024

ID 112923

Kaspersky Security permet de repérer les documents qui ont été créés au départ de modèles et qui peuvent contenir des données confidentielles. La catégorie Modèles de documents permet de créer des listes de modèles de documents avec lesquels l'application recherchera des correspondances dans les documents à analyser.

Pour repérer les correspondances avec les modèles, Kaspersky Security utilise la technologie des empreintes numériques (en anglais Digital Fingerprints) grâce à laquelle l'application transforme les données textuelles en fragments chiffrés.

Dans le cadre de la surveillance des fuites, l'application compare les fragments contenus dans les fichiers analysés aux fragments conservés dans la catégorie. Vous pouvez configurer la Seuil de correspondance des documents pour effectuer les tâches suivantes :

  • Détection des modèles de documents remplis ;
  • Détection des documents présentant une correspondance totale ou partielle avec les modèles.

Dans la catégorie, l'application n'enregistre pas de documents sources ou de partie de ces documents. Il est impossible de restaurer ou de lire les documents sources ajoutés dans une catégorie, ou une partie de ces documents, sur la base des fragments.

Configuration d'une catégorie

Seuil de correspondance des documents définit le niveau de correspondance entre le document analysé et le modèle chargé dans la catégorie et selon lequel l'application détermine une fuite de données pour cette catégorie. Ce niveau est défini à l'aide de deux paramètres : le pourcentage minimum et maximum de correspondance des extraits.

Le pourcentage de correspondance minimum définit le niveau minimum de ressemblance entre le texte analysé et le modèle. Si le texte analysé correspond au modèle à un niveau inférieur à la valeur de ce paramètre, l'application ne déclarera pas de fuite de données selon cette catégorie.

Le pourcentage de correspondance maximum définit le niveau maximum de ressemblance entre le texte analysé et le modèle. Si le texte analysé correspond au modèle à un niveau supérieur à la valeur de ce paramètre, l'application ne déclarera pas de fuite de données selon cette catégorie.

Les valeurs par défaut de ces paramètres (similitude de 30 % et 99 %) garantissent le fonctionnement optimal de la catégorie contenant la majorité des documents. Certains cas pourraient nécessiter une configuration de ces paramètres.

Il est conseillé de modifier le pourcentage minimum de correspondance des extraits dans les cas suivants :

  • Si les documents analysés génèrent des faux positifs (l'application génère des incidents lors de l'analyse de documents qui, selon vous, ne correspondent à aucun modèle de la catégorie). Pour configurer la catégorie, il est conseillé d'augmenter la valeur du paramètre.
  • Quand aucune correspondance n'est détectée entre les documents analysés et les modèles (l'application ne trouve pas de documents qui, d'après vous, correspondent à un des modèles de la catégorie). Pour configurer cette catégorie, il est conseillé de réduire la valeur du paramètre.

Il est conseillé de modifier la taille maximale de la séquence de fragments correspondante dans les cas suivants :

  • S'il faut garantir la recherche de documents qui affichent une équivalence parfaite avec les modèles chargés dans la catégorie (par exemple, les modèles eux-mêmes). Pour configurer cette catégorie, il est conseillé d'augmenter la valeur du paramètre jusqu'à 100 %.
  • S'il faut exclure de la recherche des documents qui constituent des versions différentes des modèles chargés (par exemple, des modèles dont les champs ont été légèrement modifiés). Pour configurer cette catégorie, il est conseillé de réduire la valeur du paramètre.

Il est conseillé de charger dans une catégorie des documents de taille similaire. Si la différence entre les documents est supérieure à un facteur de 2 ou 3, il est conseillé de créer des catégories distinctes. Dans le cas contraire, l'identification de correspondances avec les modèles chargés dans la catégorie peut ne pas fonctionner de manière optimale.

Si vous ne parvenez pas à définir les valeurs optimales pour le pourcentage minimum et maximum de correspondance des extraits, il est conseillé de scinder la catégorie en plusieurs sous-catégories de telle sorte que chaque catégorie contienne des modèles de structure et de taille plus ou moins identiques.

Scénarios de vérification des équivalences avec des documents

  1. Ajoutez une catégorie avec des citations de documents et configurez ses paramètres.
  2. Utilisez la catégorie avec les exemples de documents d'une des manières suivantes :

Cet article vous a-t-il été utile ?
Que pouvons-nous améliorer ?
Merci de nous faire part de vos commentaires. Vous nous aidez à nous améliorer.
Merci de nous faire part de vos commentaires. Vous nous aidez à nous améliorer.