Modèles de documents

Kaspersky Security permet de repérer les documents qui ont été créés au départ de modèles et qui peuvent contenir des données confidentielles. La catégorie Modèles de documents permet de créer des listes de modèles de documents avec lesquels l'application recherchera des correspondances dans les documents à analyser.

Pour repérer les correspondances avec les modèles, Kaspersky Security utilise la technologie des empreintes numériques (en anglais Digital Fingerprints) grâce à laquelle l'application transforme les données textuelles en fragments chiffrés.

Dans le cadre de la surveillance des fuites, l'application compare les fragments contenus dans les messages électroniques analysés aux fragments conservés dans la catégorie. Vous pouvez configurer la Seuil de correspondance des documents pour effectuer les tâches suivantes :

Dans la catégorie, l'application n'enregistre pas de documents sources ou de partie de ces documents. Il est impossible de restaurer ou de lire les documents sources ajoutés dans une catégorie, ou une partie de ces documents, sur la base des fragments.

Configuration d'une catégorie

Seuil de correspondance des documents définit le niveau de correspondance entre le document analysé et le modèle chargé dans la catégorie et selon lequel l'application détermine une fuite de données pour cette catégorie. Ce niveau est défini à l'aide de deux paramètres : le pourcentage minimum et maximum de correspondance des extraits.

Le pourcentage de correspondance minimum définit le niveau minimum de ressemblance entre le texte analysé et le modèle. Si le texte analysé correspond au modèle à un niveau inférieur à la valeur de ce paramètre, l'application ne déclarera pas de fuite de données selon cette catégorie.

Le pourcentage de correspondance maximum définit le niveau maximum de ressemblance entre le texte analysé et le modèle. Si le texte analysé correspond au modèle à un niveau supérieur à la valeur de ce paramètre, l'application ne déclarera pas de fuite de données selon cette catégorie.

Les valeurs par défaut de ces paramètres (similitude de 30 % et 99 %) garantissent le fonctionnement optimal de la catégorie contenant la majorité des documents. Certains cas pourraient nécessiter une configuration de ces paramètres.

Il est conseillé de modifier le pourcentage minimum de correspondance des extraits dans les cas suivants :

Il est conseillé de modifier la taille maximale de la séquence de fragments correspondante dans les cas suivants :

Il est conseillé de charger dans une catégorie des documents de taille similaire. Si la différence entre les documents est supérieure à un facteur de 2 ou 3, il est conseillé de créer des catégories distinctes. Dans le cas contraire, l'identification de correspondances avec les modèles chargés dans la catégorie peut ne pas fonctionner de manière optimale.

Si vous ne parvenez pas à définir les valeurs optimales pour le pourcentage minimum et maximum de correspondance des extraits, il est conseillé de scinder la catégorie en plusieurs sous-catégories de telle sorte que chaque catégorie contienne des modèles de structure et de taille plus ou moins identiques.

Scénarios de vérification des équivalences avec des documents

  1. Ajoutez une catégorie avec des citations de documents et configurez ses paramètres.
  2. Ajoutez une stratégie pour cette catégorie.

L'application vérifiera si les documents transmis par email contiennent des équivalences avec des modèles de document de la catégorie.

Au début