Définition
Anonymisation préservant le format
L'anonymisation préservant le format est une technique de substitution où la valeur de remplacement satisfait le même format syntaxique que l'original (checksum IBAN valide, numéro de carte Luhn valide, email d'apparence valide) — pour que les systèmes en aval qui valident le format acceptent toujours le placeholder.
Pour une DLP IA, la préservation du format permet au LLM de raisonner normalement sur la structure des données ("cela ressemble à un IBAN client, à router vers le département UE") sans jamais voir la valeur réelle. Sans préservation du format, les marqueurs [REDACTED] génériques cassent les chaînes de raisonnement LLM.
Pourquoi cela compte
- ✓Le taux de bypass est l'indicateur d'alerte précoce : si les utilisateurs retapent les prompts pour évader la DLP, l'anonymisation est trop agressive.
- ✓Les valeurs préservant le format sont la clé technique pour maintenir un mode Block / Anonymize sur le long terme.