Détecte les véritables PII
Deux moteurs : un moteur regex intégré pour les données structurées, et un moteur ML / NER optionnel (OpenAI Privacy Filter) pour les noms et adresses en texte libre.
Anonimal est le masque que portent vos données avant que vous ne les envoyiez à un LLM. Il détecte et remplace les informations personnellement identifiables (PII) — noms, e-mails, numéros de téléphone, adresses, identifiants nationaux, cartes, secrets — et il le fait 100 % sur votre propre machine. Le modèle s’exécute sur votre CPU, hors ligne ; les données d’origine ne quittent jamais votre infrastructure.
Anonimal est le spécialiste de la confidentialité de l’Escriba Suite. C’est l’unique
responsable de l’anonymisation sérieuse dans l’écosystème : les satellites (Escriba,
Fisherboy, Extracta) lui délèguent cette tâche via HTTP grâce à ANONIMAL_URL. Il fonctionne
aussi de manière autonome — en tant que service ou en tant que bibliothèque intégrable.
Détecte les véritables PII
Deux moteurs : un moteur regex intégré pour les données structurées, et un moteur ML / NER optionnel (OpenAI Privacy Filter) pour les noms et adresses en texte libre.
Cinq modes de remplacement
typed, anon, pseudo (réversible), mask et hash. Des marqueurs opaques
tels que EMAIL_1 ou une réhydratation entièrement réversible — à vous de choisir pour chaque requête.
Anonymisation réversible
Le mode pseudo renvoie une table token → original. Anonymisez avant le LLM,
réidentifiez la réponse ensuite avec /deanonymize.
Fonctionne 100 % en local
Lié au CPU, hors ligne, sans sortie réseau. Auto-hébergé via Docker ; les PII d’origine ne quittent jamais la machine.
Préservation du format
Anonymise txt, md, log, srt, html, CSV (conserve les colonnes) et
JSON (conserve la structure et les clés) — ainsi que la rédaction visuelle de PDF.
REST API + bibliothèque
Une petite REST API (/detect, /anonymize, /deanonymize, …) pour l’automatisation,
ainsi que anonimal_lite comme solution de repli Python installable.
Anonimal est responsable de l’anonymisation afin que le reste de la suite n’ait pas à l’être. Un satellite
qui a ANONIMAL_URL défini appelle le service (moteur ML complet) ; sans cela, il
se rabat sur la bibliothèque regex anonimal_lite fournie. Un seul endroit où maintenir la
logique de confidentialité, partagée par chaque produit.