Aller au contenu

Anonimal

Anonimal est le masque que portent vos données avant que vous ne les envoyiez à un LLM. Il détecte et remplace les informations personnellement identifiables (PII) — noms, e-mails, numéros de téléphone, adresses, identifiants nationaux, cartes, secrets — et il le fait 100 % sur votre propre machine. Le modèle s’exécute sur votre CPU, hors ligne ; les données d’origine ne quittent jamais votre infrastructure.

Anonimal est le spécialiste de la confidentialité de l’Escriba Suite. C’est l’unique responsable de l’anonymisation sérieuse dans l’écosystème : les satellites (Escriba, Fisherboy, Extracta) lui délèguent cette tâche via HTTP grâce à ANONIMAL_URL. Il fonctionne aussi de manière autonome — en tant que service ou en tant que bibliothèque intégrable.

Détecte les véritables PII

Deux moteurs : un moteur regex intégré pour les données structurées, et un moteur ML / NER optionnel (OpenAI Privacy Filter) pour les noms et adresses en texte libre.

Cinq modes de remplacement

typed, anon, pseudo (réversible), mask et hash. Des marqueurs opaques tels que EMAIL_1 ou une réhydratation entièrement réversible — à vous de choisir pour chaque requête.

Anonymisation réversible

Le mode pseudo renvoie une table token → original. Anonymisez avant le LLM, réidentifiez la réponse ensuite avec /deanonymize.

Fonctionne 100 % en local

Lié au CPU, hors ligne, sans sortie réseau. Auto-hébergé via Docker ; les PII d’origine ne quittent jamais la machine.

Préservation du format

Anonymise txt, md, log, srt, html, CSV (conserve les colonnes) et JSON (conserve la structure et les clés) — ainsi que la rédaction visuelle de PDF.

REST API + bibliothèque

Une petite REST API (/detect, /anonymize, /deanonymize, …) pour l’automatisation, ainsi que anonimal_lite comme solution de repli Python installable.

Anonimal est responsable de l’anonymisation afin que le reste de la suite n’ait pas à l’être. Un satellite qui a ANONIMAL_URL défini appelle le service (moteur ML complet) ; sans cela, il se rabat sur la bibliothèque regex anonimal_lite fournie. Un seul endroit où maintenir la logique de confidentialité, partagée par chaque produit.

Installer Anonimal Voir sur GitHub