Detecta PII real
Dos motores: un motor regex integrado para datos estructurados, y un motor opcional ML / NER (OpenAI Privacy Filter) para nombres y direcciones en texto libre.
Anonimal es la máscara que tus datos usan antes de que los envíes a un LLM. Detecta y reemplaza información de identificación personal (PII) — nombres, correos, números de teléfono, direcciones, identificadores nacionales, tarjetas, secretos — y lo hace 100% en tu propia máquina. El modelo corre en tu CPU, sin conexión; los datos originales nunca salen de tu infraestructura.
Anonimal es el especialista en privacidad de la Escriba Suite. Es el único
dueño de la anonimización seria en el ecosistema: los satélites (Escriba,
Fisherboy, Extracta) delegan en él por HTTP a través de ANONIMAL_URL. También corre
de forma independiente — como servicio o como librería embebible.
Detecta PII real
Dos motores: un motor regex integrado para datos estructurados, y un motor opcional ML / NER (OpenAI Privacy Filter) para nombres y direcciones en texto libre.
Cinco modos de reemplazo
typed, anon, pseudo (reversible), mask y hash. Marcadores opacos
como EMAIL_1 o re-hidratación totalmente reversible — tú eliges por solicitud.
Anonimización reversible
El modo pseudo devuelve un mapa token → original. Anonimiza antes del LLM,
re-identifica la respuesta después con /deanonymize.
Corre 100% local
Limitado por CPU, sin conexión, sin salida a la red. Autoalojado vía Docker; la PII original nunca sale de la máquina.
Conserva el formato
Anonimiza txt, md, log, srt, html, CSV (mantiene columnas) y
JSON (mantiene estructura y claves) — además de redacción visual de PDF.
REST API + librería
Una pequeña REST API (/detect, /anonymize, /deanonymize, …) para automatización,
más anonimal_lite como respaldo instalable en Python.
Anonimal es dueño de la anonimización para que el resto de la suite no tenga que serlo. Un satélite
que tiene ANONIMAL_URL definido llama al servicio (motor ML completo); sin él,
recurre a la librería regex incluida anonimal_lite. Un solo lugar para mantener
la lógica de privacidad, compartido por cada producto.