Ir al contenido

Anonimal

Anonimal es la máscara que tus datos usan antes de que los envíes a un LLM. Detecta y reemplaza información de identificación personal (PII) — nombres, correos, números de teléfono, direcciones, identificadores nacionales, tarjetas, secretos — y lo hace 100% en tu propia máquina. El modelo corre en tu CPU, sin conexión; los datos originales nunca salen de tu infraestructura.

Anonimal es el especialista en privacidad de la Escriba Suite. Es el único dueño de la anonimización seria en el ecosistema: los satélites (Escriba, Fisherboy, Extracta) delegan en él por HTTP a través de ANONIMAL_URL. También corre de forma independiente — como servicio o como librería embebible.

Detecta PII real

Dos motores: un motor regex integrado para datos estructurados, y un motor opcional ML / NER (OpenAI Privacy Filter) para nombres y direcciones en texto libre.

Cinco modos de reemplazo

typed, anon, pseudo (reversible), mask y hash. Marcadores opacos como EMAIL_1 o re-hidratación totalmente reversible — tú eliges por solicitud.

Anonimización reversible

El modo pseudo devuelve un mapa token → original. Anonimiza antes del LLM, re-identifica la respuesta después con /deanonymize.

Corre 100% local

Limitado por CPU, sin conexión, sin salida a la red. Autoalojado vía Docker; la PII original nunca sale de la máquina.

Conserva el formato

Anonimiza txt, md, log, srt, html, CSV (mantiene columnas) y JSON (mantiene estructura y claves) — además de redacción visual de PDF.

REST API + librería

Una pequeña REST API (/detect, /anonymize, /deanonymize, …) para automatización, más anonimal_lite como respaldo instalable en Python.

Anonimal es dueño de la anonimización para que el resto de la suite no tenga que serlo. Un satélite que tiene ANONIMAL_URL definido llama al servicio (motor ML completo); sin él, recurre a la librería regex incluida anonimal_lite. Un solo lugar para mantener la lógica de privacidad, compartido por cada producto.

Instalar Anonimal Ver en GitHub