Pular para o conteúdo

Anonimal

O Anonimal é a máscara que os seus dados vestem antes de você os enviar a um LLM. Ele detecta e substitui informações de identificação pessoal (PII) — nomes, e-mails, números de telefone, endereços, documentos nacionais, cartões, segredos — e faz isso 100% na sua própria máquina. O modelo roda na sua CPU, offline; os dados originais nunca saem da sua infraestrutura.

O Anonimal é o especialista em privacidade da Escriba Suite. É o único responsável pela anonimização séria no ecossistema: os satélites (Escriba, Fisherboy, Extracta) delegam a ele via HTTP através de ANONIMAL_URL. Também roda de forma autônoma — como serviço ou como biblioteca incorporável.

Detecta PII real

Dois motores: um motor regex integrado para dados estruturados e um motor ML / NER opcional (OpenAI Privacy Filter) para nomes e endereços em texto livre.

Cinco modos de substituição

typed, anon, pseudo (reversível), mask e hash. Marcadores opacos como EMAIL_1 ou re-hidratação totalmente reversível — você escolhe por requisição.

Anonimização reversível

O modo pseudo retorna um mapa token → original. Anonimize antes do LLM, reidentifique a resposta depois com /deanonymize.

Roda 100% local

Limitado por CPU, offline, sem saída de rede. Self-hosted via Docker; a PII original nunca sai da máquina.

Preserva o formato

Anonimiza txt, md, log, srt, html, CSV (mantém colunas) e JSON (mantém estrutura e chaves) — além da redação visual de PDF.

REST API + biblioteca

Uma pequena REST API (/detect, /anonymize, /deanonymize, …) para automação, além de anonimal_lite como fallback Python instalável.

O Anonimal cuida da anonimização para que o resto da suíte não tenha que fazê-lo. Um satélite que tem ANONIMAL_URL configurado chama o serviço (motor ML completo); sem ele, ele recorre à biblioteca regex anonimal_lite que vem incorporada. Um único lugar para manter a lógica de privacidade, compartilhado por todos os produtos.

Instalar o Anonimal Ver no GitHub