检测真实的 PII
两个引擎:用于结构化数据的内置 regex 引擎,以及用于自由格式姓名和地址的可选 ML / NER 引擎(OpenAI Privacy Filter)。
Anonimal 是你的数据在发送给 LLM 之前所佩戴的面具。 它检测并替换个人身份信息(PII)——姓名、邮箱、电话号码、地址、国民身份证号、卡号、密钥——而且全程在你自己的机器上 100% 完成。模型在你的 CPU 上离线运行;原始数据绝不离开你的基础设施。
Anonimal 是 Escriba Suite 的隐私专家。它是整个生态系统中严肃匿名化的唯一负责者:各卫星应用(Escriba、Fisherboy、Extracta)通过 ANONIMAL_URL 经由 HTTP 委托给它。它也可独立运行——作为服务,或作为可嵌入的库。
检测真实的 PII
两个引擎:用于结构化数据的内置 regex 引擎,以及用于自由格式姓名和地址的可选 ML / NER 引擎(OpenAI Privacy Filter)。
五种替换模式
typed、anon、pseudo(可逆)、mask 和 hash。诸如 EMAIL_1 之类的不透明标记,或完全可逆的重新还原——每次请求由你选择。
可逆匿名化
pseudo 模式返回一个 token → original 映射。在 LLM 之前匿名化,之后用 /deanonymize 对答案重新识别。
100% 本地运行
受 CPU 约束、离线、无网络出口。通过 Docker 自托管;原始 PII 绝不离开机器。
保留格式
对 txt、md、log、srt、html、CSV(保留列)和 JSON(保留结构与键)进行匿名化——外加可视化的 PDF 涂黑。
REST API + 库
一个用于自动化的小型 REST API(/detect、/anonymize、/deanonymize 等),外加可安装的 Python 回退方案 anonimal_lite。
Anonimal 负责匿名化,使套件的其余部分无需操心。设置了 ANONIMAL_URL 的卫星应用会调用服务(完整的 ML 引擎);若未设置,则回退到捆绑的 anonimal_lite regex 库。隐私逻辑只在一处维护,供每个产品共享。