本物の PII を検出
2 つのエンジン:構造化データ向けの組み込み正規表現エンジンと、自由形式の 氏名や住所向けのオプションの ML / NER エンジン(OpenAI Privacy Filter)。
Anonimal は、データを LLM に送る前にかぶせるマスクです。 個人を特定できる情報 (PII)— 氏名、メール、電話番号、住所、国民 ID、カード、シークレット — を検出 して置換し、それをお客様自身のマシン上で 100% 実行します。モデルはお客様の CPU 上でオフライン動作し、元のデータがインフラの外に出ることはありません。
Anonimal は Escriba Suite のプライバシー専門家です。エコシステムにおける
本格的な匿名化の唯一の担い手であり、サテライト(Escriba、Fisherboy、Extracta)は
ANONIMAL_URL を介して HTTP 経由でこれに委任します。サービスとして、あるいは
組み込み可能なライブラリとして、スタンドアロンでも動作します。
本物の PII を検出
2 つのエンジン:構造化データ向けの組み込み正規表現エンジンと、自由形式の 氏名や住所向けのオプションの ML / NER エンジン(OpenAI Privacy Filter)。
5 つの置換モード
typed、anon、pseudo(可逆)、mask、hash。EMAIL_1 のような不透明な
マーカーから完全に可逆な再構成まで — リクエストごとにお選びいただけます。
可逆な匿名化
pseudo モードは token → original のマップを返します。LLM の前に匿名化し、
後から /deanonymize で回答を再識別します。
100% ローカルで動作
CPU バウンド、オフライン、ネットワーク送出なし。Docker でセルフホスト。元の PII がマシンの外に出ることはありません。
フォーマット保持
txt、md、log、srt、html、CSV(列を維持)、JSON(構造とキーを
維持)を匿名化 — さらに視覚的な PDF 黒塗りも。
REST API + ライブラリ
自動化向けの小さな REST API(/detect、/anonymize、/deanonymize など)と、
インストール可能な Python フォールバックとしての anonimal_lite。
Anonimal が匿名化を担うことで、スイートの他の部分はそれを行う必要がなくなります。
ANONIMAL_URL が設定されたサテライトはサービス(フル ML エンジン)を呼び出し、
設定されていない場合は同梱の anonimal_lite 正規表現ライブラリにフォールバックします。
プライバシーロジックを保守する場所は一箇所で、すべての製品で共有されます。