コンテンツにスキップ

Anonimal

Anonimal は、データを LLM に送る前にかぶせるマスクです。 個人を特定できる情報 (PII)— 氏名、メール、電話番号、住所、国民 ID、カード、シークレット — を検出 して置換し、それをお客様自身のマシン上で 100% 実行します。モデルはお客様の CPU 上でオフライン動作し、元のデータがインフラの外に出ることはありません。

Anonimal は Escriba Suite のプライバシー専門家です。エコシステムにおける 本格的な匿名化の唯一の担い手であり、サテライト(Escriba、Fisherboy、Extracta)は ANONIMAL_URL を介して HTTP 経由でこれに委任します。サービスとして、あるいは 組み込み可能なライブラリとして、スタンドアロンでも動作します。

本物の PII を検出

2 つのエンジン:構造化データ向けの組み込み正規表現エンジンと、自由形式の 氏名や住所向けのオプションの ML / NER エンジン(OpenAI Privacy Filter)。

5 つの置換モード

typedanonpseudo(可逆)、maskhashEMAIL_1 のような不透明な マーカーから完全に可逆な再構成まで — リクエストごとにお選びいただけます。

可逆な匿名化

pseudo モードは token → original のマップを返します。LLM の前に匿名化し、 後から /deanonymize で回答を再識別します。

100% ローカルで動作

CPU バウンド、オフライン、ネットワーク送出なし。Docker でセルフホスト。元の PII がマシンの外に出ることはありません。

フォーマット保持

txtmdlogsrthtmlCSV(列を維持)、JSON(構造とキーを 維持)を匿名化 — さらに視覚的な PDF 黒塗りも。

REST API + ライブラリ

自動化向けの小さな REST API(/detect/anonymize/deanonymize など)と、 インストール可能な Python フォールバックとしての anonimal_lite

Anonimal が匿名化を担うことで、スイートの他の部分はそれを行う必要がなくなります。 ANONIMAL_URL が設定されたサテライトはサービス(フル ML エンジン)を呼び出し、 設定されていない場合は同梱の anonimal_lite 正規表現ライブラリにフォールバックします。 プライバシーロジックを保守する場所は一箇所で、すべての製品で共有されます。

Anonimal をインストール GitHub で見る