コンテンツにスキップ

Anonimal をインストール

Anonimal はローカル / セルフホストで動作します。データがインフラの外に出る ことはありません。イメージは GitHub Container Registry に公開されており、コンテナ 内でポート 8000 を公開します。

イメージは 2 つあります。カバレッジと重さで選んでください。

イメージタグサイズ検出対象利用シーン
full(ML):latest:<ver>イメージ ~6-7 GB + RAM ~3 GB構造化データ + 氏名 / 住所(OPF)最大カバレッジ;エコシステムの Anonimal を置き換える場合
lite(正規表現):lite:<ver>-lite数十 MB構造化データのみ(email、phone、card、DNI、CUIT、CBU、シークレット)軽量、ML なし;自由形式の氏名は認識しない
  • Docker(唯一の必須要件)。
  • lite: 数十 MB のディスクと最小限の RAM。即座に起動します。
  • full: 常駐モデル用に ~6-7 GB のディスクと ~3 GB の RAM。CPU バウンド です。コンテナにはおよそ 6 GB の RAM を割り当ててください。
Terminal window
# 即座に起動、モデルなし
docker run -d --name anonimal -p 8920:8000 \
ghcr.io/diegoparras/anonimal-svc:lite

ヘルスを確認してから、サンプルを匿名化します。Web UI は同じアドレスで配信されます。

Terminal window
curl -s localhost:8920/health
curl -s localhost:8920/anonymize -H "Content-Type: application/json" \
-d '{"text":"email juan@acme.com, CUIT 20-12345678-6","mode":"pseudo"}'

full イメージでは、モデルがバックグラウンドで読み込まれる間も /health は 即座に返ります。チェックポイントがウォームになると ml.readytrue に切り替わり ます。UI は http://localhost:8920 にあります。

ANONIMAL_ENGINE 変数で検出エンジンを選択します:

  • auto(デフォルト)— 準備ができていれば ML を使用し、そうでなければ lite に フォールバックします。
  • lite — 正規表現のみ(構造化データ + LATAM ID)。常に利用可能です。
  • ml — OpenAI Privacy Filter エンジンを強制します(利用できない場合、たとえば lite イメージでは 503 を返します)。

OPF_DEVICE(full イメージのみ)は ML エンジンを cpucuda の間で切り替えます。

変数デフォルト目的
ANONIMAL_ENGINEautoエンジン選択:auto · lite · ml
ANONIMAL_MODEpseudoAPI / UI のデフォルト置換モード。
ANONIMAL_TOKEN(空)サービストークン。設定すると、すべてのリクエストがこれを含む必要があります(Authorization: Bearer または X-Anonimal-Token)。
ANON_HASH_KEY(プロセスごとにランダム)hash モード用のキー。再起動をまたいで安定した仮名を得るには設定してください。
ANONIMAL_MAX_CHARS500000最大入力長(これを超えると 413 を返します)。
ANONIMAL_MAX_PDF_BYTES26214400(25 MB)黒塗り対象 PDF の最大サイズ。
OPF_DEVICEcpucpu または cuda(full イメージのみ)。
OPF_CHECKPOINT(デフォルト)カスタム OPF チェックポイントへのパス(full イメージのみ)。

ローカル実行向けに設計されています。ネットワークに公開する場合は、 ANONIMAL_TOKEN(すべてのリクエストで必須)を設定し、前段に TLS リバースプロキシ を配置してください。イメージは非 root ユーザーとして動作し、サイズ上限 (ANONIMAL_MAX_CHARS)を強制します。エコシステム内では、Anonimal を公開ドメイン なしで内部ネットワークに置き、Escriba が内部ホスト名で到達できるようにしてください。

完全なドキュメントを読む