Anonimal をインストール

Anonimal はローカル / セルフホストで動作します。データがインフラの外に出ることはありません。イメージは GitHub Container Registry に公開されており、コンテナ内でポート 8000 を公開します。

イメージを選ぶ

イメージは 2 つあります。カバレッジと重さで選んでください。

イメージ	タグ	サイズ	検出対象	利用シーン
full（ML）	`:latest`、`:<ver>`	イメージ ~6-7 GB + RAM ~3 GB	構造化データ + 氏名 / 住所（OPF）	最大カバレッジ；エコシステムの Anonimal を置き換える場合
lite（正規表現）	`:lite`、`:<ver>-lite`	数十 MB	構造化データのみ（email、phone、card、DNI、CUIT、CBU、シークレット）	軽量、ML なし；自由形式の氏名は認識しない

要件

Docker（唯一の必須要件）。
lite： 数十 MB のディスクと最小限の RAM。即座に起動します。
full： 常駐モデル用に ~6-7 GB のディスクと ~3 GB の RAM。CPU バウンドです。コンテナにはおよそ 6 GB の RAM を割り当ててください。

# 即座に起動、モデルなし
docker run -d --name anonimal -p 8920:8000 \
  ghcr.io/diegoparras/anonimal-svc:lite

# 初回起動時にモデルを RAM に読み込む — 少し待ってください
docker run -d --name anonimal -p 8920:8000 \
  ghcr.io/diegoparras/anonimal-svc:latest

初回起動

ヘルスを確認してから、サンプルを匿名化します。Web UI は同じアドレスで配信されます。

curl -s localhost:8920/health
curl -s localhost:8920/anonymize -H "Content-Type: application/json" \
  -d '{"text":"email juan@acme.com, CUIT 20-12345678-6","mode":"pseudo"}'

full イメージでは、モデルがバックグラウンドで読み込まれる間も /health は即座に返ります。チェックポイントがウォームになると ml.ready が true に切り替わります。UI は http://localhost:8920 にあります。

設定：正規表現 vs ML エンジン

ANONIMAL_ENGINE 変数で検出エンジンを選択します：

auto（デフォルト）— 準備ができていれば ML を使用し、そうでなければ lite にフォールバックします。
lite — 正規表現のみ（構造化データ + LATAM ID）。常に利用可能です。
ml — OpenAI Privacy Filter エンジンを強制します（利用できない場合、たとえば lite イメージでは 503 を返します）。

OPF_DEVICE（full イメージのみ）は ML エンジンを cpu と cuda の間で切り替えます。

環境変数

変数	デフォルト	目的
`ANONIMAL_ENGINE`	`auto`	エンジン選択：`auto` · `lite` · `ml`。
`ANONIMAL_MODE`	`pseudo`	API / UI のデフォルト置換モード。
`ANONIMAL_TOKEN`	（空）	サービストークン。設定すると、すべてのリクエストがこれを含む必要があります（`Authorization: Bearer` または `X-Anonimal-Token`）。
`ANON_HASH_KEY`	（プロセスごとにランダム）	`hash` モード用のキー。再起動をまたいで安定した仮名を得るには設定してください。
`ANONIMAL_MAX_CHARS`	`500000`	最大入力長（これを超えると `413` を返します）。
`ANONIMAL_MAX_PDF_BYTES`	`26214400`（25 MB）	黒塗り対象 PDF の最大サイズ。
`OPF_DEVICE`	`cpu`	`cpu` または `cuda`（full イメージのみ）。
`OPF_CHECKPOINT`	（デフォルト）	カスタム OPF チェックポイントへのパス（full イメージのみ）。

セキュリティ

ローカル実行向けに設計されています。ネットワークに公開する場合は、 ANONIMAL_TOKEN（すべてのリクエストで必須）を設定し、前段に TLS リバースプロキシを配置してください。イメージは非 root ユーザーとして動作し、サイズ上限（ANONIMAL_MAX_CHARS）を強制します。エコシステム内では、Anonimal を公開ドメインなしで内部ネットワークに置き、Escriba が内部ホスト名で到達できるようにしてください。

完全なドキュメントを読む