Anonimal をインストール
Anonimal はローカル / セルフホストで動作します。データがインフラの外に出る ことはありません。イメージは GitHub Container Registry に公開されており、コンテナ 内でポート 8000 を公開します。
イメージを選ぶ
Section titled “イメージを選ぶ”イメージは 2 つあります。カバレッジと重さで選んでください。
| イメージ | タグ | サイズ | 検出対象 | 利用シーン |
|---|---|---|---|---|
| full(ML) | :latest、:<ver> | イメージ ~6-7 GB + RAM ~3 GB | 構造化データ + 氏名 / 住所(OPF) | 最大カバレッジ;エコシステムの Anonimal を置き換える場合 |
| lite(正規表現) | :lite、:<ver>-lite | 数十 MB | 構造化データのみ(email、phone、card、DNI、CUIT、CBU、シークレット) | 軽量、ML なし;自由形式の氏名は認識しない |
- Docker(唯一の必須要件)。
- lite: 数十 MB のディスクと最小限の RAM。即座に起動します。
- full: 常駐モデル用に ~6-7 GB のディスクと ~3 GB の RAM。CPU バウンド です。コンテナにはおよそ 6 GB の RAM を割り当ててください。
Docker run
Section titled “Docker run”# 即座に起動、モデルなしdocker run -d --name anonimal -p 8920:8000 \ ghcr.io/diegoparras/anonimal-svc:lite# 初回起動時にモデルを RAM に読み込む — 少し待ってくださいdocker run -d --name anonimal -p 8920:8000 \ ghcr.io/diegoparras/anonimal-svc:latestヘルスを確認してから、サンプルを匿名化します。Web UI は同じアドレスで配信されます。
curl -s localhost:8920/healthcurl -s localhost:8920/anonymize -H "Content-Type: application/json" \ -d '{"text":"email juan@acme.com, CUIT 20-12345678-6","mode":"pseudo"}'full イメージでは、モデルがバックグラウンドで読み込まれる間も /health は
即座に返ります。チェックポイントがウォームになると ml.ready が true に切り替わり
ます。UI は http://localhost:8920 にあります。
設定:正規表現 vs ML エンジン
Section titled “設定:正規表現 vs ML エンジン”ANONIMAL_ENGINE 変数で検出エンジンを選択します:
auto(デフォルト)— 準備ができていれば ML を使用し、そうでなければ lite に フォールバックします。lite— 正規表現のみ(構造化データ + LATAM ID)。常に利用可能です。ml— OpenAI Privacy Filter エンジンを強制します(利用できない場合、たとえば lite イメージでは503を返します)。
OPF_DEVICE(full イメージのみ)は ML エンジンを cpu と cuda の間で切り替えます。
| 変数 | デフォルト | 目的 |
|---|---|---|
ANONIMAL_ENGINE | auto | エンジン選択:auto · lite · ml。 |
ANONIMAL_MODE | pseudo | API / UI のデフォルト置換モード。 |
ANONIMAL_TOKEN | (空) | サービストークン。設定すると、すべてのリクエストがこれを含む必要があります(Authorization: Bearer または X-Anonimal-Token)。 |
ANON_HASH_KEY | (プロセスごとにランダム) | hash モード用のキー。再起動をまたいで安定した仮名を得るには設定してください。 |
ANONIMAL_MAX_CHARS | 500000 | 最大入力長(これを超えると 413 を返します)。 |
ANONIMAL_MAX_PDF_BYTES | 26214400(25 MB) | 黒塗り対象 PDF の最大サイズ。 |
OPF_DEVICE | cpu | cpu または cuda(full イメージのみ)。 |
OPF_CHECKPOINT | (デフォルト) | カスタム OPF チェックポイントへのパス(full イメージのみ)。 |
セキュリティ
Section titled “セキュリティ”ローカル実行向けに設計されています。ネットワークに公開する場合は、
ANONIMAL_TOKEN(すべてのリクエストで必須)を設定し、前段に TLS リバースプロキシ
を配置してください。イメージは非 root ユーザーとして動作し、サイズ上限
(ANONIMAL_MAX_CHARS)を強制します。エコシステム内では、Anonimal を公開ドメイン
なしで内部ネットワークに置き、Escriba が内部ホスト名で到達できるようにしてください。