セキュリティ
Escriba は機密ドキュメントを扱うために作られています。指針となる原則は、制御は人間のレイヤーに留まる こと — ファイルはあなたのサーバー上で処理され、LLM に何を渡すかはあなたが決めます。
設計からプライベート
Section titled “設計からプライベート”- 何も保存されません。 アップロードされたファイルは変換後すぐに削除されます。
- サードパーティのクラウドはありません。 変換、OCR、文字起こし、匿名化はすべてあなたのホスト上でローカルに動作します。
- 復元マップはローカルに留まります。 仮名化のトークン→原文マップがブラウザの外に出ることはありません。
デフォルトで堅牢化
Section titled “デフォルトで堅牢化”- フェイルクローズドな匿名化 — 匿名化が要求され、Anonimal サービスに到達できない場合、リクエストはエラーになります。生のテキストがフォールバックとして出力されることは決してありません。
- アンチ SSRF — URL の取得は内部 IP とリダイレクトをブロックします。ローカルファイルおよび
file://へのアクセスは DIOS のみに制限されます。 - XSS サニタイズ — プレビューは DOMPurify でサニタイズされ、厳格な Content-Security-Policy とセキュリティヘッダーが設定されます。
- レート制限とロックアウト — ロールごとのリクエスト制限が、組み込み Redis を介してワーカー間で共有され、加えてログイン失敗を繰り返すとロックアウトされます。
- 非 root コンテナ —
no-new-privilegesを付けた非特権ユーザーとして動作します。 - 安全な正規表現 — ユーザー提供の匿名化ルールは RE2(線形時間)上で実行され、ReDoS に対して耐性があります。
- DoS ガード — アップロードはストリーミングによりサイズ上限が設けられ、ページセレクターは範囲爆弾の展開を防ぐために上限が設けられています。
このコードベースは、厳格な多視点監査とレッドチームによるペネトレーションテストを経ており、見つかったすべての問題は修正・検証済みです。堅牢化のハイライトには、インストールごとにランダムなハッシュキー、サニタイズされた X-Forwarded-For の処理(信頼できるプロキシのみ)、セッションの失効、墨消し時の PDF メタデータの除去、静的アセットへの no-cache ヘッダーなどがあります。