コンテンツにスキップ

セキュリティ

Escriba は機密ドキュメントを扱うために作られています。指針となる原則は、制御は人間のレイヤーに留まる こと — ファイルはあなたのサーバー上で処理され、LLM に何を渡すかはあなたが決めます。

  • 何も保存されません。 アップロードされたファイルは変換後すぐに削除されます。
  • サードパーティのクラウドはありません。 変換、OCR、文字起こし、匿名化はすべてあなたのホスト上でローカルに動作します。
  • 復元マップはローカルに留まります。 仮名化のトークン→原文マップがブラウザの外に出ることはありません。
  • フェイルクローズドな匿名化 — 匿名化が要求され、Anonimal サービスに到達できない場合、リクエストはエラーになります。生のテキストがフォールバックとして出力されることは決してありません。
  • アンチ SSRF — URL の取得は内部 IP とリダイレクトをブロックします。ローカルファイルおよび file:// へのアクセスは DIOS のみに制限されます。
  • XSS サニタイズ — プレビューは DOMPurify でサニタイズされ、厳格な Content-Security-Policy とセキュリティヘッダーが設定されます。
  • レート制限とロックアウト — ロールごとのリクエスト制限が、組み込み Redis を介してワーカー間で共有され、加えてログイン失敗を繰り返すとロックアウトされます。
  • 非 root コンテナno-new-privileges を付けた非特権ユーザーとして動作します。
  • 安全な正規表現 — ユーザー提供の匿名化ルールは RE2(線形時間)上で実行され、ReDoS に対して耐性があります。
  • DoS ガード — アップロードはストリーミングによりサイズ上限が設けられ、ページセレクターは範囲爆弾の展開を防ぐために上限が設けられています。

このコードベースは、厳格な多視点監査とレッドチームによるペネトレーションテストを経ており、見つかったすべての問題は修正・検証済みです。堅牢化のハイライトには、インストールごとにランダムなハッシュキー、サニタイズされた X-Forwarded-For の処理(信頼できるプロキシのみ)、セッションの失効、墨消し時の PDF メタデータの除去、静的アセットへの no-cache ヘッダーなどがあります。