Escriba が動作している基盤
Escriba は優れたオープンソースプロジェクトをつなぎ合わせるグルーです。賢く見せることよりも完全な透明性のほうが重要なので、ここでは内部で正確に何が動作しているのか、それぞれの部品が何をするのか、そして Escriba がいつ(そもそも)ネットワークにアクセスするのかを示します。
| 役割 | プロジェクト | ライセンス |
|---|---|---|
| ドキュメント → Markdown のコア変換 | Microsoft MarkItDown | MIT |
| Web フレームワーク / API | FastAPI · Uvicorn | MIT / BSD |
| PDF の解析、ページ選択、真の墨消し | PyMuPDF | AGPL-3.0 / 商用 |
| 高度な PDF レイアウト抽出(オプトイン) | OpenDataLoader PDF | オープンソース |
| 画像とスキャン PDF の OCR | Tesseract + OCRmyPDF | Apache-2.0 / MPL-2.0 |
| 音声と動画の文字起こし | faster-whisper(OpenAI Whisper) | MIT |
| テキスト → 音声(ローカル音声) | Piper | MIT |
| Web ページと YouTube の文字起こし | yt-dlp | Unlicense |
| PII 検出(匿名化エンジン) | OpenAI Privacy Filter | Apache-2.0 |
| 安全なユーザー定義の正規表現ルール | google-re2 | BSD-3 |
| トークン数のカウント | tiktoken | MIT |
| RAG 用のチャンク分割 | semchunk | MIT |
| 10 種類の形式へのエクスポート | Pandoc | GPL-2.0+ |
| モデルごとのリアルタイム価格 | OpenRouter(公開 API) | — |
| レート制限 | 組み込みの Redis | — |
| プレビュー HTML のサニタイズ(あなたのブラウザ内) | DOMPurify | Apache-2.0 / MPL-2.0 |
ライセンス — Escriba は MIT
Section titled “ライセンス — Escriba は MIT”Escriba 自身のソースコードは、最も寛容なライセンスのひとつである MIT ライセンス のもとで公開されています。平たく言えば次のとおりです。
できること
- 商用利用を含め、あらゆる目的で使用できます。
- ソースを改変し、自分のニーズに合わせて適応させられます。
- それを配布したり、改変したバージョンを再配布したりできます。
- 私的に利用したり、自分の製品の中でサブライセンスしたりできます。
しなければならないこと
- ソースのコピーに、元の著作権表示とライセンス本文を保持すること。
対象外のこと
- 「現状のまま」、無保証で提供されます — 作者はその使われ方について責任を負いません。
文字起こしモデル(Whisper)
Section titled “文字起こしモデル(Whisper)”文字起こしには、OpenAI の Whisper の最適化されたランタイムである faster-whisper を使用します。モデルのサイズは WHISPER_MODEL で選択します — tiny、base(デフォルト)、small、medium、または large-v3。大きいモデルほど精度は高くなりますが、CPU では重く、遅くなります。それぞれに必要なものについては システム要件 を参照してください。
匿名化エンジンについて
Section titled “匿名化エンジンについて”PII エンジンは OpenAI Privacy Filter(OPF、Apache-2.0)の上に構築されています。これは名前、組織、場所などを検出する NER モデルです。Escriba はそれを、レイアウトを認識した請求書フィールドの読み取り、検証付きの検出器(クレジットカードの Luhn、IBAN の mod-97)、そして Google の RE2 エンジン(線形時間、ReDoS 耐性)上で動作するあなた自身のルールでラップします。
Escriba はいつインターネットと通信するのか?
Section titled “Escriba はいつインターネットと通信するのか?”設計上、変換、OCR、文字起こし、匿名化はすべてあなたのサーバー上でローカルに実行されます。アップロードされたファイルは変換直後に削除され、何も保存されません。Escriba が外向きのリクエストを行うのは次の場合だけです — いずれもユーザーが開始するか、オプションです。
- URL または YouTube のリンクを変換するとき。 Escriba はそのページ/文字起こしを(yt-dlp 経由で)取得します。当然のことです。
- AI プロバイダーを有効にするとき。 そのときだけ、テキストはあなたが選んだプロバイダー(OpenAI、Gemini、または OpenRouter)に送られます。デフォルトは AI なし で、何も送信されません。
- リアルタイムのモデル価格。 LLM パネルは OpenRouter から価格/コンテキストの一覧を取得します — これは公開カタログであり、リクエストにドキュメントのデータは含まれません。キャッシュされており、オフラインの場合はこの機能は単に何も表示しないだけです。
- 初回起動時のモデルのダウンロード。 Whisper と NER のモデルは一度だけダウンロードされ(またはイメージに事前に焼き込まれ)、その後は完全にオフラインで動作します。
これが完全なリストです。あなたが明示的に Escriba を外部の AI プロバイダーに向けない限り、ドキュメント自体があなたのマシンから出ることは決してありません。