コンテンツにスキップ

Escriba が動作している基盤

Escriba は優れたオープンソースプロジェクトをつなぎ合わせるグルーです。賢く見せることよりも完全な透明性のほうが重要なので、ここでは内部で正確に何が動作しているのか、それぞれの部品が何をするのか、そして Escriba がいつ(そもそも)ネットワークにアクセスするのかを示します。

役割プロジェクトライセンス
ドキュメント → Markdown のコア変換Microsoft MarkItDownMIT
Web フレームワーク / APIFastAPI · UvicornMIT / BSD
PDF の解析、ページ選択、真の墨消しPyMuPDFAGPL-3.0 / 商用
高度な PDF レイアウト抽出(オプトイン)OpenDataLoader PDFオープンソース
画像とスキャン PDF の OCRTesseract + OCRmyPDFApache-2.0 / MPL-2.0
音声と動画の文字起こしfaster-whisper(OpenAI WhisperMIT
テキスト → 音声(ローカル音声)PiperMIT
Web ページと YouTube の文字起こしyt-dlpUnlicense
PII 検出(匿名化エンジン)OpenAI Privacy FilterApache-2.0
安全なユーザー定義の正規表現ルールgoogle-re2BSD-3
トークン数のカウントtiktokenMIT
RAG 用のチャンク分割semchunkMIT
10 種類の形式へのエクスポートPandocGPL-2.0+
モデルごとのリアルタイム価格OpenRouter(公開 API)
レート制限組み込みの Redis
プレビュー HTML のサニタイズ(あなたのブラウザ内)DOMPurifyApache-2.0 / MPL-2.0

Escriba 自身のソースコードは、最も寛容なライセンスのひとつである MIT ライセンス のもとで公開されています。平たく言えば次のとおりです。

できること

  • 商用利用を含め、あらゆる目的で使用できます。
  • ソースを改変し、自分のニーズに合わせて適応させられます。
  • それを配布したり、改変したバージョンを再配布したりできます。
  • 私的に利用したり、自分の製品の中でサブライセンスしたりできます。

しなければならないこと

  • ソースのコピーに、元の著作権表示とライセンス本文を保持すること。

対象外のこと

  • 「現状のまま」、無保証で提供されます — 作者はその使われ方について責任を負いません。

文字起こしには、OpenAI の Whisper の最適化されたランタイムである faster-whisper を使用します。モデルのサイズは WHISPER_MODEL で選択します — tinybase(デフォルト)、smallmedium、または large-v3。大きいモデルほど精度は高くなりますが、CPU では重く、遅くなります。それぞれに必要なものについては システム要件 を参照してください。

PII エンジンは OpenAI Privacy Filter(OPF、Apache-2.0)の上に構築されています。これは名前、組織、場所などを検出する NER モデルです。Escriba はそれを、レイアウトを認識した請求書フィールドの読み取り、検証付きの検出器(クレジットカードの LuhnIBAN の mod-97)、そして Google の RE2 エンジン(線形時間、ReDoS 耐性)上で動作するあなた自身のルールでラップします。

Escriba はいつインターネットと通信するのか?

Section titled “Escriba はいつインターネットと通信するのか?”

設計上、変換、OCR、文字起こし、匿名化はすべてあなたのサーバー上でローカルに実行されます。アップロードされたファイルは変換直後に削除され、何も保存されません。Escriba が外向きのリクエストを行うのは次の場合だけです — いずれもユーザーが開始するか、オプションです。

  • URL または YouTube のリンクを変換するとき。 Escriba はそのページ/文字起こしを(yt-dlp 経由で)取得します。当然のことです。
  • AI プロバイダーを有効にするとき。 そのときだけ、テキストはあなたが選んだプロバイダー(OpenAI、Gemini、または OpenRouter)に送られます。デフォルトは AI なし で、何も送信されません。
  • リアルタイムのモデル価格。 LLM パネルは OpenRouter から価格/コンテキストの一覧を取得します — これは公開カタログであり、リクエストにドキュメントのデータは含まれません。キャッシュされており、オフラインの場合はこの機能は単に何も表示しないだけです。
  • 初回起動時のモデルのダウンロード。 Whisper と NER のモデルは一度だけダウンロードされ(またはイメージに事前に焼き込まれ)、その後は完全にオフラインで動作します。

これが完全なリストです。あなたが明示的に Escriba を外部の AI プロバイダーに向けない限り、ドキュメント自体があなたのマシンから出ることは決してありません。