コンテンツにスキップ

Escriba スイート

Escriba スイートは、ひとつの仕事のために作られた、セルフホスト型のオープンソースツール群です。その仕事とは、あらゆるソースをクリーンでプライベートな、モデルにすぐ渡せるデータへと変えること。それぞれのツールは単独でも優れていますが、ひとつの楽器として設計されています。

Escriba はハブです:ドキュメントを受け取り、あらゆる LLM にすぐ渡せるクリーンで匿名化された Markdown を生み出す、普遍的な翻訳機。その周りを 4 つのスペシャリストが周回し、それぞれが 1 種類のソースを取り込むことに最も優れ、それをハブへと返します。

Escriba — ハブ

ドキュメント、音声、動画、ページ → クリーンな Markdown。PII の墨消し、OCR、文字起こし、10 以上の形式へのエクスポート、ポッドキャストモードを備えています。

Fisherboy — Web キャプチャ

あらゆる URL → Markdown または構造化データ。段階的なブロック回避、ファイル / 動画 / ギャラリーのダウンロード、セクションスパイダーを備えています。

Anonimal — プライバシーエンジン

本格的な匿名化層:ローカルの ML/NER と正規表現、不可逆または可逆。サテライトはこれに接続します。

Fulgoria — ドキュメントデータ

銀行明細、PDF、画像 → CSV の行と再利用できるテンプレート、すべてブラウザ内で。

Selega — 財務管理

財務諸表を 14 のリアルタイム数値クロスチェックで検証し、合法化の結果を提案します。

すべてのツールに共通するもの

Section titled “すべてのツールに共通するもの”
  • セルフホスト。 自分のハードウェアで動かす単一の Docker イメージ(または小さな compose ファイル)。ファイルがサードパーティのクラウドに触れることはありません。
  • オープンソース。 MIT または Apache-2.0。読み、フォークし、デプロイするのはあなたの自由です。
  • 設計段階からプライベート。 処理が終わると何も保存されません。機密性の高い作業はローカルで行われます。
  • ひとつの見た目、7 言語。 同じインターフェース — English、Español、Français、Português、Italiano、中文、日本語 — 自動検出、切り替え可能。

スイートがひとつの製品のように感じられるのは、どのアプリも 2 つのシンプルな取り決めを守っているからです。

どのアプリも同じデザイン言語を使います:デフォルトはライトテーマでダークモードあり、同じタイポグラフィ(Inter Variable + JetBrains Mono)、絵文字ではなくラインアイコン、そして同じコンポーネント — 各アプリが独自のアクセントカラーを持つので、自分がどこにいるか常に分かります。

ツールアクセント役割
Escribaコーラル #e06a3aハブ
Fisherboyオーシャンティール #0f8f6aWeb キャプチャ
Anonimalマスクインディゴ #4a4e7cプライバシーエンジン
Fulgoriaバイオレット #6c5cf0ドキュメントデータ
Selegaボルドー #a8324a財務管理

どのサテライトも、サーバーへの往復なしに結果をハブへ渡せます。キャプチャした内容を、小さな JSON の取り決めに従ってブラウザの sessionStorageescriba.handoff に書き込み、Escriba を開きます — Escriba はそれを読み取り、すぐに使える項目を作成します。

{
"from": "fisherboy",
"version": 1,
"title": "Captured page",
"source": "https://example.com/article",
"mime": "text/markdown",
"content": "# Clean markdown…",
"alt": { "csv": "…optional…" },
"ts": 1719000000000
}

Anonimal はスイートにおける本格的な匿名化の担い手です — 完全な ML/NER + プライバシーフィルターエンジン。サテライトは単独でも使えるように、最小限の組み込み正規表現も同梱しており、スタンドアロンで動作するのに何かに依存することは決してありません。

サテライトを(ANONIMAL_URL 環境変数を介して)Anonimal に向けると、氏名を含むフルパワーが解放されます。そして Anonimal が利用できない場合は、こっそり正規表現に格下げするのではなく、フェイルクローズします。プライバシーが偶発的に低下することはありません。

各ツールは独立して動作しますが、フル体験のために想定されているトポロジーは、リバースプロキシの背後にあるひとつのドメインです。これにより、すべてのアプリが同一オリジンになります。デザインがシームレスに感じられ、sessionStorage のハンドオフがスイート全体で機能するようになります。