Escriba — ハブ
ドキュメント、音声、動画、ページ → クリーンな Markdown。PII の墨消し、OCR、文字起こし、10 以上の形式へのエクスポート、ポッドキャストモードを備えています。
Escriba スイートは、ひとつの仕事のために作られた、セルフホスト型のオープンソースツール群です。その仕事とは、あらゆるソースをクリーンでプライベートな、モデルにすぐ渡せるデータへと変えること。それぞれのツールは単独でも優れていますが、ひとつの楽器として設計されています。
Escriba はハブです:ドキュメントを受け取り、あらゆる LLM にすぐ渡せるクリーンで匿名化された Markdown を生み出す、普遍的な翻訳機。その周りを 4 つのスペシャリストが周回し、それぞれが 1 種類のソースを取り込むことに最も優れ、それをハブへと返します。
Escriba — ハブ
ドキュメント、音声、動画、ページ → クリーンな Markdown。PII の墨消し、OCR、文字起こし、10 以上の形式へのエクスポート、ポッドキャストモードを備えています。
Fisherboy — Web キャプチャ
あらゆる URL → Markdown または構造化データ。段階的なブロック回避、ファイル / 動画 / ギャラリーのダウンロード、セクションスパイダーを備えています。
Anonimal — プライバシーエンジン
本格的な匿名化層:ローカルの ML/NER と正規表現、不可逆または可逆。サテライトはこれに接続します。
Fulgoria — ドキュメントデータ
銀行明細、PDF、画像 → CSV の行と再利用できるテンプレート、すべてブラウザ内で。
Selega — 財務管理
財務諸表を 14 のリアルタイム数値クロスチェックで検証し、合法化の結果を提案します。
スイートがひとつの製品のように感じられるのは、どのアプリも 2 つのシンプルな取り決めを守っているからです。
どのアプリも同じデザイン言語を使います:デフォルトはライトテーマでダークモードあり、同じタイポグラフィ(Inter Variable + JetBrains Mono)、絵文字ではなくラインアイコン、そして同じコンポーネント — 各アプリが独自のアクセントカラーを持つので、自分がどこにいるか常に分かります。
| ツール | アクセント | 役割 |
|---|---|---|
| Escriba | コーラル #e06a3a | ハブ |
| Fisherboy | オーシャンティール #0f8f6a | Web キャプチャ |
| Anonimal | マスクインディゴ #4a4e7c | プライバシーエンジン |
| Fulgoria | バイオレット #6c5cf0 | ドキュメントデータ |
| Selega | ボルドー #a8324a | 財務管理 |
どのサテライトも、サーバーへの往復なしに結果をハブへ渡せます。キャプチャした内容を、小さな JSON の取り決めに従ってブラウザの sessionStorage の escriba.handoff に書き込み、Escriba を開きます — Escriba はそれを読み取り、すぐに使える項目を作成します。
{ "from": "fisherboy", "version": 1, "title": "Captured page", "source": "https://example.com/article", "mime": "text/markdown", "content": "# Clean markdown…", "alt": { "csv": "…optional…" }, "ts": 1719000000000}Anonimal はスイートにおける本格的な匿名化の担い手です — 完全な ML/NER + プライバシーフィルターエンジン。サテライトは単独でも使えるように、最小限の組み込み正規表現も同梱しており、スタンドアロンで動作するのに何かに依存することは決してありません。
サテライトを(ANONIMAL_URL 環境変数を介して)Anonimal に向けると、氏名を含むフルパワーが解放されます。そして Anonimal が利用できない場合は、こっそり正規表現に格下げするのではなく、フェイルクローズします。プライバシーが偶発的に低下することはありません。
各ツールは独立して動作しますが、フル体験のために想定されているトポロジーは、リバースプロキシの背後にあるひとつのドメインです。これにより、すべてのアプリが同一オリジンになります。デザインがシームレスに感じられ、sessionStorage のハンドオフがスイート全体で機能するようになります。