跳转到内容

为你喂给 AI 的一切,提供同一种语言。

Escriba 套件是一套自托管的开源工具,将任何内容——文档、网页、扫描的对账单、资产负债表——转化为干净、私密、可直接供模型使用的数据。每个工具都可单独使用,也可作为同一件乐器协同运作。
五个工具,一个生态系统

中枢及其卫星

Escriba 是中枢——通向 AI 语言的通用翻译器。围绕它运行的是四个专家工具,每一个都最擅长捕获一种不同类型的来源。每个工具都是自托管的,从设计上注重隐私,且可免费运行。

Escriba
中枢Escriba

通向 AI 语言的通用翻译器。

放入 PDF、Word、Excel、图像、音频、视频或 YouTube 链接,即可获得干净、已匿名化的 Markdown——可供任何 LLM 使用,并可导出为 Word、XML、EPUB 等 10 多种格式。本地 OCR 与 Whisper、PII 脱敏、RAG 分块、token 与成本估算,以及文本转语音的播客模式。

MITDocker7 种语言
打开 Escriba →
Fisherboy
网页捕获Fisherboy

任何网页,皆可供你的 AI 使用。

将任意 URL 转化为干净的 Markdown 或结构化数据。分级抗封锁抓取、文件/视频/图库下载、评论采集,以及可爬取整个版块的蜘蛛。

MITDocker
探索 Fisherboy →
Anonimal
隐私引擎Anonimal

你的数据在抵达 LLM 之前戴上的面具。

通过本地 ML/NER 引擎加正则表达式检测并移除 PII。可选不可逆的脱敏遮蔽或可逆的假名化。这是整个套件可接入的严肃匿名化能力。

Apache-2.0REST API
探索 Anonimal →
Fulgoria
文档数据Fulgoria

从任何文档中提取数据。

只需标记一次列,即可读取银行对账单、PDF 和图像——然后将各行导出为 CSV,并生成可复用的模板。一切都在你的浏览器中运行。

Apache-2.0本地优先
探索 Fulgoria →
Selega
财务管控Selega

每一份资产负债表,皆已就绪可供合法化。

用于财务报表合法化的本地部署助手:14 项实时数值交叉核对验证数字并提出处理结论——合法化、提出异议、出具证明或予以驳回。

Apache-2.0PostgreSQL
探索 Selega →
一个工具,或整件乐器

为独立运作而生——为协同运作而设计

每一个都能独当一面

选择工具,而非平台。

  • 每个应用都是一个独立完整的 Docker 镜像,可在你自己的硬件上运行。
  • 无需账户、无需云端、无供应商锁定。你的文件永不离开你的服务器。
  • 开源——MIT 或 Apache-2.0——可任由你 fork。
  • 同一套界面,支持 English、Español、Français、Português、Italiano、中文和日本語。
了解它们如何组合
合在一起便是同一种体验

一把调好音的小提琴。

  • 同一套共享设计系统:相同的外观,无论浅色或深色,每个应用都有自己的强调色。
  • 发送到 Escriba」交接机制:随处捕获,在中枢转换——文档永不离开你的浏览器。
  • Anonimal 是共享的隐私层,各卫星可接入它以获得完整的 PII 保护。
  • 学会一个,你就已经会用其余的了。
生态系统
5套件中的工具
7界面语言
100%自托管
0发送至云端的数据
OSSMIT & Apache-2.0

从中枢开始

拉取预构建镜像并打开 localhost:8000

docker run -d -p 8000:8000 -e GOD_PASSWORD=“change-me” ghcr.io/diegoparras/escriba:latest