超越 Markdown 的导出
干净的 Markdown 是核心,但结果卡片上那个唯一的“格式……”菜单能把它 变成你工作流所需的任何样子 —— 挑一个格式,然后点击下载(它绝不会 自行触发)。由 Pandoc 驱动,不涉及任何 LLM。
| 类别 | 格式 |
|---|---|
| Markdown | .md、紧凑版(剥除空白)、RAG 块(.jsonl) |
| 办公与电子书 | Word .docx、ODT、EPUB |
| 网页与排版 | HTML、LaTeX、reStructuredText |
| 结构化 XML | DocBook、JATS、TEI、OPML |
| 数据 | JSON、YAML、TOON(把文档作为结构化数据) |
| 隐私 | 涂黑版 PDF(PII 已涂黑 —— 参见 脱敏) |
一切都集中在一处。从下拉框中选择一个目标格式,然后按 下载。选择格式本身绝不会触发下载 —— 你始终掌控 文件何时被生成。
数据格式(JSON · YAML · TOON)
Section titled “数据格式(JSON · YAML · TOON)”除了文档之外,Escriba 还能把结果作为结构化数据交给你 —— 标题、 各个章节(按标题切分)以及元数据(字数/字符数统计),外加原始的 Markdown。挑选 JSON、YAML 或 TOON:
- JSON / YAML —— 通用的交换格式,适用于流水线和各类工具。
- TOON(Token-Oriented Object Notation)—— 一种 紧凑、节省 token 的表示法,专为向 LLM 投喂数据而设计:各个章节 会折叠成一个整齐的表格块,因此你花费的 token 比 JSON 更少。
不涉及任何 AI —— 这是对你文档的一次本地转换。
紧凑版 Markdown
Section titled “紧凑版 Markdown”一种剥除了空白的 Markdown 变体,它在不改变内容的前提下 节省 token —— 在粘贴进预算紧张的模型之前很顺手。
这些导出都是纯粹的转换:不涉及任何 AI,也没有任何东西离开你的服务器。