LLM 准备面板
每一次转换都附带一个紧凑的面板,它会把文本准备好交给模型 —— 完全在本地完成,零 AI 调用。
它会显示什么
Section titled “它会显示什么”- token 计数,使用
tiktoken(o200k_base,已烘焙进镜像 —— 可离线工作)。 - 脱敏所节省的 token 和成本,让你看到剥离 PII 究竟带来了什么收益。
- 各模型实时费用估算 —— 定价和上下文窗口取自 OpenRouter(数百个模型,已缓存),因此数字 永远不会过时。
- 上下文窗口适配 —— 一眼看出文档能塞进哪些模型。
- 一键 RAG 分块 —— 切分成有重叠、token 受限的块
(
semchunk),可下载为.jsonl。 - 提示注入检测器 —— 标记出那些试图劫持下游 LLM 的文本。
模拟各模型的成本
Section titled “模拟各模型的成本”面板初始状态是未选中任何模型 —— 挑选你关心的那些, Escriba 就会用实时定价估算把这份确切文档发送给每个模型的成本。 这是在你花一分钱之前,回答”我该用哪个模型,要花多少钱?“的最快方式。
RAG 分块
Section titled “RAG 分块”一键即可把 Markdown 切分成 token 受限、有重叠、适合
检索流水线的块,可下载为 .jsonl。当文档大于
你目标模型的上下文窗口时很有用。
所有这些都在你的服务器上运行。没有 API 密钥,没有外部调用 —— 只有对 你刚转换出的文本所做的本地计算。