Painel de preparo para LLM
Cada conversão vem com um painel compacto que deixa o texto pronto para um modelo — inteiramente de forma local, com zero chamadas de IA.
O que ele mostra
Seção intitulada “O que ele mostra”- Contagem de tokens com
tiktoken(o200k_base, embutido na imagem — funciona offline). - Tokens e custo economizados pela anonimização, para você ver o que remover PII lhe rende.
- Estimativa de custo por modelo ao vivo — preços e janelas de contexto obtidos do OpenRouter (centenas de modelos, em cache) para que os números nunca fiquem desatualizados.
- Ajuste à janela de contexto — num relance, em quais modelos o documento cabe.
- Fragmentação para RAG com um clique — divide em fragmentos sobrepostos e limitados por tokens
(
semchunk), baixáveis como.jsonl. - Detector de injeção de prompt — sinaliza textos que tentam sequestrar uma LLM downstream.
Simule o custo por modelo
Seção intitulada “Simule o custo por modelo”O painel começa com nenhum modelo selecionado — escolha os que importam para você e o Escriba estima o custo de enviar este documento exato a cada um, usando preços ao vivo. É a forma mais rápida de responder “qual modelo devo usar, e quanto vai custar?” antes de gastar um centavo.
Fragmentação para RAG
Seção intitulada “Fragmentação para RAG”Um clique divide o Markdown em fragmentos sobrepostos e limitados por tokens, adequados para um
pipeline de recuperação, baixáveis como .jsonl. Útil quando o documento é maior que
a janela de contexto do seu modelo-alvo.
Tudo isso roda no seu servidor. Sem chaves de API, sem chamadas externas — apenas contas locais sobre o texto que você converteu.