Painel de preparo para LLM

Cada conversão vem com um painel compacto que deixa o texto pronto para um modelo — inteiramente de forma local, com zero chamadas de IA.

O que ele mostra

Contagem de tokens com tiktoken (o200k_base, embutido na imagem — funciona offline).
Tokens e custo economizados pela anonimização, para você ver o que remover PII lhe rende.
Estimativa de custo por modelo ao vivo — preços e janelas de contexto obtidos do OpenRouter (centenas de modelos, em cache) para que os números nunca fiquem desatualizados.
Ajuste à janela de contexto — num relance, em quais modelos o documento cabe.
Fragmentação para RAG com um clique — divide em fragmentos sobrepostos e limitados por tokens (semchunk), baixáveis como .jsonl.
Detector de injeção de prompt — sinaliza textos que tentam sequestrar uma LLM downstream.

Simule o custo por modelo

O painel começa com nenhum modelo selecionado — escolha os que importam para você e o Escriba estima o custo de enviar este documento exato a cada um, usando preços ao vivo. É a forma mais rápida de responder “qual modelo devo usar, e quanto vai custar?” antes de gastar um centavo.

Fragmentação para RAG

Um clique divide o Markdown em fragmentos sobrepostos e limitados por tokens, adequados para um pipeline de recuperação, baixáveis como .jsonl. Útil quando o documento é maior que a janela de contexto do seu modelo-alvo.

Tudo isso roda no seu servidor. Sem chaves de API, sem chamadas externas — apenas contas locais sobre o texto que você converteu.