Pular para o conteúdo

A Suíte Escriba

A Suíte Escriba é uma família de ferramentas self-hosted e de código aberto com um só objetivo: transformar qualquer fonte em dados limpos, privados e prontos para modelos. Cada ferramenta é excelente sozinha — mas foram projetadas como um único instrumento.

Escriba é o hub: o tradutor universal que pega um documento e produz Markdown limpo e anonimizado, pronto para qualquer LLM. Ao seu redor orbitam quatro especialistas, cada um o melhor em capturar um tipo de fonte e devolvê-la ao hub.

Escriba — o hub

Documentos, áudio, vídeo e páginas → Markdown limpo, com remoção de PII, OCR, transcrição, exportação para mais de 10 formatos e um modo podcast.

Fisherboy — captura web

Qualquer URL → Markdown ou dados estruturados, com anti-bloqueio em camadas, downloads de arquivos/vídeos/galerias e um spider de seções.

Anonimal — motor de privacidade

A camada de anonimização séria: ML/NER local mais regex, opaca ou reversível. Os satélites se conectam a ela.

Fulgoria — dados de documentos

Extratos bancários, PDFs e imagens → linhas em CSV mais um modelo reutilizável, tudo no navegador.

Selega — controle financeiro

Demonstrações financeiras validadas por 14 verificações cruzadas numéricas em tempo real, propondo o resultado da legalização.

  • Self-hosted. Uma única imagem Docker (ou um pequeno arquivo compose) que você roda no seu próprio hardware. Seus arquivos nunca tocam uma nuvem de terceiros.
  • Código aberto. MIT ou Apache-2.0. Seu para ler, fazer fork e implantar.
  • Privado por design. Nada é armazenado depois que o trabalho termina; o trabalho sensível acontece localmente.
  • Uma aparência, sete idiomas. A mesma interface — English, Español, Français, Português, Italiano, 中文, 日本語 — detectada automaticamente e alternável.

A suíte parece um único produto porque cada app honra dois contratos simples.

Cada app usa a mesma linguagem de design: tema claro por padrão com um modo escuro, a mesma tipografia (Inter Variable + JetBrains Mono), ícones de linha em vez de emojis, e os mesmos componentes — cada app carregando sua própria cor de destaque para que você sempre saiba onde está.

FerramentaDestaquePapel
EscribaCoral #e06a3aO hub
FisherboyOcean teal #0f8f6aCaptura web
AnonimalMask indigo #4a4e7cMotor de privacidade
FulgoriaViolet #6c5cf0Dados de documentos
SelegaBordó #a8324aControle financeiro

Qualquer satélite pode entregar seu resultado ao hub sem uma ida e volta a um servidor. Ele grava o conteúdo capturado no sessionStorage do navegador, sob escriba.handoff, usando um pequeno contrato JSON, e então abre o Escriba — que o lê e cria um item pronto para uso.

{
"from": "fisherboy",
"version": 1,
"title": "Captured page",
"source": "https://example.com/article",
"mime": "text/markdown",
"content": "# Clean markdown…",
"alt": { "csv": "…optional…" },
"ts": 1719000000000
}

O Anonimal é o dono da anonimização séria na suíte — o motor completo de ML/NER + Privacy-Filter. Para continuarem utilizáveis sozinhos, os satélites também trazem um regex mínimo embutido para nunca dependerem de nada ao rodar de forma standalone.

Quando você aponta um satélite para o Anonimal (via uma variável de ambiente ANONIMAL_URL), ele libera todo o poder — nomes incluídos — e falha de forma fechada se o Anonimal estiver indisponível, em vez de silenciosamente regredir para regex. A privacidade nunca se degrada por acidente.

Cada ferramenta roda de forma independente, mas a topologia pretendida para a experiência completa é um domínio atrás de um reverse proxy, de modo que todo app seja de mesma origem. Isso faz o design parecer perfeito e permite que o handoff via sessionStorage funcione em toda a suíte.