Escriba — o hub
Documentos, áudio, vídeo e páginas → Markdown limpo, com remoção de PII, OCR, transcrição, exportação para mais de 10 formatos e um modo podcast.
A Suíte Escriba é uma família de ferramentas self-hosted e de código aberto com um só objetivo: transformar qualquer fonte em dados limpos, privados e prontos para modelos. Cada ferramenta é excelente sozinha — mas foram projetadas como um único instrumento.
Escriba é o hub: o tradutor universal que pega um documento e produz Markdown limpo e anonimizado, pronto para qualquer LLM. Ao seu redor orbitam quatro especialistas, cada um o melhor em capturar um tipo de fonte e devolvê-la ao hub.
Escriba — o hub
Documentos, áudio, vídeo e páginas → Markdown limpo, com remoção de PII, OCR, transcrição, exportação para mais de 10 formatos e um modo podcast.
Fisherboy — captura web
Qualquer URL → Markdown ou dados estruturados, com anti-bloqueio em camadas, downloads de arquivos/vídeos/galerias e um spider de seções.
Anonimal — motor de privacidade
A camada de anonimização séria: ML/NER local mais regex, opaca ou reversível. Os satélites se conectam a ela.
Fulgoria — dados de documentos
Extratos bancários, PDFs e imagens → linhas em CSV mais um modelo reutilizável, tudo no navegador.
Selega — controle financeiro
Demonstrações financeiras validadas por 14 verificações cruzadas numéricas em tempo real, propondo o resultado da legalização.
A suíte parece um único produto porque cada app honra dois contratos simples.
Cada app usa a mesma linguagem de design: tema claro por padrão com um modo escuro, a mesma tipografia (Inter Variable + JetBrains Mono), ícones de linha em vez de emojis, e os mesmos componentes — cada app carregando sua própria cor de destaque para que você sempre saiba onde está.
| Ferramenta | Destaque | Papel |
|---|---|---|
| Escriba | Coral #e06a3a | O hub |
| Fisherboy | Ocean teal #0f8f6a | Captura web |
| Anonimal | Mask indigo #4a4e7c | Motor de privacidade |
| Fulgoria | Violet #6c5cf0 | Dados de documentos |
| Selega | Bordó #a8324a | Controle financeiro |
Qualquer satélite pode entregar seu resultado ao hub sem uma ida e volta a um servidor. Ele grava o conteúdo capturado no sessionStorage do navegador, sob escriba.handoff, usando um pequeno contrato JSON, e então abre o Escriba — que o lê e cria um item pronto para uso.
{ "from": "fisherboy", "version": 1, "title": "Captured page", "source": "https://example.com/article", "mime": "text/markdown", "content": "# Clean markdown…", "alt": { "csv": "…optional…" }, "ts": 1719000000000}O Anonimal é o dono da anonimização séria na suíte — o motor completo de ML/NER + Privacy-Filter. Para continuarem utilizáveis sozinhos, os satélites também trazem um regex mínimo embutido para nunca dependerem de nada ao rodar de forma standalone.
Quando você aponta um satélite para o Anonimal (via uma variável de ambiente ANONIMAL_URL), ele libera todo o poder — nomes incluídos — e falha de forma fechada se o Anonimal estiver indisponível, em vez de silenciosamente regredir para regex. A privacidade nunca se degrada por acidente.
Cada ferramenta roda de forma independente, mas a topologia pretendida para a experiência completa é um domínio atrás de um reverse proxy, de modo que todo app seja de mesma origem. Isso faz o design parecer perfeito e permite que o handoff via sessionStorage funcione em toda a suíte.