Apenas converter documentos
1 vCPU · 2 GB de RAM · ~5 GB de disco. Uma VPS barata é mais que suficiente. Nenhum serviço de anonimização necessário.
Vamos ser honestos desde já, para que você nunca faça o deploy do Escriba e sinta que ele “não funciona” por causa do seu hardware. O aplicativo base é leve e roda em uma VPS modesta. As partes pesadas — anonimização de PII corporativa e transcrição de áudio com modelos grandes — são opcionais e só pedem mais recursos quando você realmente as ativa.
A conversão de documentos (PDF, Word, Excel, imagens, OCR para digitalizações normais) é rápida e econômica. O Escriba cria um worker por núcleo de CPU, e cada worker usa ~250 MB de RAM, então ele se adapta a qualquer host que você lhe der.
| Mínimo | Recomendado | |
|---|---|---|
| CPU | 1 vCPU | 2 vCPU |
| RAM | 2 GB | 4 GB |
| Disco | ~5 GB (a imagem tem ~3 GB) | ~6 GB em SSD |
| Bom para | Uso pessoal, documentos leves | Uma equipe pequena, OCR fluido |
A anonimização do Escriba não roda dentro do aplicativo principal. Ela vive em um serviço separado, exclusivamente interno — o Anonimal — que você monta apenas se precisar dele. Isso é um recurso, não um compromisso: o mecanismo de privacidade fica isolado, nunca precisa ser exposto, e o seu conversor leve continua leve quando você não precisa dele.
Ele foi feito para segurança séria, de nível institucional — o tipo de cenário em que documentos confidenciais simplesmente não podem sair da sua infraestrutura. Como ele carrega um modelo NER completo, é mais pesado:
| Com anonimização (Escriba + Anonimal) | |
|---|---|
| CPU | 2 vCPU mín · 4 vCPU recomendado |
| RAM | 6 GB mín · 8 GB recomendado (o modelo mantém ~3 GB residentes) |
| Disco | ~12 GB (a imagem do Anonimal tem ~7 GB além da do Escriba) |
| Bom para | Empresas, órgãos públicos, qualquer um que não possa usar uma nuvem de terceiros |
A transcrição (Whisper) e o OCR rodam na CPU na imagem incluída — não há requisito de
GPU, mas modelos Whisper maiores são mais lentos e mais famintos. Escolha o modelo
que se encaixa no seu hardware com WHISPER_MODEL:
| Modelo Whisper | RAM extra (aprox.) | Notas |
|---|---|---|
tiny / base (padrão) | ~1 GB | Rápido; bom para fala clara em hardware modesto |
small | ~2 GB | Um bom equilíbrio entre precisão e velocidade |
medium | ~5 GB | Visivelmente mais lento na CPU |
large-v3 | ~10 GB | O mais preciso; precisa de um servidor forte, lento na CPU |
Apenas converter documentos
1 vCPU · 2 GB de RAM · ~5 GB de disco. Uma VPS barata é mais que suficiente. Nenhum serviço de anonimização necessário.
Adicionar privacidade de PII corporativa
2–4 vCPU · 6–8 GB de RAM · ~12 GB de disco. Monte o módulo Anonimal para tarjamento de nível institucional.
Transcrição pesada
4+ vCPU · 8–16 GB de RAM. Para modelos Whisper grandes e muito áudio/vídeo.