Salta ai contenuti

Requisiti di sistema

Siamo sinceri fin da subito, così non farai mai il deploy di Escriba per poi sentire che “non funziona” a causa del tuo hardware. L’app di base è leggera e gira su un VPS modesto. Le parti pesanti — l’anonimizzazione enterprise dei PII e la trascrizione audio con modelli grandi — sono opzionali e chiedono di più solo quando le attivi davvero.

La conversione dei documenti (PDF, Word, Excel, immagini, OCR per le scansioni normali) è rapida e parsimoniosa. Escriba avvia un worker per ogni core della CPU, e ciascun worker usa circa 250 MB di RAM, così si adatta a qualunque host gli fornisci.

MinimoConsigliato
CPU1 vCPU2 vCPU
RAM2 GB4 GB
Disco~5 GB (l’immagine è ~3 GB)~6 GB su SSD
Adatto aUso personale, documenti leggeriUn piccolo team, OCR fluido

Anonimizzazione enterprise dei PII — un modulo opzionale

Sezione intitolata “Anonimizzazione enterprise dei PII — un modulo opzionale”

L’anonimizzazione di Escriba non gira all’interno dell’app principale. Vive in un servizio separato e solo interno — Anonimal — che monti solo se ti serve. È una caratteristica, non un compromesso: il motore di privacy è isolato, non deve mai essere esposto, e il tuo convertitore leggero resta leggero quando non ti serve.

È costruito per una sicurezza seria e istituzionale — il tipo di contesto in cui i documenti riservati semplicemente non possono lasciare la tua infrastruttura. Poiché carica un modello NER completo, è più pesante:

Con anonimizzazione (Escriba + Anonimal)
CPU2 vCPU min · 4 vCPU consigliati
RAM6 GB min · 8 GB consigliati (il modello occupa ~3 GB residenti)
Disco~12 GB (l’immagine di Anonimal è ~7 GB oltre a quella di Escriba)
Adatto aAziende, enti pubblici, chiunque non possa usare un cloud di terze parti

La trascrizione (Whisper) e l’OCR girano sulla CPU nell’immagine inclusa — non c’è alcun requisito di GPU, ma i modelli Whisper più grandi sono più lenti e più affamati. Scegli il modello adatto al tuo hardware con WHISPER_MODEL:

Modello WhisperRAM extra (circa)Note
tiny / base (predefinito)~1 GBVeloce; va bene per voce chiara su hardware modesto
small~2 GBUn buon equilibrio tra accuratezza e velocità
medium~5 GBSensibilmente più lento su CPU
large-v3~10 GBIl più accurato; richiede un server potente, lento su CPU

Convertire solo documenti

1 vCPU · 2 GB di RAM · ~5 GB di disco. Un VPS economico basta e avanza. Nessun servizio di anonimizzazione necessario.

Aggiungere privacy enterprise dei PII

2–4 vCPU · 6–8 GB di RAM · ~12 GB di disco. Monta il modulo Anonimal per una redazione di livello istituzionale.

Trascrizione pesante

4+ vCPU · 8–16 GB di RAM. Per i modelli Whisper grandi e tanto audio/video.