Juste convertir des documents
1 vCPU · 2 Go de RAM · ~5 Go de disque. Un VPS bon marché suffit largement. Aucun service d’anonymisation requis.
Soyons honnêtes d’emblée, pour que vous ne déployiez jamais Escriba en ayant l’impression que « ça ne marche pas » à cause de votre matériel. L’application de base est légère et tourne sur un VPS modeste. Les parties lourdes — l’anonymisation des PII de niveau entreprise et la transcription audio par grands modèles — sont optionnelles et n’exigent davantage que lorsque vous les activez réellement.
La conversion de documents (PDF, Word, Excel, images, OCR pour les scans normaux) est rapide et frugale. Escriba lance un worker par cœur CPU, et chaque worker utilise ~250 Mo de RAM, de sorte qu’il s’adapte à l’hôte que vous lui fournissez.
| Minimum | Recommandé | |
|---|---|---|
| CPU | 1 vCPU | 2 vCPU |
| RAM | 2 Go | 4 Go |
| Disque | ~5 Go (l’image fait ~3 Go) | ~6 Go sur SSD |
| Idéal pour | Usage personnel, documents légers | Une petite équipe, un OCR fluide |
L’anonymisation d’Escriba ne s’exécute pas à l’intérieur de l’application principale. Elle vit dans un service séparé, à usage interne uniquement — Anonimal — que vous montez seulement si vous en avez besoin. C’est une fonctionnalité, pas un compromis : le moteur de confidentialité est isolé, il n’a jamais besoin d’être exposé, et votre convertisseur léger reste léger lorsque vous n’en avez pas besoin.
Il est conçu pour une sécurité institutionnelle sérieuse — le type de contexte où des documents confidentiels ne peuvent tout simplement pas quitter votre infrastructure. Comme il charge un modèle NER complet, il est plus lourd :
| Avec anonymisation (Escriba + Anonimal) | |
|---|---|
| CPU | 2 vCPU min · 4 vCPU recommandés |
| RAM | 6 Go min · 8 Go recommandés (le modèle occupe ~3 Go en mémoire résidente) |
| Disque | ~12 Go (l’image d’Anonimal fait ~7 Go en plus de celle d’Escriba) |
| Idéal pour | Entreprises, organismes publics, quiconque ne peut pas utiliser un cloud tiers |
La transcription (Whisper) et l’OCR s’exécutent sur le CPU dans l’image fournie — aucun
GPU n’est requis, mais les plus gros modèles Whisper sont plus lents et plus gourmands. Choisissez le modèle
adapté à votre matériel avec WHISPER_MODEL :
| Modèle Whisper | RAM supplémentaire (approx.) | Remarques |
|---|---|---|
tiny / base (par défaut) | ~1 Go | Rapide ; convient à une parole claire sur du matériel modeste |
small | ~2 Go | Un bon compromis précision/vitesse |
medium | ~5 Go | Nettement plus lent sur CPU |
large-v3 | ~10 Go | Le plus précis ; nécessite un serveur puissant, lent sur CPU |
Juste convertir des documents
1 vCPU · 2 Go de RAM · ~5 Go de disque. Un VPS bon marché suffit largement. Aucun service d’anonymisation requis.
Ajouter la confidentialité des PII de niveau entreprise
2–4 vCPU · 6–8 Go de RAM · ~12 Go de disque. Montez le module Anonimal pour un caviardage de qualité institutionnelle.
Transcription lourde
4+ vCPU · 8–16 Go de RAM. Pour les grands modèles Whisper et de gros volumes d’audio/vidéo.