Cos’è Escriba?
Escriba è il traduttore universale al linguaggio dell’IA. Prende qualsiasi documento — un PDF, un file Word, un foglio di calcolo, un’immagine, una registrazione audio, una pagina web, un link YouTube — e lo trasforma in Markdown pulito e anonimizzato, il formato che i grandi modelli linguistici leggono meglio.
Risolve, in un unico strumento self-hosted, i tre grattacapi del dare in pasto documenti a un LLM:
- Input rumoroso e affamato di token → Markdown pulito e strutturato.
- Fuga di dati sensibili → anonimizzazione dei PII integrata, con pseudonimizzazione reversibile.
- «Ci starà? quanto costerà?» → un pannello locale di preparazione per LLM che conta i token, stima il costo con prezzi in tempo reale, verifica l’adattamento alla finestra di contesto e suddivide per il RAG.
Gira in locale, in 7 lingue, ed è basato su Microsoft MarkItDown.
Per chi è
Sezione intitolata “Per chi è”- Chiunque incolli documenti in ChatGPT, Claude o Gemini e voglia il testo pulito — e le parti private rimosse — prima che escano dalle proprie mani.
- Team e istituzioni che non possono inviare file riservati a un cloud di terze parti e hanno bisogno di un convertitore che giri sul proprio server.
- Chi sviluppa e vuole un’API REST, accessi per ruoli e un’unica immagine Docker senza parti in movimento.
Cosa lo rende diverso
Sezione intitolata “Cosa lo rende diverso”- Il controllo resta sul livello umano. Escriba non invia i tuoi documenti da nessuna parte. Gira sulla tua macchina, elimina i file subito dopo la conversione e lascia decidere a te cosa arriva a un modello.
- L’anonimizzazione è reversibile. Pseudonimizza → invia all’LLM → re-idrata la risposta in locale. La mappa di ripristino non lascia mai il tuo browser.
- Nessuna IA richiesta. Le parti intelligenti — conteggio dei token, OCR, anonimizzazione, stime di costo — girano tutte in locale. L’IA è strettamente facoltativa.
Prossimi passi
Sezione intitolata “Prossimi passi”- Avvio rapido — mettilo in funzione con un solo comando.
- Convertire documenti — il flusso di lavoro quotidiano.
- Anonimizzazione per LLM — il motore di privacy nel dettaglio.