¿Qué es Escriba?
Escriba es el traductor universal al idioma de la IA. Toma cualquier documento — un PDF, un archivo de Word, una hoja de cálculo, una imagen, una grabación de audio, una página web, un enlace de YouTube — y lo convierte en Markdown limpio y anonimizado, el formato que mejor leen los grandes modelos de lenguaje.
Resuelve, en una sola herramienta autoalojable, los tres dolores de cabeza de alimentar documentos a un LLM:
- Entrada ruidosa y hambrienta de tokens → Markdown limpio y estructurado.
- Fuga de datos sensibles → anonimización de PII integrada, con seudonimización reversible.
- “¿Va a entrar? ¿cuánto va a costar?” → un panel local de preparación para LLM que cuenta tokens, estima el costo con precios en vivo, comprueba el ajuste a la ventana de contexto y fragmenta para RAG.
Corre localmente, en 7 idiomas, y está construido sobre Microsoft MarkItDown.
Para quién es
Sección titulada «Para quién es»- Cualquiera que pegue documentos en ChatGPT, Claude o Gemini y quiera el texto limpio — y las partes privadas eliminadas — antes de que salga de sus manos.
- Equipos e instituciones que no pueden enviar archivos confidenciales a una nube de terceros y necesitan un conversor que corra en su propio servidor.
- Desarrolladores que quieren una API REST, acceso por roles y una única imagen de Docker sin piezas móviles.
Qué lo hace diferente
Sección titulada «Qué lo hace diferente»- El control se queda en la capa humana. Escriba no envía sus documentos a ningún lado. Corre en su máquina, elimina los archivos justo después de la conversión y deja que usted decida qué llega a un modelo.
- La anonimización es reversible. Seudonimice → envíe al LLM → vuelva a hidratar la respuesta localmente. El mapa de restauración nunca sale de su navegador.
- No hace falta IA. Las partes inteligentes — conteo de tokens, OCR, anonimización, estimaciones de costo — corren todas localmente. La IA es estrictamente opcional.
Próximos pasos
Sección titulada «Próximos pasos»- Inicio rápido — póngalo en marcha con un comando.
- Convertir documentos — el flujo de trabajo del día a día.
- Anonimización para LLM — el motor de privacidad en profundidad.