Ir al contenido

¿Qué es Escriba?

Escriba es el traductor universal al idioma de la IA. Toma cualquier documento — un PDF, un archivo de Word, una hoja de cálculo, una imagen, una grabación de audio, una página web, un enlace de YouTube — y lo convierte en Markdown limpio y anonimizado, el formato que mejor leen los grandes modelos de lenguaje.

Resuelve, en una sola herramienta autoalojable, los tres dolores de cabeza de alimentar documentos a un LLM:

  • Entrada ruidosa y hambrienta de tokens → Markdown limpio y estructurado.
  • Fuga de datos sensibles → anonimización de PII integrada, con seudonimización reversible.
  • “¿Va a entrar? ¿cuánto va a costar?” → un panel local de preparación para LLM que cuenta tokens, estima el costo con precios en vivo, comprueba el ajuste a la ventana de contexto y fragmenta para RAG.

Corre localmente, en 7 idiomas, y está construido sobre Microsoft MarkItDown.

  • Cualquiera que pegue documentos en ChatGPT, Claude o Gemini y quiera el texto limpio — y las partes privadas eliminadas — antes de que salga de sus manos.
  • Equipos e instituciones que no pueden enviar archivos confidenciales a una nube de terceros y necesitan un conversor que corra en su propio servidor.
  • Desarrolladores que quieren una API REST, acceso por roles y una única imagen de Docker sin piezas móviles.
  • El control se queda en la capa humana. Escriba no envía sus documentos a ningún lado. Corre en su máquina, elimina los archivos justo después de la conversión y deja que usted decida qué llega a un modelo.
  • La anonimización es reversible. Seudonimice → envíe al LLM → vuelva a hidratar la respuesta localmente. El mapa de restauración nunca sale de su navegador.
  • No hace falta IA. Las partes inteligentes — conteo de tokens, OCR, anonimización, estimaciones de costo — corren todas localmente. La IA es estrictamente opcional.